Auf dieser Seite sind wichtige Begriffe aus dem Umfeld der Crosskonkordanzarbeit beschrieben. Synonyme Ausdrücke sind nicht im engen Sinne zu verstehen. Sie deuten darauf hin, welche Begriffe im Sprachgebrauch sind / in Publikationen Niederschlag gefunden haben (vgl. auch Literaturliste). 

Ein umfangreiches englisches Glossar aller Begrifflichkeiten zu Crosskonkordanzen zwischen Thesauri findet sich in ISO 25964-2.

Das Glossar wird kontinuierlich ergänzt.

TermSynonymaENGFREErläuterung
Crosskonkordanz

CK (Abkürzung)

Crosswalk

Konkordanz

Korrespondenz zwischen Thesauri

Mapping

Mapping der Thesaurusstrukturen

Semantische Querverbindung

Terminologieübergang

Terminologieüberstieg

Termtransformation

Thesaurus-Crosskonkordanz

Thesaurusföderation

Thesaurusintegration

Thesaurus-Mapping

Thesaurus-Verbindung

Thesauruszusammenführung


(Ontology alignment)

(Ontology matching)

(Relationierung)

(Termtransfer)

cross-concordance (between thesauri)

crosswalk (between controlled vocabularies)

crosswalk-service

heading linking

inter-vocabulary association

inter-vocabulary mapping

linkage between thesauri

mapping of different subject terminologies

terminology mapping

correspondance entre thésauri

mapping

= Bildung von Relationen (Informatik eher: Korrespondenzen) zwischen einem Ausgangsvokabular (Thesaurus A) und einem Zielvokabular (Thesaurus B).

Solche Transformationen werden meist dann Crosskonkordanz genannt, wenn sie intellektuell durch Terminologieexpert*innen erstellt werden. Hingegen wird der Ausdruck Ontology matching vor allem in der Informatik für maschinelle Abgleiche verwendet. Crosswalk findet sich als Ausdruck vor allem im Feld der Metadatenformat-Konkordanzen. Der Prozess der Erstellung und Prüfung ist das Mapping / die Verknüpfung / die Relationierung.

Die Experten (oft aus bestimmten Domänen) vergleichen die verschiedenen Vokabulare und setzen die Terme/Begriffe zueinander in Beziehung. Das kann in einfachen Tabellen geschehen oder mit Hilfe von Matching-Tools, in die man die Thesauri laden kann.

Grundsätzlich können CK intellektuell oder maschinell (computerunterstützt) erstellt werden. Letztere können statistisch sein (durch statistische Verfahren wie Kookurrenz-Analyse automatisch erzeugt) oder durch Analyse / Vergleich von Textkorpora/Dokumentbeständen deduktiv erzeugt. In der Praxis hat sich eine Mischung intellektueller und maschineller Ansätze bewährt.

Nutzen entfalten CK für Suchraumerweiterungen (Rechercheunterstützung) und Fremddatenübernahmen (Indexierungsunterstützung). Sie sind eine intellektuelle Methode zur Heterogenitätsbehandlung.

Die Relationen (mit bestimmten Relationstypen) sind in der Regel gerichtet (von A nach B) und manchmal mit Relevanzbewertungen versehen.

CK können zwischen allen Arten von KOS entstehen (Thesauri, Klassfikationen, Schlagwortlisten).

Die Erstellung größerer CK findet i.d.R. in drittmittelfinanzierten Projekten statt (DFG, BMBF).

Der Austausch von Crosskonkordanzen wird durch Techniken des Semantic Web erleichtert, da die Schlagwörter durch URI referenziert sind und genau genommen nicht die Schlagwörter, sondern die Datensätze per URI aufeinander bezogen werden .

Teil 2 der ISO 25964 ist der Standard für die Erstellung von CK.

Jede CK unterliegt bestimmten Regeln für den Mappingprozess und die Erstellung der Relationen / Vergabe der Relationstypen, vgl. Redaktionshandbuch (Warnung) (LINK)

Je stärker sich die zusammenzuführenden Thesauri in der Verwendung von Präkombination und Präkoordination bzw. Postkoordination unterscheiden, desto umständlicher ist die CK. Die unterschiedliche Granularität (Spezifität) und Struktur stellt ebenfalls eine Herausforderung dar.

Äquivalenzrelation

BF

BF-Relation

EQ

manchmal auch (fälschlich) 1:1-Relation

skos:closematch

skos:exactmatch

Synonymie

Synonym-Relation

UF

Use

Used for

=

=EQ (exact)

=Relation

~EQ (inexact)

equivalence

equivalence mapping

equivalence relationship

equivalent headings


équivalence (entre) 

= Term A meint das gleiche Konzept wie Term B

Beziehung zwischen identischen, synonymen oder quasisynonymen Termen.

Je nach Methode stärker auf den Term / Begriff an sich oder auf die dahinterliegenden Dokumentbestände bezogen.

Auch als 1:n-Äquivalenz möglich, vgl. UND/ODER-Relation.

Unterschieden werden:

  • exakte,
  • inexakte und
  • partielle Äquivalenz.

(Zum praktischen Vorgehen vgl. Redaktionshandbuch(Warnung) LINK)

In CK LCSH-RAMEAU-GND wird nur dieser Relationstyp verwendet.

Annotation

Anmerkung

Bemerkung

Erläuterung

Hinweis

Notiz

owl:annotationproperty

Redaktionelle Bemerkung

Vermerk




annotation

comment

commentary

(scope note)

annotation= Erläuternde Angaben, die in Datenbanken oder Mappingtools zu den Daten gemacht werden können (ähnlich wie in Thesauri selbst zu den Schlagwörtern)
Assoziative Relation

Ähnlichkeitsrelation

Assoziative Relation

RM

RT-Relation

skos:relatedmatch

v

vb

VB-Relation

Verwandschaftsrelation

Verwandte Beziehung

^

associated terms

association for related terms

associative relationship

related term

similitude conceptuelle

= Term A meint ein ähnliches/verwandtes Konzept wie Term B - die Konzepte haben Berührungspunkte, sind aber nicht in hierarchischer Beziehung. Wird meist ausgehend vom Ziel der Rechercheunterstützung gedacht.

Analog zu verwandten Begriffen innerhalb eines Thesaurus. Sie können noch näher spezifiziert werden, sollten jedoch möglichst reziprok sein.

Eine Exaktheitsangabe ist nicht sinnvoll.

Zwischen Ähnlichkeitsrelation und inexakter Äquivalenz kommt es in der Praxis zu Überschneidungen. Je nach Vorgehen im CK-Projekt wurden hier Typen zugeordnet.

Bedeutung

Bedeutungsinhalt

Bedeutungsumfang

Begriffsreichweite

Reichweite des Begriffs



meaning

meaning of terms

semantics

sens

= der durch ein Zeichen, ein Wort oder eine Aussage hervorgerufene Wissenszusammenhang - das, was es zu verstehen gibt.

Es ist nötig, die Bedeutung der Konzepte in ihrem jeweiligen Kontext eingehend zu prüfen, um sie in einer CK korrekt zu verbinden. Eine solche Prüfung lässt sich anhand der Thesaurus-Relationen durchführen, da diese das Konzept definieren. Auch Erläuterungen oder Definitionen können, falls vorhanden, konsultiert werden. Schließlich kann die Verwendung der Schlagwörter aufschlussreich sein.

Begriff

Ausdruck

Terminus

Wort + Konzept


oft fälschlich für: Bezeichnung

oft fälschlich für: Wort

oft: Konzept (durch das englische Wort)

concept

item

(term)

concept

terme



= Gesamtheit wesentlicher Merkmale in einer gedanklichen Einheit; der geistige, abstrakte Gehalt einer Sache. Mit  Begriff wird der Bedeutungsinhalt einer Bezeichnung angesprochen. Ein solcher Begriffsinhalt kann in jeder  Sprache eine unterschiedliche Bezeichnung haben. Begriffe entstehen durch die Abstraktionsleistung menschlichen Denkens. Begriffe selbst können nicht ausgetauscht werden, daher tragen sie Benennungen. Jeder Begriff hat genau eine bevorzugte Benennung (s. Deskriptor) und kann mehrere alternative Benennungen tragen (s. Nicht-Deskriptor).

Begriff überschneidet sich mit Konzept und Term

Je nach Domäne variiert die genaue Defintion von Begriff (Linguistik vs. Philosophie / Determiniert die Sprache unser Denken?).

Benennung

manchmal: Name

appellation

denomination

designation

name

appellation

désignation

nomination


= Bezeichnung eines Gegenstandes durch ein oder mehrere Wörter (Versprachlichung einer Vorstellung, s. dazu Begriff/Konzept)

Bezeichnungmanchmal: Benennung

description

designation

distinguished name

désignation


= Kennzeichnung / Repräsentation eines Begriffs mittels Wörtern (= Benennung) oder Symbolen/Zeichen/Codes.
Deskriptor

Ansetzungsform

Bevorzugte Benennung

Bevorzugter Name

manchmal auch: Schlagwort

PrefLabel

skos:preflabel

Vorzugsbenennung

descriptor

main heading

preferred term

descripteur

mot clef


= die festgelegte (normierte) Hauptbenennung eines Schlagworts. (manchmal auf Schlagwörter verwendet)
Determiniertheit

Determiniertheitsgrad

Grad der Übereinstimmung

(Konfidenz, Konfidenzwert, Konfidenzmaß)

Relevanzbewertung

Relevanzgrad

Relevanzwert

confidence value

relevance rating

facteur de confiance

le score dpertinence

Jede Relation kann zusätzlich nach Relevanz bewertet werden. Wie stark ist die Relation zwischen den Termen A und B? Damit wird eine Aussage über die zu erwartende Relevanz der Treffermengen bei der Suche gemacht. D.h. die Angabe kann für die Anwendung, zB. Metasuche ausgewertet werden.

In den verschiedenen Projekten wurden dazu verschiedene Sichtweisen eingenommen (unbedingt nötig <-> unnütz) - abhängig von den jeweiligen Anwendungsszenarien, aber auch von den Ressourcen bei der Erstellung und der jeweiligen Methodik.

Üblicherweise werden 3-4 Stufen unterschieden:

  • sehr stark, voll exakt
  • hoch/stark
  • mittel
  • gering/niedrig

Verwendet in CK MesH, AGROVOC, TheSoz

Domäne

Disziplin

Fachgebiet

Sachgebiet

Sachgruppe

Wissensgebiet

area of knowledge

discipline

domain

field of knowledge

subject category


domaine de connesaince

domaine scientifique

= abgegrenztes Wissensgebiet, auf dem sich ein Experte auskennt und daher die Terminologie (das Fach-Vokabular kennt.

Vokabulare wie Thesauri werden oft für bestimmte Wissensgebiete entworfen (Fachthesauri) oder von einzelnen Fachspezialisten aufgebaut/ gepflegt.

CK werden oft von Terminologiexperten bestimmter Domänen erstellt, da es essentiell ist, dass die Bedeutung der Terme optimal verstanden wird.

Die Domäne, in der ein Thesaurus verwendet wird, hat einen großen Einfluss auf die Bedeutung von Konzepten.

Fremddatenübernahme mittels CKTermübersetzung

automatic data import

(automatic) data transfer

conversion of index terms

import de données

transfert de données


= Übersetzung eines Terms aus Thesaurus A in den Term des anderen Thesaurus B anhand der Festlegung in der CK, wenn Metadaten von einem Katalog in den anderen übernommen werden.
Heterogenitätsbehandlung

(Ab)Minderung semantischer Verluste

Behandlung semantischer Heterogenität

Heterogenitätsbehandlung auf semantischer Ebene

Homogenisierung (im Information Retrieval)

Vagheitsbehandlung




handling of vagueness between questions/queries and terms

treatment of semantic heterogeneity


= Sachlich heterogen erschlossene Bestände von Dokumenten werden verbunden, z.B. mit Hilfe von Crosskonkordanzen, die eine Recherche über diese Bestände verbessern.

Durch den Einsatz verschiedener Thesauri (oder anderer KOS) entsteht Heterogenität und somit Vagheit im Retrieval. Ggf. auch deshalb, weil die verschiedenen Thesauri unterschiedlich tief strukturiert oder organisiert sind. Ein Nutzer, der seine Anfrage mittels eines ihm bekannten Vokabulars formuliert, findet u.U. in anderen Katalogen/Datenbanken keine Dokumente, da dort die Konzepte nicht vorhanden sind oder Begrifflichkeiten anders lauten.

Hierarchische Relation

BM

BT

Hierarchische Beziehung

NM

NT

OB-Relation

skos:broadmatch

skos:narrowmatch

UB-Relation

<

>

hierarchical (i.e. broader or narrower) relationship

hierarchy

hierarchy relationship

narrower mapping / broader mapping

narrower term / broader term



relation hiérarchiques

= Term A steht in einer Hierchiebeziehung zu Term B

Er ist enger oder weiter, er ist abstrakter oder ein Teil des anderen usw. - analog zu Intra-Thesaurus-Relationen (UB/OB).

Eine Exaktheitsangabe ist nicht sinnvoll.

Diese Relationen können noch spezifiziert werden (vgl. Thesaurusrelationen):

  • generisch (BMG)
  • instanziell (BMI)
  • partitiv (BMP)

Ähnlich wie innerhalb eines Thesaurus ist die Differenzierung der Typen jedoch aufwändig und spielt für die Anwendung der Mappings eine untergeordnete Rolle.

JSKOS

JavaScript Object Notation for Simple Knowledge Organization Systems

JSON-KOS


JSKOSJSKOS

= JSON-basiertes Datenmodell zur Beschreibung von KOS aus dem coli-conc-Projekt, vgl.

https://gbv.github.io/jskos/

Konzeptoft auch: Begriff

concept

idea

unit of thought

concept

idée

= die mentale Repräsentation (Vorstellung) eines Objekts (wie sieht ein Tisch in unserem Kopf aus?)

Eigentlich werden diese in CK verbunden, vor allem bei CK zwischen verschiedenen Sprachen. Bei multilingualen CK ist dies eine große Herausforderung, da man die Begriffe konzeptuailsieren muss, d.h. ihre gemeinsamen Merkmale untersuchen.

Überschneidet sich mit Begriff.

KookurrenzanalyseKookurrenz

Co-occurence

co-occurence mapping

Cooccurence

= Begriff aus der Korpuslinguistik; korpusanalytische Methode.

Kookkurrenz bezeichnet in der Allgemeinen Linguistik das gemeinsame Auftreten zweier lexikalischer Einheiten in einer übergeordneten Einheit, wie in einem Satz oder einem Dokument. Es besteht die Annahme, dass diese zwei Terme voneinander abhängig sind, wenn sie auffällig häufig gemeinsam auftreten.

Im Zusammenhang mit CK ist das Auftreten zweier Terme (aus zwei Vokabularen) gemeint, die das gleiche Thema / gleiche Dok. beschreiben (bei Korpuszusammenstellung) und daher in einer Beziehung stehen müssen.

mehr dazu, z.B. hier: https://www1.ids-mannheim.de/kl/projekte/methoden/ka.html

KOS

Begriffssystem

Knowledge Organisation System

Wissensorganisationssystem


KOSKOS

= Wissenorganisationssystem. Ideelles System voneinander abgrenzbarer Begriffe, die durch Relationen miteinander verbunden sind. Zusammenfassende Bezeichnung für Glossare, Thesauri, Klassifikationen, Termnologien, Texonomien, Ontologie...

Viele KOS zielen darauf ab, begriffliche/thematische Suchen zu unterstützen ("begriffliche Exploration")

Mappingmodell

Strukturmodell für die Verlinkung

Verlinkungsmodell


structural modell for mapping across vocabularies

Im Sinne der ISO-Norm können verschiedene Modelle zur Erstellung einer CK fungieren:

  • "structural unity" - alle zu mappenden Vokabulare haben die gleiche Struktur und die gleichen hierarchichen und assoziativen Relationen (trifft üblicherweise nur bei multilingualen Thesauri zu).
  • "direct-linked"- die gemappten Vokabulare unterscheiden sich in Strukur, Typ (zB Thesaurus und Klassifikation) und Umfang und zwischen allen Konzepten wird Schritt für Schritt eine Relation von einem zum anderen aufgebaut.
  • "hub strucuture" - zwischen mehreren Vokabularen tritt eines als "hub" auf und die anderen ("satellites") werden nicht paarweise verknüpft, sondern immer nur in Richtung zu dem hub. In der strengen Lehre gilt es als unmöglich, die Terme von einem Satellitenvokabular zum anderen direkt u konvertieren. Je nach Qualität des "hub" und Anwendungsfall, kann man ggf. Unschärfen hinnehmen.
  • "selective mapping" - im Gegensatz zu den vorgenannten nicht auf die Erstellungsmethodik bezogen, sondern auf die Frage, ob die Vokabulare vollständig ("comprehensive mapping") oder eben nur in Auswahl /selektiv gemappt wurden, weil ggf. für den Anwednungsfall nur bestimmte Terme interessant sind oder nur bestimmte Ressourcen verfügbar sind
Matchingtool

Mapping-Editor

Mapping-Software

Mapping-Tool

Matching-Tool

matching toolmatching tool

= Anwendungsprogramm, mit dem eine CK erstellt werden kann. In der Regel werden die Vokabulare geladen und dann im Listenvergleich zueinander in Beziehung gesetzt. Meist können nur 1:1-Beziehungen erstellt werden.

Im Projekt coli-conc wurde z.B. mit Cocoda eine Webapplikation zur Mappingerstellung geschaffen.

Metasuche

Crosssearching

Integrierte Suche

Kollektionsübergreifende Suche

Recherche in heterogenen Informationsräumen

Suche in verteilten Datenquellen

Suchraumerweiterung auf andere Datenbanken/Kataloge

federated search

search across heterogeneous databases

méta-recherche

métarecherche

recherche integrée


= Gleichzeitige Suche in verschiedenen Datenbanken/Katalogen, z.B. in Fach-Portalen. Für die Suchanfrage werden die Treffer gebündelt.
Multilinguale CK

Mehrsprachige CK

Multilinguales Mapping


cross-language mapping

= CK zwischen Vokabularen verschiedener Sprachen (Gegensatz: monolingual)

Die Möglichkeit basiert auf der Tatsache, dass die hinter den Begriffen stehenden Konzepte die gleichen sind, nur anders heißen, also anderssprachige Benennungen tragen.

Nicht-Deskriptor

Äquivalenter Deskriptor

Alternative Benennung

skos:altlabel

Synonym-Verweisung

Verweisung

Verweisungsform

non-descriptor

non-preferred term

(entry point)

(entry term)

non-descripteur


= alle anderen möglichen Benennungen eines Schlagworts neben der einen bevorzugten.

(hiermit sind vor allem die äquivalenten Terme gemeint, vgl. Äquivalenzrelation)

Normdatensatz

ND

Normsatz

Schlagwortnormdaten

Schlagwortnormdatensatz

authority recordNotice d'autorité= Datensatz einer Normdatei (Datensatz), in der ein Schlagwort mit allen Relationen, Identifizierenden Merkmalen, Definitionen, Erläuterungen, usw. verankert ist. IdR in bestimmten Datenformaten, wie zB MARC. Eindeutig referenzierbar durch URI. Hier können auch CK veranker sein (zB in MARC 7XX-Feldern).
Nullrelation

0-Relation

0

skosm:NOT

null relation

a term can't be mapped to another

il n'existe pas d'équivalence= es gibt keine Entsprechung eines Konzepts im anderen Vokabular

ODER-Relation

bfo-Relation

1:n-Mapping

1:n-Relation (eine Art von)

EQ|

Kumulative Äquivalenz

Kumulatives Mapping

one-to-many-mapping (eine Art von)

OR

skosm:OR

|

cumulative compound equivalence

cumulative mapping

(one-to-many-mapping)



= zwischen einem Term eines Vokabulars bestehen mehreren Relationen zu verschiedenen Termen des anderen Vokabulars.

Bedingt durch die verschiedenen Strukturen der Thesauri (Granularität, Präkombination/Post-Koordinierung) überschneiden sich die Bedeutungen der Schlagwörter.

Haben negative Auswirkungen auf die Precision in der Anwendung (Metasuche).

Oft werden diese Relationen nicht extra gekennzeichnet (drücken sich durch eigene Datensätze aus).

OntologieOntologyontologyontologie

= formale, maschinenlesbare Beschreibungen von Konzepten und deren Relationen zueinander

(Begriff der Informatik)

Ontology matching

Ontology alignment

Ontology mapping

ontology alignment

ontology matching

alignement d'ontologie

vgl. Crosskonkordanz

= Finden von Korrespondenzen/Beziehungen zwischen Konzepten in Ontologien.

Postkoordination

Postkombination

Post-Koordination

Post-koordiniertes Vokabular


postcoordinationpostcoordination

Bei der Erschließung werden einem Dokument mehrere Schlagwörter zugeordnet. Bei der  Suche müssen mehrere Wörter durch logische Operatoren (UND, ODER, NICHT) miteinander kombiniert werden. So etwa RSWK-Schlagwortfolgen mit GND-Schlagwörtern. D.h. die Zusammenstellung ist im Thesaurus nicht enthalten, sondern wird für das zu indexierende Dokument beim Indexieren erzeugt

Werden die Schlagwörter schon bei ihrer Erstellung/Vergabe systematisch miteinander in Beziehungen gesetzt, spricht man von Präkoordination.

Durch die offene Möglichkeit der Kombination kommt ein postkombinierendes System im Gegensatz zu einem präkombinierenden (beispielsweise einer Klassifikation) mit einer geringeren Anzahl von Schlagwörtern aus (RSWK: Zerlegungskontrolle)

Präkoordination

Präkombination

Prä-Koordination

precoordinationprécoordination

Verknüpfung von Schlagwörtern bei der Erschließung eines Dokuments in Schlagwortketten oder bei der Erstellung in der Indexierungssprache, wie z.B. bei LCSH. D.h. zwei oder mehrere Begriffe bilden eine zusammengesetzte Bezeichnung, die als Deskriptor zugelassen ist.

Gelegentlich wird noch genauer zwischen Präkoordination (syntaktische Indexierung) und Präkombination (einfache UND-Verknüpfung) unterschieden.

Im Gegensatz zur Präkoordination findet bei der Postkoordination  die Verknüpfung von Schlagwörtern erst im Rahmen des Information Retrieval mit der Formulierung einer Suchanfrage statt.

Relationen

Arten von Beziehungen

Beziehungen

Mappingrelationen

Mappingtypen

r

Relationierung

Relationsarten

Relationstypen

Semantische Relation

Semantische Verknüpfung

skos:mappingRelation

Wertausprägung einer Relation (Informatik)

(Termtransfer)

mapping relation

relation

relationship

semantic relation

types of mappings

(mapping)


type de relation

= Beziehung zwischen den Termen des Thesaurus A (Ausgangsterm, Ausgangskonzept, Ausgangsvokabular) zu Termen des Thesaurus B (Zielterm, Zielkonzept, Zielvokabular).

Genau genommen, werden nicht die Terme, sondern die dahinterliegenden Konzepte in Beziehung gesetzt. Dazu werden praktisch die Identifier (als URI) der jeweiligen Schlagwort-Normdatensätze verbunden.

Erstellt werden idR 1:1-Relationen, d.h. 1 Ausgangsterm ist mit 1 Zielterm verbunden.

Aber auch 1:n-Relationen sind denkbar: 1 Ausgangsterm steht mit mehreren Termen des Zielvokabulars in Verbindung (s. UND/ODER-Relation). Für diese ist besonders wichtig, dass ihre Auswirkungen auf Recall und Retrieval anhand der Dokumentenbestände geprüft werden, um die Ziele der Suchraumerweiterung usw. optimal zu unterstützen.

Zur Spezifikation werden folgende Relationstypen üblicherweise verwendet:

  • Äquivalenzrelation
  • Hierarchische Relation (Oberbegriffs- /Unterbegriffs-Relation)
  • Assoziative Relation
  • Null-Relation

In der Regel sind die CK gerichtet, d.h. die Relation wird ausgehend von einem Vokabular aufs andere betrachtet. Für die jeweiligen Anwendungsszenarien spielt das u.U. keine Rolle und die Relationen können/sollen reziprok sein. Jedoch kann sich der Relationstyp bei Umkehrung anders darstellen, insbesondere natürlich bei hierarchischen und Ähnlichkeitsrelationen. In den verschiedenen Projekten wurden hier verschiedene Sichtweisen eingenommen. Exakt äquivalente Mappingrelationen können ohne weitere Prüfung für das umgekehrte Mapping eingetragen werden. Bei den übrigen Mappingtypen können die identifizierten Relationen zwar für die Gegenrichtung vorgeschlagen werden, sollten aber auf ihre Korrektheit geprüft und gegebenenfalls korrigiert werden.

Mit SKOS können verschiedene Relationstypen ausgedrückt werden. Die möglichen Relationen sind auch in ISO 25964-2 beschrieben und können in MARC/Pica 7XX über $4-Relationencodes/Beziehungskennzeichen ausgedrückt werden.

Schlagwort

manchmal auch: Deskriptor

SW

authority heading

heading

subject heading

term from a subject heading scheme/list/language

vedette-matière

(mot)

= Bezeichnungen, die zur inhaltlichen Beschreibung eines Dokuments ausgewählt werden können.

Die Vergabe wird auch als VerschlagwortungBeschlagwortung oder Indexierung bezeichnet.

Im Gegensatz zu Stichwörtern (= Wörtern, die in einem Text vorkommen) entstammen Schlagwörter meist einem kontrollierten Vokabular (Thesaurus), in dem festgelegt ist, welche Wörter für welche Sachverhalte verwendet werden sollen. Oft auch als Deskriptoren bezeichnet. (Deskriptoren aus künstlichen Dokumentationssprachen sind Notationen).

Manchmal meint Schlagwort nur die eigentliche Bezeichnung, manchmal auch den ganzen Schlagwort-Normdatensatz

SKOSSimple Knowledge Organisation SystemSKOSSKOS

= Standard des W3C für webbasierte kontrollierte Vokabulare; Datenmodell, um diese interoperabel (maschinenlesbar) zu machen. Entwickelt 2009. Basiert auf RDF.

SKOS dient damit selbst der Homogenisierung verschiedener Thesauri; es verstärkt die konzept-zentrierte Sicht auf die Thesauri.

Enthält in Abschnitt 10 eigens standardisierte Relationstypen: https://www.w3.org/TR/skos-reference/#mapping (vgl. auch https://www.w3.org/2006/07/SWD/wiki/SkosDesign/ConceptualMapping.html)

Für mehr Informationen s.: https://doi.org/10.1016/j.websem.2013.05.001 oder http://www.ala.org/alcts/resources/z687/skos oder https://campus.dariah.eu/resource/controlled-vocabularies-and-skos

Nicht immer lassen sich alle Thesaurus-Bestandteile sauber in SKOS abbilden (vgl. etwa Diskussion unter https://github.com/HHS/meshrdf/issues/12).

Suchraumerweiterung

semantisch angereicherte Suche

Termerweiterung

adding terms to a query

conversion of search terms

query expansion

vocabulary expansion

espace de recherche...

= Verfahren zur Erweiterung der Suchanfragen, z.B. durch Vorschläge zusätzlicher Suchbegriffe oder durch automatische Verwendung zusätzlicher Suchterme. Manchmal schließt dieser Begriff auch Metasuchen ein. Die Suchanfrage ist also nur einmal nötig, d.h. der Infromationsuchende muss seine Anfrage weniger umformulieren oder nicht in mehreren Datenbanken suchen.

Relevanzmessungen im IR (TREC/CLEF) belegen den Nutzen von CK.

Term

Suchwort

manchmal: Lemma

manchmal: Wort



phrase

search term

term

mot

= natürlichsprachige Bezeichnung; die eigentliche Zeichenkette

Oft steht ein einfaches "stringmatching" - ein (automatischer) Abgleich der Zeichenketten der beiden Vokabulare am Anfang einer CK

UND-Relation

AND-Kombi

AND-Relation

bfa-Relation

1:1+1-Relation

1:n-Relation (eine Art von)

EQ+

Kombinierte Äquivalenz

one-to-many-mapping (eine Art von)

skos→ext:prefTermComponent als property der Klasse ext:compoundEquivalence

skosm:AND

UND-Kombination

UND-Mapping

use combination

USE-Verweis

+

composition mapping

compound equivalence

compound mapping

intersectin compound equivalence

relationship between terms or mapping between concepts in which one term is represented by two or more in the other vocabulary


= Eine Relation zwischen einem Term eines Vokabulars kann nur durch die Kombination mehrerer Terme des anderen Vokabulars optimal hergestellt werden. Bedingt durch die verschiedenen Strukturen der Thesauri (zugelassene Präkombination/Post-Koordinierung, Granularität).

Eine solche Relation wird idR durch zusätzliche Symbole an den Relationstypen einer CK angegeben.

Üblicherweise nur für Äquivalenz-Relationen gedacht. Sie gelten meist als inexakte Äquivalenz-Relation.

Sie können nicht umgekehrt werden, d.h. wird die Richtung zwischen Ausgangs- und Zielvokabular verändert, muss eine ganz andere Relation aufgebaut werden. Für die Gegenrichtung sind meist hierarchische Relationen anzulegen.

UND-Mappings haben negative Auswirkungen auf Recall und Precision in der Anwendung (Metasuche) oder können u.U. (wegen der Richtung) gar nicht ausgewertet/verarbeitet werden.

Verknüpfungsrichtung

Direktionalität


link direction

relationship direction


direction de la relation

= Richtung, in der das Mapping stattfindet, d.h. in der eine Relation gelesen wird - von einem Ausgangsvokabular zu einem Zielvokabular.

Kann eine CK in beide Richtungen genutzt werden und wurden die Mappings von beiden Vokabularen aus betrachtet, spricht man von bidirektionalen Mappings.

Günstigerweise sollten die CK reziprok (in umgekehrter Verknüpfungsrichtung) funktionieren.

VIAF

VIAF-Projekt

Virtual authority file


VIAFVIAF

= OCLC-Normdatendienst, der mehrere Normdateien kombiniert. Eine Art CK für Individualnamen. Beispiel eines automatisch erstellten Mappings.

http://viaf.org/

https://www.oclc.org/de/viaf.html

Der Dienst bietet Bibliotheken und Bibliotheksbenutzern einen bequemen Zugang zu den wichtigsten Normdaten der Welt. VIAF-Mitwirkende liefern regelmäßig Normdaten, die VIAF abgleicht, verlinkt und gruppiert. Alle Beschreibungen für eine bestimmte Entität werden zu einem Cluster zusammengeführt, der die verschiedenen Namen für diese Entität zusammenfasst. Dieser Dienst ermöglicht es Forschern, Namen, Orte, Werke und Ausdrücke zu identifizieren und dabei die regionalen Präferenzen für Sprache, Rechtschreibung und Schrift beizubehalten.

Vokabular

Dokumentationsprache

Erschließungsvokabular

Indexierungssprache

(Begriffssystem)

indexing language

vocabulary

vocabulaire

Thesauri, Klassifikationen, Taxonomien, Schlagwortlisten u.a. KOS, die zum Erschließen von Dokumenten verwendet werden und damit die Recherche von Dokumenten ermöglichen/erleichtern.

vgl. auch Ontologie

  • Keine Stichwörter