Kriterienbereich Normdaten / kontrollierte Vokabulare
...
Überlegungen zu einer On-Top-Systematik für den Kulturbereich
Entwurf: Anforderungen/Empfehlungen zur Verwendung von kontrollierten Vokabularen (
...
7.
...
12.2015)
Kontrollierte Vokabulare dienen dazu die Beschreibung von digitalen Ressourcen zu die Beschreibung von Kultur- und Wissensobjekten zu vereinheitlichen. Sie ermöglichen den Datennehmern die Metadaten zu den digitalen Sammlungen für verschiedene Anwendungsfälle sinnvoll auszuwerten. Im Kontext von Suchportalen und anderen digitalen Angeboten Sammlungen haben sie vor allem folgende Funktionen:
- Unterstützung der Suche und Wiederauffindbarkeit der digitalen RessourcenKultur- und Wissensobjekte (und ihrer digitalen Repräsentationen)
- Einheitliche Präsentation der Beschreibungen zu den digitalen Ressourcen
- Logische Vernetzung der digitalen Ressourcen untereinander und bestandsübergreifende Vernetzung
- Verknüpfung der Ressourcen mit anderen Entitäten, wie Personen, Orte, Körperschaften und Ereignisse
Darüber hinaus strukturieren sie die Metadatenbeschreibungen eines Metadatenstandards und unterstützen dadurch:
- zu den Kultur- und Wissensobjekten (und ihrer digitalen Repräsentationen)
- Hierarchische Vernetzung der Kultur- und Wissensobjekte (und ihrer digitalen Repräsentationen)
- Darstellung von Verwandtschaftsbeziehungen zwischen Kultur- und Wissensobjekten auf der horizontalen Ebene
- Verknüpfung der Kultur- und Wissensobjekten mit Entitäten wie Personen, Orten, Körperschaften, Ereignissen oder Konzeptbegriffen
- Unterstützung eines strukturierten Abrufs von Datensets durch Datennehmer anhand unterschiedlicher formaler Gruppierungskriterien
- die Auswertung der Metadaten, beispielsweise durch die Typisierung von Inhalten der Metadatenelemente und -Attribute
- den strukturierten Abruf einzelner Datensets aus verschiedenen Repositorien
In den Kultur- und Wissenseinrichtungen werden unterschiedliche Verfahren für die Erschließung von Ressourcen Erschließung von Kultur- und Wissensobjekten angewandt. Die Auswahl der verwendeten Vokabulare der Vokabulare ist daher abhängig von der Sparte, dem Fachbereich und der Materialart sowie der Art der Kultur- und Wissensobjekte sowie dem für die Erschließung zu Grunde liegenden Regelwerk und Erfassungssystem.
Aus formalen Gesichtspunkten können kontrollierte Vokabulare wie folgt gruppiert werden:
- Einfache Term- bzw. Wertelisten
- Normdaten für die einheitliche Beschreibung von Personen, Körperschaften, Orten, Ereignissen oder abstrakten Begriffen
- Strukturierte Vokabulare, in denen Begriffe miteinander in Beziehung gesetzt sind, z.B. Klassifikationen oder Thesauri
Darüber hinaus werden kontrollierte Vokabulare für die Vereinheitlichung der Struktur von Metadaten innerhalb eines Austauschformats oder Anwendungsprofils verwendet. Dazu zählen vor allem sogenannte Type-Attribute, die die Art eines Elementinhalts genauer spezifizieren.
Das DINI-Zertifikat gibt daher ausdrücklich gibt ausdrücklich die Empfehlung, Vokabulare zu verwenden, die innerhalb einer Sparte oder/und darüberhinaus Sparte und bestenfalls darüberhinaus anerkannt und verbreitet sind. Jedes verwendete Vokabular muss standardkonform aufgebaut und von einer Institution veröffentlicht und gepflegt werden, die die langfristige Nachnutzbarkeit gewährleistet. Darüber hinaus muss das Vokabular zumindest folgende Qualitätskriterien erfüllen:
- Begriffe sind eindeutig identifiziert und definiert
- Synonyme sind möglichst vollständig erfasst
- Homonyme sind eindeutig geklärt
Dabei eignen sich je nach Beschreibungsmerkmalen und beabsichtigtem Verwendungszweck unterschiedliche Arten von Vokabularen:
- Einfache Term- bzw. Wertelisten
- Normdaten für die einheitliche Beschreibung von Personen, Körperschaften, Orten, Ereignissen oder abstrakten Begriffen
- Strukturierte Vokabulare, in denen Begriffe miteinander in Beziehung gesetzt sind, z.B. Hierarchiebeziehungen in Klassifikationen oder Hierarchie- und Verwandtschaftsbeziehungen in Thesauri
Es wird dringend empfohlen Regeln für die Anwendung von Vokabularen zur Indexierung der Metadaten zu beachten, besonders im Hinblick auf den Nutzen für die Suche und Wiederauffindbarkeit der Ressourcen. Dabei müssen Regelwerke, wie RDA, RSWK, CDWA oder CCO unbedingt beachtet werden. Beispielsweise wird durch eine Klassifizierung eine Beziehung zwischen Ressourcen mit ähnlichen Merkmalen hergestellt (siehe CDWA). Der für die Klasse ausgewählte Wert dient i.d.R. als Einstiegsterm für die Suche. Von daher sollte er generisch und gewöhnlich allgemeiner sein als der Wert, der den Objekttyp spezifiziert.
Um eine möglichst breite Nachnutzbarkeit der Metadaten zu gewährleisten sollten gewährleisten sollen Vokabulare verwendet werden, die im Sinne von Linked Open Data in maschinenlesbarer Form frei zur Verfügung stehen. Für Für Vokabulare, die dieses Qualitätskriterium nicht erfüllen, wird ein semantisches Mapping zur GND oder zum AAT unter Berücksichtigung der Standards ISO 25964 und SKOS empfohlen.
[Anmerkung FS: Standards für Aufbau und Anwendung von Vokabularen noch im Text verankern / auswählen:
ISO 25964: The international standard for thesauri and interoperability with other vocabularies
ANSI/NISO Z39.19-2005: Guidelines for Construction, Format, and Management of Monolingual Controlled Vocabularies
ISO 2788:1986 Documentation -- Guidelines for the establishment and development of monolingual thesauri
DIN 1463 Teil 1 (1987): ''Erstellung und Weiterentwicklung von Thesauri. Einsprachige Thesauri''
DIN 1463 Teil 2 (1993): ''Erstellung und Weiterentwicklung von Thesauri. Mehrsprachige Thesauri''
DIN 2330 (1993): ''Begriffe und Benennungen. Allgemeine Grundlagen''
DIN 2331: ''Begriffssysteme und ihre Darstellung''
DIN 31 623 Teil 1 (1988): ''Indexierung zur inhaltlichen Erschließung von Dokumenten: Begriffe, Grundlagen''
DIN 31 623 Teil 2 (1988): ''Indexierung zur inhaltlichen Erschließung von Dokumenten''
DIN 31 623 Teil 2 (1988): ''Syntaktische Indexierung mit Deskriptoren''
DIN 32705 (1987): ''Klassifikationssysteme. Erstellung und Entwicklung von Klassifikationssystemen"]
Darüber hinaus wird empfohlen einschlägige Regelwerke bei der Verwendung von Begriffen aus Vokabularen zu beachten (z.B. RDA, RSWK, CDWA, CCO). Dies dient im Endeffekt der Wiederauffindbarkeit von Kultur- und Wissensobjekten innerhalb der digitalen Sammlungen.
Nr. | M/E | Kriterium | Quelle/Herkunft | Erläuterung | |
---|---|---|---|---|---|
Verwendung von kontollierten kontrollierten Werten in den Metadaten | |||||
Folgende administrative Angabe zum Metadatensatz erfordert die Verwendung eines kontrollierten Vokabulars: | |||||
M |
| Die Angabe des Strukturtyps kann je nach Kultur- und Wissenseinrichtung und der Spezifikation im Anwendungsprofil unterschiedlich granular erfolgen. Anhand des kontrollierten Werts sollte zumindest erkennbar sein, ob es sich um die Beschreibung eines einzelnen Objekts, einer Gruppe von Objekten oder eines Bestandteils eines Objekts handelt. Für die Beschreibung digitalisierter Drucke ist die Anwendung der Werte aus dem DFG-Viewer Strukturdatenset verpflichtend. | |||
Die Beschreibung der Kultur- und Wissensobjekte erfordert in den folgenden Bereichen die Verwendung kontrollierter Werte: | |||||
M |
|
| |||
M |
| Der Wert muss einem kontrollierten Vokabular entnommen werden | . , das den 5-Star Open Data Prinzipien von Timm Berners Lee entspricht:
Welches Vokabular zu Grunde gelegt wird, ist je nach Sparte und Spezifikation im Anwendungsprofil unterschiedlich. Für Objekte aus der Kunst- und Kulturdomäne wird bspw. der AAT empfohlen. | ||
M |
| z. B.: TGN, Geonames, GND | |||
M |
| z. B.: LIDO-Eventtype | |||
M |
| z.B.: ISO 639-2 | |||
Für die Erhöhung der Metadatenqualität Datenqualität und des Vernetzungsgrades der Kultur- und Wissensobjekte innerhalb von digitalen Sammlungen gelten folgende Empfehlungen für kontrollierte Vokabulare: | |||||
E |
|
| |||
E |
| ||||
E |
| z. B.: GND, Iconclass, CONA | |||
E |
| z. B.: GND, eHRAF | |||
E |
| z. B.: GND, ULAN, ISIL | |||
E |
| z. B.: ISCI | |||
Dokumentation der verwendeten kontrollierten Vokabulare | |||||
M | Die in den Metadaten berücksichtigten kontrollierten Vokabulare und Normdateien werden im Anwendungsprofil genannt | ||||
M | Die in den Metadaten berücksichtigten kontrollierten Vokabulare werden in den Metadatendaten identifiziert | ||||
| |||||
oder | |||||
| z. B. http://d-nb.info/gnd/ | ||||
oder | |||||
| z. B. GND | ||||
M | Das Vokabular / die Normdatei, aus der Terme verwendet werden, ist in menschenlesbarer Form im Web frei zugänglich | z. B. http://www.getty.edu/research/tools/vocabularies/ | |||
M | Jeder Term in dem kontrollierten Vokabular / der Normdatei wird durch einen eindeutigen Identifier identifiziert | z. B. http://d-nb.info/gnd/131724126, oder 131724126 | |||
E | Das Vokabular / die Normdatei, aus der Terme verwendet werden, ist in maschinenlesbarer Form im Web frei zugänglich | z. B. http://vocab.getty.edu/queries |
...