Kriterienbereich Normdaten / kontrollierte Vokabulare

Verantwortlich

  • Stefanie Rühle, Francesca Schulze

Grundsätzliches

Überlegungen zu einer On-Top-Systematik für den Kulturbereich

Entwurf: Anforderungen/Empfehlungen zur Verwendung von kontrollierten Vokabularen (7.12.2015)

Kontrollierte Vokabulare dienen dazu die Beschreibung von Kultur- und Wissensobjekten zu vereinheitlichen. Sie ermöglichen den Datennehmern die Metadaten zu den digitalen Sammlungen für verschiedene Anwendungsfälle sinnvoll auszuwerten. Im Kontext von digitalen Sammlungen haben sie vor allem folgende Funktionen:

  • Unterstützung der Suche und Wiederauffindbarkeit der Kultur- und Wissensobjekte (und ihrer digitalen Repräsentationen)
  • Einheitliche Präsentation der Beschreibungen zu den Kultur- und Wissensobjekten (und ihrer digitalen Repräsentationen)
  • Hierarchische Vernetzung der Kultur- und Wissensobjekte (und ihrer digitalen Repräsentationen)
  • Darstellung von Verwandtschaftsbeziehungen zwischen Kultur- und Wissensobjekten auf der horizontalen Ebene
  • Verknüpfung der Kultur- und Wissensobjekten mit Entitäten wie Personen, Orten, Körperschaften, Ereignissen oder Konzeptbegriffen
  • Unterstützung eines strukturierten Abrufs von Datensets durch Datennehmer anhand unterschiedlicher formaler Gruppierungskriterien

In den Kultur- und Wissenseinrichtungen werden unterschiedliche Verfahren für die Erschließung von Kultur- und Wissensobjekten angewandt. Die Auswahl der Vokabulare ist abhängig von der Sparte, dem Fachbereich und der Art der Kultur- und Wissensobjekte sowie dem für die Erschließung zu Grunde liegenden Regelwerk und Erfassungssystem.

Aus formalen Gesichtspunkten können kontrollierte Vokabulare wie folgt gruppiert werden:

  • Einfache Term- bzw. Wertelisten
  • Normdaten für die einheitliche Beschreibung von Personen, Körperschaften, Orten, Ereignissen oder abstrakten Begriffen
  • Strukturierte Vokabulare, in denen Begriffe miteinander in Beziehung gesetzt sind, z.B. Klassifikationen oder Thesauri 

Darüber hinaus werden kontrollierte Vokabulare für die Vereinheitlichung der Struktur von Metadaten innerhalb eines Austauschformats oder Anwendungsprofils verwendet. Dazu zählen vor allem sogenannte Type-Attribute, die die Art eines Elementinhalts genauer spezifizieren.

Das DINI-Zertifikat gibt ausdrücklich die Empfehlung, Vokabulare zu verwenden, die innerhalb einer Sparte und bestenfalls darüberhinaus anerkannt und verbreitet sind. Jedes verwendete Vokabular muss standardkonform aufgebaut und von einer Institution veröffentlicht und gepflegt werden, die die langfristige Nachnutzbarkeit gewährleistet. Darüber hinaus muss das Vokabular zumindest folgende Qualitätskriterien erfüllen: 

  • Begriffe sind eindeutig identifiziert und definiert
  • Synonyme sind möglichst vollständig erfasst
  • Homonyme sind eindeutig geklärt

Um eine möglichst breite Nachnutzbarkeit der Metadaten zu gewährleisten sollen Vokabulare verwendet werden, die im Sinne von Linked Open Data in maschinenlesbarer Form frei zur Verfügung stehen. Für Vokabulare, die dieses Qualitätskriterium nicht erfüllen, wird ein semantisches Mapping zur GND oder zum AAT unter Berücksichtigung der Standards ISO 25964 und SKOS empfohlen.

Darüber hinaus wird empfohlen einschlägige Regelwerke bei der Verwendung von Begriffen aus Vokabularen zu beachten (z.B. RDA, RSWK, CDWACCO). Dies dient im Endeffekt der Wiederauffindbarkeit von Kultur- und Wissensobjekten innerhalb der digitalen Sammlungen. 

Nr. M/EKriteriumQuelle/Herkunft Erläuterung
  Verwendung von kontrollierten Werten in den Metadaten  
  Folgende administrative Angabe zum Metadatensatz erfordert die Verwendung eines kontrollierten Vokabulars: 
 
  • Die strukturelle Ebene der Beschreibung, die auf einem Kultur- und Wissensobjekt basiert und in einem Metadatensatz repräsentiert ist, wird durch einen kontrollierten Wert spezifiziert (->Strukturtyp).
 

Die Angabe des Strukturtyps kann je nach Kultur- und Wissenseinrichtung und der Spezifikation im Anwendungsprofil unterschiedlich granular erfolgen. Anhand des kontrollierten Werts sollte zumindest erkennbar sein, ob es sich um die Beschreibung eines einzelnen Objekts, einer Gruppe von Objekten oder eines Bestandteils eines Objekts handelt. Für die Beschreibung digitalisierter Drucke ist die Anwendung der Werte aus dem DFG-Viewer Strukturdatenset verpflichtend.

  Die Beschreibung der Kultur- und Wissensobjekte erfordert in den folgenden Bereichen die Verwendung kontrollierter Werte:   
 M
  • Die Art des Kultur- und Wissensobjekts wird durch kontrollierte Werte spezifiziert (->Objekttyp).
 

 

 
  • Der Wert für die Spezifizierung des Kultur- und Wissensobjekts muss einem kontrollierten Vokabular entstammen, das den 5-star Open Data Prinzipien von Tim Berners-Lee entspricht.
 

Der Wert muss einem kontrollierten Vokabular entnommen werden, das den 5-Star Open Data Prinzipien von Timm Berners Lee entspricht:

  • Das Vokabular ist unter einer freien Lizenz im Web publiziert
  • Das Vokabular ist strukturiert
  • Das Vokabular ist in einem nicht-proprietären Format publiziert
  • Jeder Begriff im Vokabular ist durch einen URI global eindeutig identifiziert
  • Es existieren Links zu Begriffen aus anderen Vokabularen oder/und zu Quellen

Welches Vokabular zu Grunde gelegt wird, ist je nach Sparte und Spezifikation im Anwendungsprofil unterschiedlich. Für Objekte aus der Kunst- und Kulturdomäne wird bspw. der AAT empfohlen.

 M
  • Ortsangaben werden durch kontrollierte Werte identifiziert
 z. B.: TGN, Geonames, GND
 
  • die Art der Ereignisse im Lebenszyklus einer Ressource wird durch kontrollierte Werte spezifiziert
 z. B.: LIDO-Eventtype  
 
  • die Sprache des Inhalts eines Kultur- und Wissensobjekts wird durch kontrollierte Werte spezifiziert  
 z.B.: ISO 639-2
  Für die Erhöhung der Datenqualität und des Vernetzungsgrades der Kultur- und Wissensobjekte innerhalb von digitalen Sammlungen gelten folgende Empfehlungen für kontrollierte Vokabulare:  
 
  • Die Art der Objekte wird durch einen Gruppierungsterm aus der Objektfacette des Art & Architecture Thesaurus spezifiziert (-> Klassifikation <Art des Objekts>).
 

 

   
 E
  • Themen, die im Rahmen eines Kultur- und Wissensobjekts behandelt werden, werden aus kontrollierten Vokabularen übernommen
 z. B.: GND, Iconclass, CONA 
 E
  • Zeiträume, Epochen, Kulturen, die für die Beschreibung einer Ressource relevant sind, werden aus kontrollierten Vokabularen übernommen
 z. B.: GND, eHRAF 
 E
  • Personen und Institutionen, die in einer Beziehung zu der Ressource stehen (z. B. als Ersteller, Sammler oder Bearbeiter) werden durch Normdaten identifiziert
 z. B.: GND, ULAN, ISIL 
 E
  • Sammlungen werden durch Normdaten identifiziert
 z. B.: ISCI 
  Dokumentation der verwendeten kontrollierten Vokabulare  
 MDie in den Metadaten berücksichtigten kontrollierten Vokabulare und Normdateien werden im Anwendungsprofil genannt  
 MDie in den Metadaten berücksichtigten kontrollierten Vokabulare werden in den Metadatendaten identifiziert  
  
  • Der in den Metadaten verwendete Term wird in den Metadaten durch einen URI eindeutig identifiziert
 

z. B. http://d-nb.info/gnd/131724126

z. B. http://vocab.getty.edu/aat/300041365

  oder  
  
  • Das Vokabular / die Normdatei, zu der ein Term gehört, wird durch einen URI eindeutig identifiziert
 z. B. http://d-nb.info/gnd/
  oder  
  
  • Das Vokabular / die Normdatei, zu der ein Term gehört, wird durch eine Namen identifiziert
 z. B. GND
 MDas Vokabular / die Normdatei, aus der Terme verwendet werden, ist in menschenlesbarer Form im Web frei zugänglich z. B. http://www.getty.edu/research/tools/vocabularies/ 
 M

Jeder Term in dem kontrollierten Vokabular / der Normdatei wird durch einen eindeutigen Identifier identifiziert

 z. B. http://d-nb.info/gnd/131724126, oder 131724126
 

Das Vokabular / die Normdatei, aus der Terme verwendet werden, ist in maschinenlesbarer Form im Web frei zugänglich

 z. B. http://vocab.getty.edu/queries  

 

 

 

  • Keine Stichwörter