Kriterienbereich Normdaten / kontrollierte Vokabulare

Verantwortlich

Grundsätzliches

Überlegungen zu einer On-Top-Systematik für den Kulturbereich

Entwurf: Anforderungen/Empfehlungen zur Verwendung von kontrollierten Vokabularen (7.12.2015)

Kontrollierte Vokabulare dienen dazu die Beschreibung von Kultur- und Wissensobjekten zu vereinheitlichen. Sie ermöglichen den Datennehmern die Metadaten zu den digitalen Sammlungen für verschiedene Anwendungsfälle sinnvoll auszuwerten. Im Kontext von digitalen Sammlungen haben sie vor allem folgende Funktionen:

In den Kultur- und Wissenseinrichtungen werden unterschiedliche Verfahren für die Erschließung von Kultur- und Wissensobjekten angewandt. Die Auswahl der Vokabulare ist abhängig von der Sparte, dem Fachbereich und der Art der Kultur- und Wissensobjekte sowie dem für die Erschließung zu Grunde liegenden Regelwerk und Erfassungssystem.

Aus formalen Gesichtspunkten können kontrollierte Vokabulare wie folgt gruppiert werden:

Darüber hinaus werden kontrollierte Vokabulare für die Vereinheitlichung der Struktur von Metadaten innerhalb eines Austauschformats oder Anwendungsprofils verwendet. Dazu zählen vor allem sogenannte Type-Attribute, die die Art eines Elementinhalts genauer spezifizieren.

Das DINI-Zertifikat gibt ausdrücklich die Empfehlung, Vokabulare zu verwenden, die innerhalb einer Sparte und bestenfalls darüberhinaus anerkannt und verbreitet sind. Jedes verwendete Vokabular muss standardkonform aufgebaut und von einer Institution veröffentlicht und gepflegt werden, die die langfristige Nachnutzbarkeit gewährleistet. Darüber hinaus muss das Vokabular zumindest folgende Qualitätskriterien erfüllen: 

Um eine möglichst breite Nachnutzbarkeit der Metadaten zu gewährleisten sollen Vokabulare verwendet werden, die im Sinne von Linked Open Data in maschinenlesbarer Form frei zur Verfügung stehen. Für Vokabulare, die dieses Qualitätskriterium nicht erfüllen, wird ein semantisches Mapping zur GND oder zum AAT unter Berücksichtigung der Standards ISO 25964 und SKOS empfohlen.

Darüber hinaus wird empfohlen einschlägige Regelwerke bei der Verwendung von Begriffen aus Vokabularen zu beachten (z.B. RDA, RSWK, CDWACCO). Dies dient im Endeffekt der Wiederauffindbarkeit von Kultur- und Wissensobjekten innerhalb der digitalen Sammlungen. 

Nr. M/EKriteriumQuelle/Herkunft Erläuterung
  Verwendung von kontrollierten Werten in den Metadaten  
  Folgende administrative Angabe zum Metadatensatz erfordert die Verwendung eines kontrollierten Vokabulars: 
 
  • Die strukturelle Ebene der Beschreibung, die auf einem Kultur- und Wissensobjekt basiert und in einem Metadatensatz repräsentiert ist, wird durch einen kontrollierten Wert spezifiziert (->Strukturtyp).
 

Die Angabe des Strukturtyps kann je nach Kultur- und Wissenseinrichtung und der Spezifikation im Anwendungsprofil unterschiedlich granular erfolgen. Anhand des kontrollierten Werts sollte zumindest erkennbar sein, ob es sich um die Beschreibung eines einzelnen Objekts, einer Gruppe von Objekten oder eines Bestandteils eines Objekts handelt. Für die Beschreibung digitalisierter Drucke ist die Anwendung der Werte aus dem DFG-Viewer Strukturdatenset verpflichtend.

  Die Beschreibung der Kultur- und Wissensobjekte erfordert in den folgenden Bereichen die Verwendung kontrollierter Werte:   
 M
  • Die Art des Kultur- und Wissensobjekts wird durch kontrollierte Werte spezifiziert (->Objekttyp).
 

 

 
  • Der Wert für die Spezifizierung des Kultur- und Wissensobjekts muss einem kontrollierten Vokabular entstammen, das den 5-star Open Data Prinzipien von Tim Berners-Lee entspricht.
 

Der Wert muss einem kontrollierten Vokabular entnommen werden, das den 5-Star Open Data Prinzipien von Timm Berners Lee entspricht:

  • Das Vokabular ist unter einer freien Lizenz im Web publiziert
  • Das Vokabular ist strukturiert
  • Das Vokabular ist in einem nicht-proprietären Format publiziert
  • Jeder Begriff im Vokabular ist durch einen URI global eindeutig identifiziert
  • Es existieren Links zu Begriffen aus anderen Vokabularen oder/und zu Quellen

Welches Vokabular zu Grunde gelegt wird, ist je nach Sparte und Spezifikation im Anwendungsprofil unterschiedlich. Für Objekte aus der Kunst- und Kulturdomäne wird bspw. der AAT empfohlen.

 M
  • Ortsangaben werden durch kontrollierte Werte identifiziert
 z. B.: TGN, Geonames, GND
 
  • die Art der Ereignisse im Lebenszyklus einer Ressource wird durch kontrollierte Werte spezifiziert
 z. B.: LIDO-Eventtype  
 
  • die Sprache des Inhalts eines Kultur- und Wissensobjekts wird durch kontrollierte Werte spezifiziert  
 z.B.: ISO 639-2
  Für die Erhöhung der Datenqualität und des Vernetzungsgrades der Kultur- und Wissensobjekte innerhalb von digitalen Sammlungen gelten folgende Empfehlungen für kontrollierte Vokabulare:  
 
  • Die Art der Objekte wird durch einen Gruppierungsterm aus der Objektfacette des Art & Architecture Thesaurus spezifiziert (-> Klassifikation <Art des Objekts>).
 

 

   
 E
  • Themen, die im Rahmen eines Kultur- und Wissensobjekts behandelt werden, werden aus kontrollierten Vokabularen übernommen
 z. B.: GND, Iconclass, CONA 
 E
  • Zeiträume, Epochen, Kulturen, die für die Beschreibung einer Ressource relevant sind, werden aus kontrollierten Vokabularen übernommen
 z. B.: GND, eHRAF 
 E
  • Personen und Institutionen, die in einer Beziehung zu der Ressource stehen (z. B. als Ersteller, Sammler oder Bearbeiter) werden durch Normdaten identifiziert
 z. B.: GND, ULAN, ISIL 
 E
  • Sammlungen werden durch Normdaten identifiziert
 z. B.: ISCI 
  Dokumentation der verwendeten kontrollierten Vokabulare  
 MDie in den Metadaten berücksichtigten kontrollierten Vokabulare und Normdateien werden im Anwendungsprofil genannt  
 MDie in den Metadaten berücksichtigten kontrollierten Vokabulare werden in den Metadatendaten identifiziert  
  
  • Der in den Metadaten verwendete Term wird in den Metadaten durch einen URI eindeutig identifiziert
 

z. B. http://d-nb.info/gnd/131724126

z. B. http://vocab.getty.edu/aat/300041365

  oder  
  
  • Das Vokabular / die Normdatei, zu der ein Term gehört, wird durch einen URI eindeutig identifiziert
 z. B. http://d-nb.info/gnd/
  oder  
  
  • Das Vokabular / die Normdatei, zu der ein Term gehört, wird durch eine Namen identifiziert
 z. B. GND
 MDas Vokabular / die Normdatei, aus der Terme verwendet werden, ist in menschenlesbarer Form im Web frei zugänglich z. B. http://www.getty.edu/research/tools/vocabularies/ 
 M

Jeder Term in dem kontrollierten Vokabular / der Normdatei wird durch einen eindeutigen Identifier identifiziert

 z. B. http://d-nb.info/gnd/131724126, oder 131724126
 

Das Vokabular / die Normdatei, aus der Terme verwendet werden, ist in maschinenlesbarer Form im Web frei zugänglich

 z. B. http://vocab.getty.edu/queries