Sie zeigen eine alte Version dieser Seite an. Zeigen Sie die aktuelle Version an.

Unterschiede anzeigen Seitenhistorie anzeigen

« Vorherige Version anzeigen Version 14 Nächste Version anzeigen »

Kriterienbereich Normdaten / kontrollierte Vokabulare

Verantwortlich

  • Stefanie Rühle, Francesca Schulze

Grundsätzliches

Entwurf

Kontrollierte Vokabulare dienen dazu die Beschreibung von digitalen Ressourcen zu vereinheitlichen. Sie ermöglichen den Datennehmern die Metadaten zu den digitalen Sammlungen für verschiedene Anwendungsfälle sinnvoll auszuwerten. Im Kontext von Suchportalen und anderen digitalen Angeboten haben sie vor allem folgende Funktionen:

  • Unterstützung der Suche und Wiederauffindbarkeit der digitalen Ressourcen
  • Einheitliche Präsentation der Beschreibungen zu den digitalen Ressourcen
  • Logische Vernetzung der digitalen Ressourcen untereinander und bestandsübergreifende Vernetzung
  • Verknüpfung der Ressourcen mit anderen Entitäten, wie Personen, Orte, Körperschaften und Ereignisse
  • Unterstützung eines strukturierten Abrufs einzelner Datensets aus verschiedenen Repositorien

In den Kultur- und Wissenseinrichtungen werden unterschiedliche Verfahren für die Erschließung von Ressourcen angewandt. Die Auswahl der verwendeten Vokabulare ist daher abhängig von der Sparte, dem Fachbereich und der Materialart sowie dem für die Erschließung zu Grunde liegenden Regelwerk. Das DINI-Zertifikat gibt daher ausdrücklich die Empfehlung, Vokabulare zu verwenden, die innerhalb einer Sparte oder/und darüberhinaus anerkannt und verbreitet sind. Jedes verwendete Vokabular muss von einer Institution veröffentlicht und gepflegt werden, die die langfristige Nachnutzbarkeit gewährleistet. Darüber hinaus muss das Vokabular zumindest folgende Qualitätskriterien erfüllen: 

  • Begriffe sind eindeutig identifiziert
  • Synonyme sind möglichst vollständig erfasst
  • Homonyme sind eindeutig geklärt

Dabei eignen sich je nach Beschreibungsmerkmalen und beabsichtigten Verwendungszweck unterschiedliche Arten von Vokabularen:

  • Einfache Term- bzw. Wertelisten
  • Normdaten für die einheitliche Beschreibung von Personen, Körperschaften, Orten, Ereignissen oder abstrakten Begriffen
  • Strukturierte Vokabulare, in denen Begriffe miteinander in Beziehung gesetzt sind, bspw. Hierarchiebeziehungen in Klassifikationen oder Hierarchie- und Verwandtschaftsbeziehungen in Thesauri 

Es wird dringend empfohlen Regeln für die Anwendung von Vokabularen zur Indexierung der Metadaten zu beachten, besonders im Hinblick auf den Nutzen für die Suche und Wiederauffindbarkeit der Ressourcen. Dabei müssen Regelwerke, wie RDA, CDWA oder CCO unbedingt beachtet werden. Beispielsweise wird durch eine Klassifizierung eine Beziehung zwischen Ressourcen mit ähnlichen Merkmalen hergestellt. Der für die Klasse ausgewählte Wert dient i.d.R. als Einstiegsterm für die Suche. Von daher sollte er generisch und gewöhnlich allgemeiner sein als der Wert, der die Art der Ressource spezifiziert. Im Idealfall stellt eine Klassifikation eine Beziehung zwischen den Klassen der Klassifikation und den Wert für die Art der Ressource her.

Um eine möglichst breite Nachnutzbarkeit der Metadaten zu gewährleisten sollten Vokabulare verwendet werden, die im Sinne von Linked Data in maschinenlesbarer Form frei zur Verfügung stehen. Für Vokabulare, die dieses Qualitätskriterium nicht erfüllen, wird ein semantisches Mapping zur GND oder zum AAT empfohlen.

 

VerpflichtungKriterienBeispielBemerkungen
 Verwendung von kontollierten Werten in den Metadaten  
 Die Beschreibung von Ressourcen erfordert in den folgenden Bereichen die Verwendung kontrollierter Werte:  
Verpflichtend
  • Die Art der Ressource wird durch kontrollierte Werte spezifiziert
 

z. B.: DFG-Viewer Strukturdatenset, AAT, Oberbegriffsdatei

Verpflichtend
  • Ortsangaben werden durch kontrollierte Werte identifiziert
 z. B.: TGN, Geonames
Empfohlen
  • Themen, die im Rahmen einer Ressource behandelt werden, werden aus kontrollierten Vokabularen übernommen
 z. B.: GND, Iconclass, CONA
Empfohlen
  • Zeiträume, Epochen, Kulturen, die für die Beschreibung einer Ressource relevant sind, werden aus kontrollierten Vokabularen übernommen
 z. B.: GND, eHRAF
Verpflichtend
  • die Art der Ereignisse im Lebenszyklus einer Ressource wird durch kontrollierte Werte spezifiziert
 z. B.: LIDO-Eventtype
Verpflichtend
  • Personen und Institutionen, die in einer Beziehung zu der Ressource stehen (z. B. als Ersteller, Sammler oder Bearbeiter) werden durch Normdaten identifiziert
 z. B.: GND, ULAN
Empfohlen
  • Sammlungen werden durch Normdaten identifiziert
 z. B.: ISCI
 Dokumentation der verwendeten kontrollierten Vokabulare  
VerpflichtendDie in den Metadaten berücksichtigten kontrollierten Vokabulare und Normdateien werden im Anwendungsprofil genannt  
VerpflichtendDie in den Metadaten berücksichtigten kontrollierten Vokabulare werden in den Metadatendaten identifiziert  
 
  • Der in den Metadaten verwendete Terms wird in den Metadaten durch einen URI eindeutig identifiziert
z. B. http://d-nb.info/gnd/131724126 
 oder  
 
  • Das Vokabular / die Normdatei, zu der ein Term gehört, wird durch einen URI eindeutig identifiziert
z. B. http://d-nb.info/gnd/ 
 oder  
 
  • Das Vokabular / die Normdatei, zu der ein Term gehört, wird durch eine Namen identifiziert
z. B. GND 
VerpflichtendDas Vokabular / die Normdatei, aus der Terme verwendet werden, ist in menschenlesbarer Form im Web frei zugänglich  
Empfehlung

Das Vokabular / die Normdatei, aus der Terme verwendet werden, ist in maschinenlesbarer Form im Web frei zugänglich

  
Verpflichtend

Jeder Term in dem kontrollierten Vokabular / der Normdatei wird durch einen eindeutigen Identifier identifiziert

z. B. http://d-nb.info/gnd/131724126, oder 131724126 

 

 

Anforderungen/Empfehlungen aus dem DINI-Zertifikat 2013

 Text DINI-Zertifikat 2013Bemerkungen 
E.1-1

Für alle Dokumente wird zusätzlich zu den Sachgruppen der Deutschen Nationalbibliografie eine verbale Sacherschließung durch frei vergebene Schlagwörter oder eine klassifikatorische Erschließung (fachübergreifend oder fachspezifisch) vorgenommen.

  • Dazu zählen beispielsweise SWD[1], LoC Subject Headings[2], CCS[3], MSC[4] und PACS[5].
  • Die Schlagwörter können auch unmittelbar durch die Autor/‑innen vergeben werden.
AV, 20150608:

Es gibt nicht nur Dokumente :-)

UM, 20150622:
Ja, der Begriff stammt aus dem DINI-Zertifikat (auch dort wurde er der Einfachheit halber so verwendet, soll aber auf andere Objektarten übertragen werden); wir brauchen hier sicherlich einen generischeren Begriff.

zusätzlich: AAT (Info: http://en.wikipedia.org/wiki/Art_%26_Architecture_Thesaurus)

Museen verwenden größtenteils eigene Vokabulare. Diese sollten immer auf die GND oder den AAT gemappt werden.

 
M.6-3  Alle Dokumente werden nach der → Dewey-Dezimalklassifikation (DDC) zumindest gemäß den → Sachgruppen der Deutschen Nationalbibliografie klassifiziert. 
  • Wording: "kategorisiert" statt "klassifiziert"
  • DDC nach Möglichkeit verwenden
  • aber: ist für den nicht-bibliothekarischen Bereich vielfach nicht passend
  • Alternativen für die unterschiedlichen Sparten anbieten(TODO: noch recherchierchen!) - AV, 20150520: 
  • Ein (oder vielleicht der) wichtiger Aspekt ist meines Erachtens eine Repository-übergreifende Themazuordnung, die insbesondere auch die Strukturierung (Set-Abruf) unterstützt. Von daher ist die fachspezifische Zuordnung via Fachklassifikation (s. unten) und Nutzung von dc:subject unabhängig davon zu sehen. Deswegen ist 'kategorisiert' viel besser! (FSu)
  • FS (an FSu): Ist es für die Strukturierung der Sets wichtig, dass ein Objekt (bisher: Dokument) genau einer Gruppe zugeordnet ist, damit man dieses nicht mehrfach harvested? Bei einer Objektklassifikation ist zum Teil genau das Gegenteil der Fall, weil die Klassen ja nach verschiedenen Merkmalen geordnet sind (bsp. eine Facettenklassifikation wie AAT). Ich würde hier trotzdem bei dem Wort "klassifiziert" bleiben. Der Use Case der hier m. E. auch eine wichtige Rolle spielt ist der, dass die Datennehmer (Portale etc.) die Metadaten für die Suche und das Retrieval aufbereiten können.
  • UM: Mir ist noch nicht klar, wie/ob eine Trennung zwischen inhaltlichen (à la DDC) und objekttypbezogenen Kategorien aufrecht erhalten werden kann bzw. sinnvoll ist. Das war im DINI-Z jedenfalls die Aufteilung zwischen M.6-3 und M.6-4.
    --> gehört die AAT-Objektfacette nicht eher zur M.6-4?
  • FS (an UM): Durch eine Klassifizierung stellt man eine Beziehung zwischen Objekten mit ähnlichen Merkmalen (wie Material, Form, Funktion, Region oder Ursprung, kultureller Kontext, Stilepoche) her (vgl. http://www.getty.edu/research/publications/electronic_publications/cdwa/2classification.html). Von daher stimme ich dem zu, dass hier auch inhaltliche Merkmale eine Rolle spielen. Trotzdem braucht man beides - die Objektklassifikation und den Objekttyp / Objektbezeichnung:
    • Klassifikation: ist für den Sucheinstieg gedacht. Von daher sollte die Klasse möglichst generisch sein.  
    • Objekttyp / -Bezeichnung: sollte so spezifisch wie möglich angegeben werden.
  • FS (an UM): Der AAT beinhaltet sowohl Klassen (Groups) als auch spezifische Begriffe (Concepts) und gehört daher m.E. zu M6-3 und M6-4
  • UM: Wäre denn eine mögliche Formulierung hier: "Alle Ressourcen werden nach zumindest einem der folgendenden Systeme kategorisiert:
    (1) DDC gemäß Sachgruppen der Deutschen Nationalbibliografie [Anmerkung FS: Die (24?) DNB-Sachgruppen unterscheiden sich aber von den DDC-Klassen. Sowohl die DDC-Notation als auch die der DNB-Systematik sind im GND-Datensatz ausgewiesen]
    (2) Objektbezeichnung des AAT
    ..."
  • FS (an UM): Ich bin nicht dafür Klassifikationssysteme verpflichtend vorzugeben, sondern solche, die anerkannt / weit verbreitet sind und Qualitätskriterien (standardkonform, für LD nachnutzbar) entsprechen, wie die oben aufgelisteten, zu empfehlen. In der Praxis ist es so, dass unterschiedliche Verfahren zur Klassifizierung verwendet werden, die sich je nach Sparte und Fachbereich stark unterscheiden. Bei Sachgebieten wie Biologie oder Musikinstrumente würden wir ggfs. fachspezifische Begriffe verlieren. Von daher geht es m.E. eher in die Richtung, die AV vorschlägt, in solchen Fällen ein Begriffsmapping (Konkordanz) zu den empfohlenen Klassifikationen herzustellen.
  • FS: Sollte IconClass auch aufgenommen werden?
  • AV an FS: ja, für Kunst/Kunsthistorik
  • AV: es gibt relativ wenige Vokabulare die als Basis für ein Information Retrieval in den Portalen verwendet werden können. Diese können in meinen Augen nicht von den Datenlieferanten verpflichtend eingefordert werden. Andererseits gibt es im Museumsbereich weit verbreitete non-IR Vokabulare wie z.B. die OBG. Diese sollten ebenfalls zur Verwendung empfohlen werden. Sie müssen aber auf die Normvokabulare wie den AAT gemappt werden.

 
M.6-4 
Allen Dokumenten sind Dokument- bzw. Publikationstypen aus dem Vokabular der DINI-Empfehlungen Gemeinsames Vokabular für Publikations- und Dokumenttypen zugeordnet.
  • Strukturdatenset des DFG-Viewers nachnutzen?
  • unterschiedliche Aspekte:
    1. formaler Medientyp: z.B. Text, Bild, Audio, Video
    2. qualifizierter Objekttyp: z.B. Zeitschrift, Monografie, Handschrift, Karten, Noten, ...
    3. Strukturtyp (zumeist abhängig vom Objekttyp): z.B. Artikel, Band, Ausgabe, Kapitel,
      offene Frage: gibt es immer eine eindeutige Zuordnung von Strukturtyp zum Objekttyp?
      • Kommt das nicht auch auf das Metadatenformat/Anwendungsprofil oder/und das verwendete Vokabular an (bzw. bestehende Begriffskonkordanzen)?
        • In LIDO wäre das bspw. die Beziehung zwischen dem recordType und dem objectWorkType.
        • In DCMI könnte man die Beziehung nicht ausdrücken
        • In MARC gibt es diese Unterscheidung m.E. nicht 
  • TODO: Aufstellung der unterschiedlichen Vokabulare  
    • für 1. DCMI Type Vocabulary, (ggfs. auch CIDOC-CRM)
    • für 2. AAT (Bsp. http://vocab.getty.edu/aat/300041365) , GND (Bsp. http://d-nb.info/gnd/4048166-9
    • für 3. Strukturdatenset des DFG-Viewers, im Kontext der LIDO-Terminologie wird gerade ein Vokabular entwickelt, was eher in Richtung Strukturtyp (anderes Wort: Dokumentarische Bezugseinheit?) gehen wird (aber noch nicht abschließend geklärt)
    • Beim qualifizierten Objekttyp kann man m.E. kein spartenübergreifendes Vokabular verpflichtend machen kann. Beim formalen Medientyp würde das vielleicht gehen, obwohl hier immer die Abgrenzung von Text und Bild schwierig ist und man unterscheiden muss, ob es sich um den Medientyp des physischen oder digitalen Objekts handelt.
  • Ich fände es wichtig zunächst diese drei/vier Bedeutungsebenen zu definieren und im Hinblick auf ihren Verwendungszweck zu klären, dann möglichst spartenübergreifende Beispiele zu sammeln und dann zu begutachten und entscheiden, welche Vokabulare man hier empfehlen kann bzw. verpflichtend macht.
 
E.6-7

Autor/‑innennamen werden mit Normdaten verknüpft.

  • Z. B. sollte eine Verknüpfung zur Gemeinsamen Normdatei[1] (GND) und zu ORCID[2] angeboten werden, um die Autor/‑innenidentifikation zu erleichtern.

AV, 20150608:
warum nur Autor/-innen?

UM, 20150622:
Auch hier: Die Formulierung stammt aus dem DINI-Zertifikat.
--> Sinnvoll für digitale Sammlungen sicherlich: Personen in jedweder Rolle zum beschriebenen Objekt (Beteiligte, Thematisierte)
--> sowie auch andere Entititätentypen (Einrichtungen, Orte, Werke ...)
--> die Frage ist hier sicher u.a., was man verpflichtend machen möchte und was nur empfehlend ...

weitere Möglichkeiten: ULAN, VIAF, ...

 

 

 

 

  • Keine Stichwörter