Wann können Daten zu Normdaten werden? – Tipps für die Entwicklung community-spezifischer Relevanzkriterien

Wann ist ein Datensatz für die Gemeinsame Normdatei relevant? Nach welchen Kriterien können geeignete Daten etwa in Vorbereitung eines Imports in die GND sinnvoll ausgewählt werden? Fragen wie diese werden immer wieder unter dem Stichwort der Relevanzkriterien diskutiert. Im Folgenden wird erläutert, was darunter zu verstehen ist, welche Rolle die GND-Eignungskriterien dabei spielen und welche Anhaltspunkte bei der Entwicklung von Relevanzkriterien für die eigene Community oder Anwendergemeinschaft helfen können.


Eine sichtbare und willkommene Folge der GND-Öffnung ist, dass sich die GND durch die hinzukommenden Partner auch als Datensammlung erweitert. Das liegt in der Natur der Sache: In der Vergangenheit ergab sich der Inhalt der GND aus dem Bedarf der Bibliotheken an einheitlichen Benennungen als Ankerpunkte für die formale und inhaltliche Erschließung im Rahmen der Katalogisierung ihrer Medien. Je häufiger und konsequenter weitere Communities nicht nur Buch- und andere Textmaterialien, sondern auch materielle sowie immaterielle Objekte, archivisches Schriftgut und andere Materialarten mithilfe der GND erfassen, umso größer wird der Bedarf an weiteren für die Erschließung benötigten Normdaten in der GND.


Diese Erläuterung will Datengebenden, Communities und GND-Agenturen zur Orientierung dienen. Die Leitfragen, die sie bei der Auswahl von "GND-relevanten" Daten unterstützen sollen, sind daher als Hilfestellung zu verstehen - sie ist weder vollständig noch abgeschlossen.

Sie haben Rückmeldungen dazu oder wollen sich über Ihre bisherigen Erfahrungen mit der Ermittlung von Relevanzkriterien austauschen? Melden Sie sich gerne, damit wir ins Gespräch kommen! gnd-info@dnb.de

Daten müssen den GND-Eignungskriterien entsprechen

Für das Einbringen neuer Daten in die GND gelten die GND-Eignungskriterien. Sie fassen zusammen, welche formalen und organisatorischen Rahmenbedingungen erfüllt sein und welche Eigenschaften auf die einzubringenden Daten zutreffen müssen. Wer Daten in die GND eingeben oder importieren will, muss daher in einem ersten Schritt prüfen, ob sie diesen Kriterien genügen.

  • Eignen sich die Daten für die GND, weil sie Ressourcen außerhalb und Entitäten innerhalb der GND miteinander vernetzen? 
  • Stehen die Daten unter freier Lizenz? 
  • Ist ihre Herkunft nachvollziehbar und stammen die Angaben aus verlässlichen Quellen? 
  • Entsprechen die Daten den geltenden Regeln zur Erfassung von Normdatensätzen in der GND?
  • Besteht eine Vereinbarung mit einer GND-Agentur oder Redaktion über die langfristige redaktionelle Betreuung der Daten in der GND? 
  • Fügen sich die Daten in die bestehenden Abläufe und technischen Systeme ein?

Während sich die meisten der Fragen recht schnell und eindeutig mit Ja oder Nein beantworten lassen, fordert das erste Eignungskriterium zu einer tiefergehenden Auseinandersetzung mit den Daten auf, die in die GND eingebracht werden sollen: “Es besteht ein berechtigter Bedarf und die Daten dienen dem Zweck der GND”. 

Wie lässt sich nun herausfinden, ob der Bedarf an Daten berechtigt ist, sie den Zweck der GND erfüllen und demnach in der GND gut aufgehoben sind? Antworten auf diese Fragen können community-spezifische Relevanzkriterien liefern. Sie ergänzen die Eignungskriterien und konkretisieren sie für den Gebrauch einer bestimmten Community. Im Zusammenspiel von Datengebenden und GND-Agenturen können die Relevanzkriterien etwa als Orientierungshilfe dienen, anhand derer leichter entschieden werden kann, welche Daten letztendlich in die GND eingegeben oder eingespielt werden sollen.



Gemeinfrei. Quelle

Ansätze für die Entwicklung von Relevanzkriterien

Der Zweck der GND ist es, Brücken und Anknüpfungspunkte im Wissensgraph von Kultur und Wissenschaft zu bilden, über die Zusammengehöriges zusammenfindet. Die GND ist ein zentrales Werkzeug, um Verbindungen zwischen den unendlich vielen Informationen im Web zu strukturieren und ausfindig zu machen. Die Normdaten führen heute sowohl zu publizierten Medien in Bibliotheken und verknüpfen ganz unterschiedliche Ressourcen wie  Museumsobjekte, Archivalien und Forschungsdaten.

Ob der Bedarf an einem Normdatensatz als berechtigt und dem Zweck der GND dienlich bewertet werden kann, hängt maßgeblich davon ab, wofür er benötigt wird und ob sein Vernetzungspotenzial hinlänglich groß ist. Es sollte daher im Vorfeld abgeschätzt werden, ob er nur dem eigenen, lokalen Bedarf nützt oder tatsächlich eine Brückenfunktion über Bestands-, Sparten- und Projektgrenzen hinweg im Datennetz von Kultur und Forschung entfalten wird. Daten, die ausschließlich der lokalen Datenhaltung und ihrer Strukturierung dienen, sind demnach meist nicht für die GND relevant. Es ist die breitflächige (Nach-)Nutzung von Daten innerhalb einer Community oder dem gesamten GND-Netzwerk, die sie für die Vernetzung interessant und als Normdatensatz brauchbar machen.

Im Bibliotheksbereich bestehen verschiedene Verabredungen, die mit der Funktion von Relevanzkriterien vergleichbar sind. Diese Konventionen sind Bestandteil der Regelwerke RDA und RSWK für die formale und die inhaltliche Erfassung von Medienwerken. Sie geben vor, welche Angaben Bibliothekar*innen bei der Erschließung von Medien mit Normdaten verknüpfen sollen. Zum Beispiel, wenn:

  • …eine Person als Autor*in oder Herausgeber*in einer Publikation in Erscheinung tritt. Die meisten Bibliotheken erfassen aus Ressourcengründen nur die ersten drei Autor*innen bzw. Herausgeber*innen einer Publikation.

  • …eine Körperschaft Herausgeberin oder Thema einer Publikation ist. Bibliografische Angaben zu Verlag und Ort der Publikation werden aus Ressourcengründen dagegen nicht mit einer Normdatenverknüpfung versehen.

  • …eine Publikation inhaltlich beschrieben werden soll. Hier werden Verknüpfungen zu Sachbegriffen, Orten, Personen, Körperschaften oder Werken hinterlegt, sofern sie Thema des Titels sind. Im Bereich der Sachbegriffe fungiert die GND auch als Thesaurus mit unterschiedlich granularen Begriffen. Um diese für das spätere Information Retrieval möglichst einheitlich zu vergeben, gilt die Anwendungsregel, dass der jeweils engste Begriff verknüpft werden soll.

  • … die Gattung von Medien erschlossen wird. Hier greifen die Bibliotheken auf eine limitierte Liste von “Formschlagwörtern”, d. h. GND-Sachbegriffen zurück.

Daraus ergibt sich auch der Bedarf der bibliothekarischen Community an neu anzulegenden Normdaten. Der Umfang und die Granularität (Erschließungstiefe) dieser Verknüpfungen und Ansetzungen ist davon beeinflusst, welchen gesetzlichen oder Träger-Auftrag die Bibliothek erfüllt, wie viele Objekte erschlossen werden sollen, welche Erschließungstiefe angestrebt wird, welche Personalressourcen dafür zur Verfügung stehen und welche Funktionalität die Anwendungen bieten sollen, die auf den Normdaten aufsetzen. So verfolgen Nationalbibliotheken, Landes- oder Regionalbibliotheken andere Erschließungsstrategien als Spezial- oder Fachbibliotheken. Dennoch haben sie sich auf einen “Mindeststandard” geeinigt, der für die kooperative bibliografische Erschließung mit Normdaten sowie den Datenaustausch erforderlich ist und sich daher in den heute geltenden Erfassungsregeln der GND niederschlägt.





Gemeinfrei. Quelle



Leitfragen für die Entwicklung von Relevanzkriterien für die eigene Community

Die Entwicklung von Relevanzkriterien bedeutet, eine gemeinsame Praxis oder einen gemeinsamen “Mindeststandard” für den Umgang mit Normdaten zu finden. Die Verabredungen zur Verknüpfung und daraus resultierenden Ansetzung von Normdaten sind letztlich mit dem Ziel verbunden, Daten innerhalb einer Community und darüber hinaus besser vernetzen und austauschen zu können. Dabei müssen auch die zur Verfügung stehenden Ressourcen (Personal, Zeit, Geld, Objektmengen) in die Waagschale geworfen werden. Beispielsweise wäre auszuhandeln, auf welcher Erfassungsebene Normdaten zum Einsatz kommen sollen, welche Aussagen oder Entitäten obligatorisch mit Normdaten verknüpft werden sollten und für welche dies lediglich empfohlen wird.

Es gilt also, die Erschließungskonventionen der eigenen Community oder Anwendergemeinschaft in den Blick zu nehmen, den sich daraus ergebenden Bedarf an Normdaten zu ermitteln und so seiner Berechtigung Rückhalt und Gewicht zu geben. Unter Umständen muss sich die Community über die vorhandenen Beteiligungswege dafür einsetzen, dass ihre Bedarfe in der GND umgesetzt und mit den Eignungskriterien vereinbart werden können. Bei der Konkretisierung des Bedarfs an Normdaten der GND können die abschließenden Leitfragen helfen:


Ist die GND tatsächlich der geeignete Ort für die Entitäten, die verknüpft werden sollen?

Wofür wird die Entität benötigt? Können andere Referenzsysteme den Bedarf besser bedienen? Welche Alternativen bieten sich zur GND-Nutzung?

    • Lokale Normdaten nutzen – Grundsätzlich empfiehlt es sich, alle für die Datenerfassung relevanten Entitäten wie beispielsweise Personen, Orte, Körperschaften oder thematische Schlagwörter im eigenen System einzeln zu modellieren, zu beschreiben und über interne Identifier referenzierbar zu machen. Diese können als lokale Normdaten fungieren. Entitäten und IDs, die für die lokale Erfassung, bestimmte Funktionen und Abläufe in der Datenabfrage (Facetten, Filter,...) benötigt werden, können hier beliebig ergänzt werden.

    • Fachthesauri nutzen – Thesauri dienen dazu, Entitäten oder Merkmale über viele Datenbestände hinweg einheitlich und eindeutig zu benennen. Sie enthalten die für ein bestimmtes Themen- oder Fachgebiet wichtigen Begriffe/Konzepte und definieren ihre Relationen. Dadurch bilden sie ein in sich konsistentes, kontrolliertes Vokabular, dessen Deskriptoren weitaus granularer und für die Beschreibung treffender sind als die eher allgemeinen Begriffe der GND. Die GND lässt sich dabei über Mappings einbinden, die die Begriffsbeziehungen zwischen Thesaurus und GND maschinenlesbar abbilden. Sie ermöglichen es z. B. zu den genutzten Deskriptoren des Fachvokabulars die IDs bedeutungsgleicher oder -naher GND-Normdaten in die eigenen Daten zu übernehmen.

    • Weitere Referenzsysteme nutzen – Je nachdem, welche Funktion eine Entität in der Datenhaltung erfüllen muss, kommen neben der GND viele weitere Identifier-Systeme wie z. B. GeoNames oder Wikidata in Frage. Wikidata eignet sich insbesondere für spezifische Referenzierungsbedarfe, die möglichst schnell, etwa in befristeten Projekten, umgesetzt werden sollen.

Der Zweck der GND ist nicht, dass in externen Quellen gepflegte und in der Regel detailreiche Daten schlicht in der Normdatei “gedoppelt” werden. Sie ist weder eine Enzyklopädie, noch eine Datei, in der Deskriptoren aus externen Thesauri, Einträge aus Fachdatenbanken, Orts- oder Personenverzeichnissen oder Objekte aus Sammlungsdatenbanken “gespiegelt” vorgehalten werden oder als Ersatz für sie dienen. Die Thesauri, Objekt-, Personen-, Orts-, Ereignis- und weitere Datenbanken müssen vielmehr selbst zu Bausteinen im Semantic Web werden und ihre Inhalte als Linked Data für Referenzierungen aus anderen Richtungen und Datendomänen zur Verfügung stehen.


Wie groß ist das Verknüpfungspotenzial der zu erfassenden Entität?

    • Sind weitere Ressourcen zur Person oder zum Thema bekannt oder zu erwarten, etwa weil die Person regelmäßig in dem Erfassungskontext in Erscheinung tritt? Das könnte dann der Fall sein, wenn sie publiziert (hat) oder ein Nachlass zu erschließen ist, in dem mehrere Objekte der Person zugeordnet werden können.

    • Ist z. B. aus einem Projektkontext heraus bekannt oder abzusehen, dass außer der eigenen Einrichtung noch weitere Einrichtungen Objekte zu der Person, dem Ort oder Thema vorhalten? Werden die Normdaten zur Vernetzung oder virtuellen Zusammenführung von verteilten Objekten und Informationen im Rahmen eines konkreten Projektes benötigt?

    • Werden die Entitäten benötigt, um eine bestimmte Funktion in der Datenpräsentation zu erfüllen, z. B. Recherche, Facettierung und/oder Zusammenführung von verteilten Objekten über mehrere Institutionen hinweg?




Gemeinfrei. Quelle