Page tree
Skip to end of metadata
Go to start of metadata

Datenmodell der GND

Kurze Übersicht der Themen und Fragestellungen in einem einführenden Vortrag von Mathias Manecke,

GND4C-Projektmitarbeiter, in der Arbeitsstelle für Standardisierung an der Deutschen Nationalbibliothek.

Bitte auf das Icon klicken, um die Vortragsfolien zu öffnen.

 

 

Fax, Weiße Männchen, 3D Model, Freigestellt, 3D, ModelPräsentation

Relevanzkriterien

Zum Vergrößern der Bilder bitte jeweils auf das Bild klicken.

Was ist ein Normsatz?

Wozu wird dieser gebraucht? Die Graphik zeigt, welche Eigenschaften einen Normsatz auszeichnen und was ein solcher Normsatz leisten sollte. Zum Vergrößern des Bildes bitte auf das Bild klicken.

Zur Relevanz

Die Relevanz lässt sich nach drei wesentlichen Aspekten beurteilen:

    • Verantwortung
      Gibt es eine Gemeinschaft, die sich für die nachhaltige Qualitätssicherung des Datensatzes verantwortlich fühlt?
    • Datenqualität / Quellenlage
      Sind für die eindeutige Identifizierung der Entität hinreichend viele Eigenschaften bekannt und durch hinreichend vertrauenswürdige Quellen nachgewiesen?
    • Bedarf
      Gibt es einen über den unmittelbaren Erschließungsbedarf der Anwendergemeinschaft hinausgehenden Bedarf zur Referenzierung auf die Entität, die der Normdatensatz repräsentiert?

Vergleicht man die Bedarfe der verschiedenen Kultursparten, so ergeben sich deutlich mehr Gemeinsamkeiten als Unterschiede:

    • In allen Kultursparten besteht gleichermaßen der Bedarf, auf Akteure (Personen, Körperschaften, Familien), Geografika und Allgemeinbegriffe referenzieren zu können.
    • Die in der Bibliothekswelt entwickelten Relationstypen (Akteurs-Relationen, Orts-Relationen ...) sind auch in den anderen Kultursparten anwendbar. Einige neue Rollen / Relationen treten hinzu.
    • Der Bedarf zur Relationierung innerhalb der GND nimmt zu.

 

Diskussion im Weltcafé des GND4C-Forums

Moderation Rosenkoetter, Martha / Dokumentation Richard Müller

 Zum Nachlesen der Diskussion im Weltcafé bitte hier klicken

Zustimmung:

  • Autorität beim Datengeber
  • Verantwortung beim Datengeber
    • Frage: Auch bei übergeordneten Entitäten?

Zur Frage:

  • Legen wir alle möglichen gebrauchten Entitäten auf Vorrat an oder neue nur bei Bedarf? 
    • Ja, auf Vorrat vor allem bei Geografika; Sammlungen sollten komplett überführt werden können.

Offene Fragen:

  • Wie ist die Definition von Kultur im Kontext des Projektes GND4C?
    • Zählen auch Natur-Objekte dazu oder nur Objekte, die mit „man-made-object“ fassen kann?

WÜNSCHE:

  • Themenspezifische Workshops
  • Vorfeld:
    • Teilnehmerprofil online zum Vernetzen untereinander
    • Mehr Informationen zu den Inhalten (Texte zu den einzelnen Themen schreiben)
      • Online-Plattform so bald wie möglich ausbauen; die Leute sind JETZT motiviert mit zu arbeiten. Sie wollen EINE Plattform, wo sie alles finden. Blog ist NICHT AUSREICHEND
Das Core-vs-Plus-Datenmodell

Es gibt einen Kernbereich an Eigenschaften, Relationen, Klassen und Regeln, die für jede Anwendergemeinschaft verbindlich sind.

Im Zentrum steht das Basismodell, welches die grundsätzlichen Eigenschaften der GND auf abstrakter Modell-Ebene beschreibt.

 Kernaussagen zum Basismodell
  • Es handelt sich um ein Entity-Relationship-Modell.
  • Jede Entität hat einen persistenten Identifier.
  • Jede Entität hat mindestens eine Benennung.
  • Jede Entität ist mindestens einer Klasse zugeordnet.
  • Jede Entität hat mindestens so viele Eigenschaften und/oder Relationen, dass sie eindeutig identifiziert ist.
  • Jede Eigenschaft bzw. Relation kann eine zeitliche Gültigkeit haben.
  • Jede Eigenschaft bzw. Relation kann eine Quellenreferenz haben.

Die Eigenschaften, Relationen und Klassen gruppieren sich mit zunehmender Differenziertheit (Vererbungsprinzip) um diesen Kern. Mit der Erarbeitung der GND-Ontologie ist bereits der Versuch unternommen worden, die GND-Satzarten und Entitätencodes in einer Klassen-Hierarchie umzusetzen. Dieser Ansatz sollte konsequent weiter verfolgt werden. Auch die Eigenschaften und Relationen lassen sich - an den Klassen orientiert - hierarchisch gruppieren. So ist es möglich, auch die GND-Regeln so weiterzuentwickeln, dass sehr allgemein gehaltene Grundregeln (zur Benennung von Entitäten, zur Klassenzuordnung, zur zeitlichen Einordnung, zur Relationierung innerhalb der GND ...) je nach Sachverhalt in mehr oder weniger komplexe Spezialregeln ausdifferenziert werden können. 

Eine Anwendergemeinschaft kann für sich einen Plusbereich an Eigenschaften, Relationen, Klassen und Regeln definieren. Die Analyse der Fallbeispiele bestätigt bisher die These, dass in den meisten Fällen der zusätzliche Bedarf lediglich darin besteht, präzisierende Regeln zur Anwendung der allgemein zur Verfügung stehenden Klassen, Relationen und Eigenschaften zu formulieren.

 Beispiel für Plus-Regel (Erweiterung):

In einer Anwendergemeinschaft besteht ein besonderes Interesse an Personen einer bestimmten Berufsgruppe. Sie stellt für sich die Regel auf, diesen Beruf bei Personen immer zu erfassen, auch wenn dies zur eindeutigen Identifizierung der Person nicht notwendig wäre und / oder es sich nicht um den spezifischen Beruf der Person handelt.

 Beispiel für Plus-Regel (Restriktion):

In einer Anwendergemeinschaft gibt es die Restriktion, nur eine per Regelwerk definierte Teilmenge der Akteurs-Relationen zu verwenden.

 Beispiel für Plus-Relation:
In einer Anwendergemeinschaft besteht das Interesse, die genealogischen Beziehungen von Adelsgeschlechtern in der GND abzubilden. Der in der GND bereits definierte Relationstyp „Verwandtschaft“ ist für diesen Zweck zu unspezifisch. Die Anwendergemeinschaft definiert die diesem Typ untergeordneten Relationstypen „Eltern“ und „Kind“ und wendet diese für genealogische Beziehungen an.
Diskussion im Weltcafé des GND4C-Forums

Moderation Manecke, Mathias / Dokumentation Susann

 Zum Nachlesen der Diskussion im Weltcafé bitte hier klicken

  • Bei Ermittlung der Bedarfe Perspektive der Endnutzer mit einbeziehen!
  • Konzept für Werk-Normdaten ausbauen
    auch im Museumsbereich anwendbar beispielsweise auf
    • technische Denkmale / Sammlungen
    • Originalgrafik
    • Design
  • Allgemeinbegriffe / Vokabulare: Mapping zur GND vs. Integration in die GND
  • Auswirkungen von Plus-Regeln (Restriktions-Regeln einerseits; Regeln, in bestimmter Hinsicht Vollständigkeit anzustreben, andererseits) für Nutzer 
    Kann eine nicht nachvollziehbare "Schieflage" entstehen, weil einzelne Bereiche extrem ausgebaut sind, andere nicht?

Entscheidungswege für GND-Anpassungen

Entsteht in einer Anwendergemeinschaft der Bedarf, neue Entitäten in der GND abzubilden (sei es diese individuell zu erfassen oder diese aus einem vorhandenen Datenbestand zu übernehmen), so ist zunächst zu prüfen, ob die allgemeinverbindlichen Relevanzkriterien erfüllt sind, es also einen Bedarf für die Abbildung der Entiäten als Normdaten in der GND gibt, eine Anwendergemeinschaft die Verantwortung für die Datenqualität übernimmt und die durch vertrauenswürdige Quellen belegten Eigenschaften der Entitäten hinreichend sind, um diese eindeutig zu identifizieren.

Ist das der Fall, so ist weiterhin zu überprüfen, ob es bereits eine GND-Klasse gibt, der die neuen Entitäten widerspruchsfrei zugeordnet werden können.

Ist auch das der Fall, ist noch zu untersuchen, ob neue Eigenschaften und / oder Relationen benötigt werden, um die Entitäten strukturiert zu beschreiben. Ist das nicht der Fall, können die neuen Entitäten in die GND aufgenommen werden.

Werden hingegen neue Klassen, Eigenschaften oder Relationen benötigt, so muss geprüft werden, ob diese sich widerspruchsfrei in die vorhandenen Hierarchien einordnen lassen. Ist das nicht der Fall, so kann die Anforderung zunächst nicht umgesetzt werden. Gegebenenfalls dient sie aber als Anlass, über grundsätzliche Änderungen des Datenmodells nachzudenken. Die bisherigen Erfahrungen und auch die Analysen der Fallbeispiele zeigen aber, dass das GND-Datenmodell hinreichend abstrakt ist, um bei Bedarf weiter ausdifferenziert zu werden.

Gibt es einen solchen Bedarf, so muss noch ermittelt werden, ob dessen Umsetzung von allgemeinem Interesse ist, die neue Klasse, die neue Eigenschaft, der neue Relationstyp oder die neue Regel also zur allgemeinen Anwendung zur Verfügung stehen sollte. Ist das der Fall, so wird die Klasse, die Eigenschaft, der Relationstyp oder die Regel als CORE-Element definiert und für alle GND-Anwender eingeführt. Handelt es sich hingegen um einen speziellen Bedarf einer einzelnen Anwendergemeinschaft, so kann diese die Klasse, die Eigenschaft, den Relationstyp oder die Regel als PLUS-Element für die Gemeinschaft definieren, dokumentieren und schließlich anwenden.

Diskussion im Weltcafé des GND4C-Forums

Moderation Lill, Jens / Dokumentation Waitzbauer, Sabine

 Zum Nachlesen der Diskussion im Weltcafé bitte hier klicken

 

Erfüllung der Relevanzkriterien:

Zu Beginn ergab sich eine intensive Diskussion um die Relevanzkriterien bzw. wer (welches wie besetzte Gremium) diese festlegt. Bei dem Kriterium „Gibt es einen über den unmittelbaren Erschließungsbedarf der Anwendergemeinschaft hinausgehenden Bedarf zur Referenzierung auf die (neue) Entität.“ besteht die Befürchtung, dass gleich zu Beginn von Fachfremden über Wohl und Wehe einer Einbringung von GND-Datenbeständen entschieden wird. Relevanzkriterien sollten transparent mit den Anwendergemeinschaften der verschiedenen Kultursparten diskutiert und festgelegt werden; auch bedarf es einer ständigen Überprüfung und ggf. Erweiterung derselben. Generell: Mehr Anreize für Mitarbeit schaffen; komplizierte Strukturen/Hierarchien vermeiden.

Trennung Core vs. Plus:

Hier wurde v.a. die Fragestellung „Änderung vom allgemeinen Interesse?“ intensiv diskutiert, die die Trennung in ein Core- oder Plus-Element bewirkt: Woran macht wer bzw. welches wie besetzte Gremium das allgemeine Interesse fest? Hier bedarf es eindeutiger und transparenter Kriterien, die auch einer regelmäßigen Überprüfung bedürfen: Was heute nicht im allgemeinen Fokus erscheint, kann morgen sehr wohl von allgemeinem Interesse sein.

Bei der Modellierung von neuen GND-Elementen (sowohl Core als auch Plus) sollten alle Anwendergemeinschaften einbezogen werden (nicht nur die Bibliothekare); abweichende Anwendungsregeln in den Anwendergemeinschaften sollten auch transparent dokumentiert oder eingesehen werden können, da man ggf. darauf zurückgreifen möchte.

Allgemeine Fragen:

Was passiert, wenn man einen neuen Datenbestand einbringen möchte, sich selbst aber nicht in der Lage befindet als Agentur an den Start zu gehen und auch keine andere Agentur findet, die den Datenbestand betreut?

Was sind vertrauenswürdige Quellen? Ist hier das bibliothekarische Prinzip mit der Liste der fachlichen Nachschlagewerke gemeint? Dieses muss für den Kulturbereich entweder angepasst/erweitert oder ganz ausgesetzt werden. Dadurch, dass eine Institution bestimmte Daten zur Erforschung bzw. wissenschaftlichen Erschließung von Beständen erhebt, sind diese per se notwendig und die Institution als solche die vertrauenswürdige Quelle.

brennende Fragen
  1. Wie kann mit unterschiedlichen Anforderungen an die Granularität umgegangen werden?
  2. Wie können komplexe Eigenschaften besser abgebildet werden?
  3. Wie kann die Qualität der gegenwärtigen GND gehalten / erhöht werden?

Moderation: Manecke, Mathias

 Diskussion zu den brennenden Fragen

  • Spannungsfeld Datenmodell - technische Infrastruktur
    Wie sollen Modellanforderungen mit der gegenwärtigen technischen Infrastruktur umgesetzt werden?
    • Was ist "nur" Konzept?
    • Was kann bereits in PICA-/Aleph-Umgebung gelöst werden?
  • Benennungen:
    • Mehrsprachigkeit, verschiedene Schriftsysteme --> allgemeines Konzept ist bereits in Arbeit
    • verschiedene Benennungen für die gleiche Entität --> führen in gegenwärtiger GND zum Split; denkbar wäre auch, zeitliche Gültigkeit für die Benennung zu erfassen --> Lösungsansatz für unterschiedliche Anforderung an Granularität
  • Sammlungen: Bedarfe zur Modellierung in der GND werden in allen Sparten gesehen; Bedarf auch aus der Forschung; Herausforderung ist die Verständigung über Definition von Sammlung / Abgrenzung zu anderen Beständen
  • Es ist zu hinterfragen, ob Regeln der Bibliotheksgemeinschaft in den Plus-Bereich gehören
    • Beispiel Prinzip Nachschlagewerk
    • Beispiel Restriktionen: Festlegung auf eine bestimmte Menge von Relationen / Eigenschaften; Festlegung auf eine bestimmte Menge zugelassener Werte