Versionen im Vergleich

Schlüssel

  • Diese Zeile wurde hinzugefügt.
  • Diese Zeile wurde entfernt.
  • Formatierung wurde geändert.

...

Ausgehend von den Aufgaben, die ein Normdatensatz zu leisten hat, lassen sich wichtige Eigenschaften und daraus wiederum Relevanzkriterien ableiten. Gibt es eine Gemeinschaft, die sich für die nachhaltige Qualitätssicherung des Datensatzes verantwortlich fühlt, gibt es einen Bedarf zur Referenzierung auf die durch den Normsatz repräsentierte Entität im World Wide Web und sind für die eindeutige Identifizierung der Entität hinreichend viele Eigenschaften bekannt und durch hinreichend vertrauenswürdige Quellen nachgewiesen, so kann dieser Datensatz als relevant für die GND gelten. Eine für unterschiedliche Anwendergemeinschaften offene Normdatei kann nur funktionieren, wenn es einen Core-Bereich an Eigenschaften und Regeln gibt, der für jede Anwendergemeinschaft verbindlich ist. Im Zentrum steht das Basismodell, welches die grundsätzlichen Eigenschaften der GND auf abstrakter Modell-Ebene beschreibt. Die Eigenschaften, Relationen und Klassen gruppieren sich mit zunehmender Differenziertheit (Vererbungsprinzip) um diesen Kern. So ist es möglich, die GND-Regeln so weiterzuentwickeln, dass sehr allgemein gehaltene Grundregeln je nach Sachverhalt in mehr oder weniger komplexe Spezialregeln ausdifferenziert werden können. Eine Anwendergemeinschaft kann für sich einen Plus-Bereich an Eigenschaften, Relationen, Klassen und Regeln definieren. Die Analyse der Fallbeispiele bestätigt die These, dass in den meisten Fällen der zusätzliche Bedarf lediglich darin besteht, präzisierende Regeln zur Anwendung der allgemein zur Verfügung stehenden Klassen, Relationen und Eigenschaften zu formulieren. Mehr Information zum Thema: GND4C-Forum Dokumentation: Thema "Datenmodell"

Fortschritte im automatisierten Import

...

Großer Bedarf besteht unter den Interessenten an der Öffnung der GND jenseits des Anlegens einzelner neuer Datensätze, an der Ergänzung des bisherigen GND-Datenbestandes durch möglicherweise erforderliche neue Normdatensätze, dem Massenimport. Denn in den weiteren Kultursparten ist am Anfang der Öffnung der GND mit einem erhöhten Bedarf an über die bibliothekarischen Bedarfe hinausgehend neuen Normdaten zu rechnen. Die Datensätze liegen oft schon strukturiert als Quelldaten vor, allein der Import steht aus. Vor einem gewünschten Massenimport muss aber sicher gestellt werden, dass dieser nicht unnötige Dubletten in die GND spült. Die Quelldaten sollen sortiert werden in Datensätze, die bestehende GND-Datensätze sinnvoll ergänzen, in neue GND-Datensätze und solche, die bereits in der GND enthalten sind, eben die Dubletten. Hierzu stellten Axel Vitzthum und Carsten Resch (beide digiCULT) auf dem GND4C-Forum die Werkzeuge vor. Die technische Infrastruktur von GND4C, das Projectlab,  besteht aus mehreren Teilmodulen. Der Matching-Service durchsucht unterschiedliche Quell- und Zieldaten auf übereinstimmende oder ähnliche Zeichenketten. Die im Matching-Service erstellten Matches sind Kandidaten für den Mapping-Prozess. Dabei werden im Mapping-Service semantisch übereinstimmende Begriffe/Entitäten unter Verwendung der Mapping-Properties von SKOS festgelegt. Bei Übereinstimmungen werden GND-Datensätze mit zusätzlichen Informationen aus den Quelldaten angereichert oder korrigiert. Am Endes des Prozesses teilt sich der Quelldatenbestand in die drei oben genannten Kategorien auf: neue GND-Datensätze, Ergänzungen und Dubletten. Erst ab der Projektphase 2 ist geplant, dass neue, GND-relevante Datensätze in die GND eingespielt werden. Detaillierter wird das Projectlab auf den Dokumentationsseiten zum GND4C-Forum vorgestellt.

...