Versionen im Vergleich

Schlüssel

  • Diese Zeile wurde hinzugefügt.
  • Diese Zeile wurde entfernt.
  • Formatierung wurde geändert.

...

Großer Bedarf besteht unter den Interessenten an der Öffnung der GND jenseits des Anlegens einzelner neuer Datensätze, an der Ergänzung des bisherigen GND-Datenbestandes durch möglicherweise erforderliche neue Normdatensätze, dem Massenimport. Denn in den weiteren Kultursparten ist am Anfang der Öffnung der GND mit einem erhöhten Bedarf an über die bibliothekarischen Bedarfe hinausgehend neuen Normdaten zu rechnen. Die Datensätze liegen oft schon strukturiert als Quelldaten vor, allein der Import steht aus. Vor einem gewünschten Massenimport muss aber sicher gestellt werden, dass dieser nicht unnötige Dubletten in die GND spült. Die Quelldaten sollen sortiert werden in Datensätze, die bestehende GND-Datensätze sinnvoll ergänzen, in neue GND-Datensätze und solche, die bereits in der GND enthalten sind, eben die Dubletten. Hierzu stellten Axel Vitzthum und Carsten Resch (beide digiCULT) auf dem GND4C-Forum die Werkzeuge vor. Die technische Infrastruktur von GND4C, das Projectlab,  besteht aus mehreren Teilmodulen. Der Matching-Service durchsucht unterschiedliche Quell- und Zieldaten auf übereinstimmende oder ähnliche Zeichenketten. Die im Matching-Service erstellten Matches sind Kandidaten für den Mapping-Prozess. Dabei werden im Mapping-Service semantisch übereinstimmende Begriffe/Entitäten unter Verwendung der Mapping-Properties von SKOS festgelegt. Bei Übereinstimmungen werden GND-Datensätze mit zusätzlichen Informationen aus den Quelldaten angereichert oder korrigiert. Am Endes des Prozesses teilt sich der Quelldatenbestand in die drei oben genannten Kategorien auf: neue GND-Datensätze, Ergänzungen und Dubletten. Erst ab der Projektphase 2 ist geplant, dass neue, GND-relevante Datensätze in die GND eingespielt werden. Detaillierter wird das Projectlab auf den Dokumentationsseiten zum GND4C-Forum vorgestellt.

...