Versionen im Vergleich

Schlüssel

  • Diese Zeile wurde hinzugefügt.
  • Diese Zeile wurde entfernt.
  • Formatierung wurde geändert.
Panel
bgColor#FEC673

Anker
Infrastruktur
Infrastruktur

Column
width100%

Die technische Infrastruktur der GND

Kurze Übersicht der Themen und Fragestellungen in einem einführenden Vortrag von Axel Vitzthum,

Leiter IT in der digiCULT Verbund e.G..

Bitte auf das Icon klicken, um die Vortragsfolien zu öffnen.

Column
width15%

 

 

Column
width15%
Panel
bgColor#2A479E
titleColor#EF8340

Fax, Weiße Männchen, 3D Model, Freigestellt, 3D, ModelPräsentation

Panel
borderColor#2A479E
bgColor#CCEBF3
titleColor#EF8340
titleBGColor#2A479E
borderWidth3
titleArchitektur des GND4C-Werkzeugkastens
borderStylesolid

Zum Vergrößern des Bildes bitte anklicken

Column
width25%

Column
width65%

Das Plakat besteht aus zwei Teilen:

  1. Im oberen Bereich wird die grobe technische Architektur von GND4C dargestellt. Die externen Datenbestände der 4 Fallbeispiele (Personen, Geografika, Sachbegriffe, Bauwerke) werden zunächst in den normalisierten Datenspeicher (NDS) importiert. Aus dem NDS werden die Metadaten über eine ein JSON-API in die Lucene-basierte Solr Suchplattform übernommen. Von hier aus stehen die normalisierten Quelldaten der Werkzeugkiste zur Verfügung.
    Die Werkzeugkiste von GND4C besteht aus mehreren Teilmodulen. Der Matching-Service durchsucht unterschiedliche Quell- und Zieldaten auf übereinstimmende oder ähnliche Zeichenketten. Die im Matching-Service erstellten Matches sind Kandidaten für den Mapping-Prozess. Dabei werden im Mapping-Service semantisch übereinstimmende Begriffe/Entitäten unter Verwendung der Mapping-Properties von SKOS festgelegt.
    Ab Projektphase 2 ist geplant, dass neue GND-relevante Datensätze in die GND eingespielt werden. Bei Übereinstimmungen werden GND-Datensätze mit zusätzlichen Informationen aus den Quelldaten angereichert oder korrigiert.
  2. Auf dem unteren Teilplakat wird aus dem Matching-Service über die das Solr-API auf die Quelldaten zugegriffen.
    Als Zielvokabular wird während des automatischen Abgleichverfahrens zunächst die GND verwendet. Der Zugriff auf die GND erfolgt über das GND4C RDF-API und das Lobid-API. Beide Dienste beruhen auf den Linked Data-Dumps (GNDO RDF) der GND. Da die RDF-Darstellung der GND nicht die vollständige GND wiedergibt, wird die GND4C RDF-API unter dem Arbeitstitel "GND4C RDF-API+" um weitere Attributsdaten aus dem Marc21-Dienst der GND erweitert.
    Für unterschiedliche Anwendungsfälle werden weitere Normdatendienste benötigt. Z.B. wird nachgelagert auf Wikidata gematcht, wenn es bei den Personen keinen Match in der GND gibt.
Panel
borderColor#2A479E
bgColor#CCEBF3
titleColor#EF8340
titleBGColor#2A479E
borderWidth1
titleWeltcafé-Diskussion auf dem GND4C-Forum
borderStylesolid

Moderation Vitzthum, Axel / Dokumentation Büchner, Michael

Erweitern
titleZum Nachlesen der Diskussion im Weltcafé bitte hier klicken
Column
width25%

[Bild]

Column
width65%
 [Text]
Panel
borderColor#2A479E
bgColor#CCEBF3
titleColor#EF8340
titleBGColor#2A479E
borderWidth3
titleWorkflow
borderStylesolid
Zum Vergrößern des Bildes bitte anklicken

 

Column
width55%

Column
width40%
[Erklär-Bär]
Panel
borderColor#2A479E
bgColor#CCEBF3
titleColor#EF8340
titleBGColor#2A479E
borderWidth1
titleWeltcafé-Diskussion auf dem GND4C-Forum
borderStylesolid

Moderation / Dokumentation Richard Müller

Erweitern
titleZum Nachlesen der Diskussion im Weltcafé bitte hier klicken
Column
width30%

Zum Vergrößern des Bildes bitte anklicken

Column
width70%

 [Beitrag aus dem Publikum]

Die Plattform zum Abgleich von Entitäten (Personen, Geografika, Sachbegriffe) von Datenquellen an der GND wird durch die Schleswig-Holsteinischen Landesbibliothek/digiCult entwickelt. Die Plattform wird voraussetzen, dass abzugleichende Entitäten in einer vorgegebenen XML-Struktur mit identifizierenden Merkmalen vorliegen müssen. An prototypischen Datenquellen wurden bisher Match-und-Merge-Prozesse für Personennamen aus verschiedenen Quellen (z. B. AKL) getestet. Dabei werden Personen-Namen auf Vor- und Nachname reduziert, andere Angaben abgetrennt, Zeit-Daten werden gemäß EDTF (ISO 8601-2) normalisiert und danach die Datensätze auf mögliche Dubletten überprüft.

 Unter den weiteren Fragen, die im Forum angeschnitten wurden, war die nach der Qualitätssicherung in der GND. Als ein Baustein sollen in der GND Datensätze mit einer Versionierung ausgestattet werden, damit ein früherer Datensatz-Status wiederhergestellt werden kann.

Panel
borderColor#2A479E
bgColor#CCEBF3
titleColor#EF8340
titleBGColor#2A479E
borderWidth3
titleVorstellung des Tools
borderStylesolid
Erweitern
titleDiskussion zur Tool-Vorstellung
Column
width20%

[Bild]

Column
width80%

[Text]