Architektur des GND4C-Werkzeugkastens
Zum Vergrößern des Bildes bitte anklicken
Das Plakat besteht aus zwei Teilen:
- Im oberen Bereich wird die grobe technische Architektur von GND4C dargestellt. Die externen Datenbestände der 4 Fallbeispiele (Personen, Geografika, Sachbegriffe, Bauwerke) werden zunächst in den normalisierten Datenspeicher (NDS) importiert. Aus dem NDS werden die Metadaten über ein JSON-API in die Lucene-basierte Solr Suchplattform übernommen. Von hier aus stehen die normalisierten Quelldaten der Werkzeugkiste zur Verfügung.
Die Werkzeugkiste von GND4C besteht aus mehreren Teilmodulen. Der Matching-Service durchsucht unterschiedliche Quell- und Zieldaten auf übereinstimmende oder ähnliche Zeichenketten. Die im Matching-Service erstellten Matches sind Kandidaten für den Mapping-Prozess. Dabei werden im Mapping-Service semantisch übereinstimmende Begriffe/Entitäten unter Verwendung der Mapping-Properties von SKOS festgelegt.
Ab Projektphase 2 ist geplant, dass neue GND-relevante Datensätze in die GND eingespielt werden. Bei Übereinstimmungen werden GND-Datensätze mit zusätzlichen Informationen aus den Quelldaten angereichert oder korrigiert.
- Auf dem unteren Teilplakat wird aus dem Matching-Service über das Solr-API auf die Quelldaten zugegriffen.
Als Zielvokabular wird während des automatischen Abgleichverfahrens zunächst die GND verwendet. Der Zugriff auf die GND erfolgt über das GND4C RDF-API und das Lobid-API. Beide Dienste beruhen auf den Linked Data-Dumps (GNDO RDF) der GND. Da die RDF-Darstellung der GND nicht die vollständige GND wiedergibt, wird das GND4C RDF-API unter dem Arbeitstitel "GND4C RDF-API+" um weitere Attributsdaten aus dem Marc21-Dienst der GND erweitert.
Für unterschiedliche Anwendungsfälle werden weitere Normdatendienste benötigt. Z.B. wird nachgelagert auf Wikidata gematcht, wenn es bei den Personen keinen Match in der GND gibt.
Weltcafé-Diskussion auf dem GND4C-Forum
Moderation Vitzthum, Axel / Dokumentation Büchner, Michael
Workflow
Zum Vergrößern des Bildes bitte anklicken
[Erklär-Bär]
Weltcafé-Diskussion auf dem GND4C-Forum
Moderation / Dokumentation Richard Müller
Vorstellung des Tools