Auf dem Plakat wird auf der linken Seite der Datenworkflow zwischen Quelldatenlieferung, normlisiertem Datenspeicher (NDS), Matching-Service, Mapping-Service und der Weitergabe von geeigneten Datensätzen an die GND aufskizziert. Rechts davon befinden sich auf dem Plakat einfache Graphendarstellungen am Beispiel von Manoel da Costa Ataíde: - Personendatensatz in den Quelldaten
- beim konzeptionellen Schemamapping während des Imports in den NDS
- vereinfachter Personendatensatz im NDS
- in der GND
- in Wikidata
Der Workflow etwas genauer: Die Quelldatenlieferungen der jeweiligen Fallbeispiele (Personen/Akteure, Sachgruppe, Geografika, Bauwerke) werden in unterschiedlichen Formaten geliefert. Siehe in der Tabelle links unten. Für den Import in den normalisierten Datenspeicher werden die Quelldaten über ein XSL Transformationsscript auf das Internformat von dem normalisierten Datenspeicher abgebildet und als Version 0 in den NDS importiert. Über einfache Regeln erfolgen teilweise automatische Korrekturen an den Datenlieferungen und die korrigierten Datensätze werden jeweils unter einer eigenen Version abgespeichert. Bevor die Datensätze im Matching-Service gegen Normdaten abgeglichen werden, erfolgt zukünftig ein Konsistenztest. Personendatensätze die z.B. neben dem Namen keine weiteren Merkmale in den Lieferdaten enthalten, werden nicht zum Matching zugelassen oder Zeit-Angaben werden gemäß EDTF (ISO 8601-2) normalisiert. Auf das Matching folgt das Mapping. Ab Projektphase 2 ist geplant, dass neue GND-relevante Datensätze in die GND eingespielt werden. Bei Übereinstimmungen werden GND-Datensätze mit zusätzlichen Informationen aus den Quelldaten angereichert oder korrigiert. |