Wie die Inhalte einzelner Metadatenelemente entstanden sind, soll auch für die DatenbezieherInnen in den RDF-Daten transparent sein. Deswegen beginnen wir ab 2019 mit einem mehrschrittigen Vorgehen, diese Informationen verfügbar zu machen:
- Modellierung der Metadatenelementprovenienz in RDF
- Identifizierung der Prozesse, Agenten und Konfigurationen
- Bereitstellung eines Metadatenprovenienzgesamtabzugs Ab Januar 2019 laufend
- Beschreibungen der Prozesse verfügbar machen geplant für 1. Halbjahr 2019
- Integration der Metadatenprovenienz in das Resolving der einzelnen Titel-Ressourcen geplant für 2019
- ... Ausbau der Prozessbeschreibungen und des Detailgrads der Prozessidentifizierung 2019 ff
Die geplante Ausgestaltung und das Vorgehen sind nicht unumstößlich. Wir möchten in allen Phasen gerne die Rückmeldungen der DatennutzerInnen und deren Wünsche und Anregungen aufnehmen und in ihrem Kreis diskutieren.
Modellierung der Metadaten-Provenienz in RDF
Unser schrittweises Vorgehen beinhaltet, dass die Metadatenprovenienz zunächst nur für die Elemente veröffentlicht wird,
- für die es Unterscheidungsbedarf gibt (d.h. die von mindestens zwei verschiedenen Prozesse generiert werden) und
- für die diese Unterscheidung anhand der Datenbasis möglich ist (in diesem Punkt verbessert sich die Datenlage in den letzten Jahren stetig).
Derzeit sehen wir Anlass und Möglichkeit, Metadatenprovenienz für RDF-Tripel mit den Properties
zu veröffentlichen.
Die Modellierung erfolgt auf Grundlage des PROV Data Model (W3C Recommendation) und anhand der PROV Ontology (W3C Recommendation). Für die Anbindung der Provenienzinformationen an die Titel-Ressoucen bedienen wir uns des Qualified Relation patterns. Dazu haben wir in unserem RDF-Element Set DNB Metadata Terms die Klassen
geschaffen, sowie die Properties