Wie die Werte einzelner einzelnen Metadatenabgaben entstanden sind, soll auch in den RDF-Daten transparent sein. Deswegen beginnen wir ab 2019 mit einem mehrschrittigen Vorgehen, diese Informationen verfügbar zu machen:
- Modellierung der Metadatenprovenienz einzelner Aussagen in RDF
- Identifizierung der Erzeugungsprozesse und Agenten
- Bereitstellung eines Metadatenprovenienz-Dumps
Ab Seit Januar 2019 laufend
- Beschreibungen der Erzeugungsprozesse und Agenten verfügbar machen
geplant für 1. Halbjahr 2019
- Integration der Metadatenprovenienz in das Resolving der einzelnen Titel-Ressourcen
geplant für 20192022
- ... Ausbau der Prozess- und Agentenbeschreibungen und des Detailgrads der Prozessidentifizierung
2019 ff
Die geplante Ausgestaltung und das Vorgehen sind flexibel. Wir möchten in allen Phasen gerne mit den Datennutzern und -nutzerinnen ins Gespräch kommen und deren Wünsche und Anregungen aufnehmen und diskutieren.
Modellierung der Metadatenprovenienz einzelner Aussagen in RDF
...
Die in der ersten Phase einzige Bereitstellungsform sind die 3-mal jährlich aktualisierten Metadatenprovenienz-Dumps. Sie werden zusätzlich zu den Titel-Dumps veröffentlicht und basieren auf demselben Datenstand. Der Aussagenumfang der Titel-Dumps wird nicht verändert. Das heisst, dass sie weiterhin alle dcterms:subject- und dcterms:language-Aussagen ohne Provenienzinformation enthalten.
Info |
---|
Download der Dumps unter https://data.dnb.de/opendata/ Kleine Testdatensets für einen schnellen Überblick werden bereitgestellt unter https://data.dnb.de/testdat/ |
Verfügbar sind die Serialisierungen:
- RDF (Turtle)
- RDF/XML
- N-Triples
- HDT
- JSON-LD
Erst ab Juni 2019
Die Dateibenennung folgt dem Muster dnb-all_ldsprov_JJJJMMTT.Dateieindung
, z.B. dnb-all_ldsprov_20190113.ttl
...
Für Entitäten des Typs prov:Activity sind bereits RDF (Turtle)-Beschreibungen verfügbar. Die URIs lösen sie auf, z.B. https://d-nb.info/provenance/activity/aep-gnd:2017-06-15
Langfristig sollen auch eine HTML-Ansicht sowie weitere RDF-Serialisierungen verfügbar werden, sowie Content Negotiation implementiert werden. Ein Zeitplan dafür liegt noch nicht vor
Außerdem arbeiten wir daran, Eine HTML- und RDF-Beschreibungen für Entitäten des Typs prov:Plan bereitzustellen. Zunächst lösen die URIs des Bereichs https://d-nb.info/provenance/plan#
noch nicht auf.
Hier eine vorläufige grobe Einteilung der derzeit ausgewiesenen Erzeugungsprozesse:
Intellektuelle Erfassung |
---|
https://d-nb.info/provenance/plan#i |
https://d-nb.info/provenance/plan#ie-sg |
Automatische Erzeugung |
https://d-nb.info/provenance/plan#aep-gnd |
https://d-nb.info/provenance/plan#aep-lc |
https://d-nb.info/provenance/plan#aep-lcsh |
https://d-nb.info/provenance/plan#aep-sg |
https://d-nb.info/provenance/plan#m |
Übernahme aus Fremddaten |
https://d-nb.info/provenance/plan#oclc-fast |
|
Ableitung aus Datenmappings/Konkordanzen |
https://d-nb.info/provenance/plan#stw-gnd |
Auch Entitäten des Typs prov:Agent wird vorbereitet, fehlt derzeit jedoch noch gänzlich. und prov:Agent werden bereits bereitgestellt.
Integration der Metadatenprovenienz in das Resolving der einzelnen Titel-Ressourcen
...