Im Zuge der Modernisierung der technischen Infrastruktur des URN-Service wurde der ursprüngliche Harvester nun endgültig abgelöst. Wie schon vor längerem angekündigt, arbeitet der neue Harvester weniger fehlertolerant, weshalb nur noch valides xepicur-XML verarbeiten werden kann.
Beim Import der geharvesteten xepicur-Datensätze haben wir die Verwendung des sehr komplexen Transferformats etwas vereinfacht und so wieder näher an die ursprüngliche OAI-Funktionalität gebracht. Insbesondere wird die Weiterverarbeitung der xepicur-records NICHT mehr durch sogenannte „Update-Status“ gesteuert. Wie auch sonst beim Einsatz von OAI-PMH, wird die URN-Datenbank entsprechend der auf Ihrem Repository vorhandenen URN und URL-Kombinationen aktualisiert. Dazu muss Ihre Schnittstelle jeweils alle aktuell gültigen URLs liefern. Alle nicht mehr gelieferten URLs werden aus der URN-Datenbank gelöscht.
Wenn die Update-Status wie zuvor verwendet werden, kann es deshalb zu Fehlern kommen. So würde beispielsweise bei „url-delete“ gerade die URL in die Datenbank eingetragen, die eigentlich gelöscht werden sollte, alle anderen vorhandenen URLs aber würden gelöscht. Ähnlich würde bei Verwendung von „url_insert“ anschließend nur noch die aktuell gelieferte URL noch in der Datenbank stehen. Kein Konflikt zur neuen Funktionalität entsteht, wenn ausschließlich „urn_new“ und „url_update_general“ verwendet werden.
Die Update-Status werden also zwar nicht mehr ausgewertet, es muss aber dennoch ein Update-Status angegeben werden, da sonst das xepicur-Format nicht valide ist und beim Harvesten nicht akzeptiert würde. Bei größeren Serverwechseln und Systemwechseln wird die URN-Aktualisierung mit dem neuen Harvester deutlich vereinfacht. Zusätzlichen Komfort für Sie erhoffen wir uns davon, dass nun auch eine Set-Einschränkung möglich ist.
Die ursprüngliche xepicur Dokumentation wird ergänzt mit den Hinweisen, welche Elemente aktuell und in Zukunft tatsächlich ausgewertet werden.
Zu beachten ist insbesondere: Bitte liefern Sie alle aktuell gültigen URLs mit Ihrer URN. Alle nicht mehr mitgelieferten URLs werden in der URN-Datenbank gelöscht.
Dies ist die ursprüngliche xepicur Dokumentation. Bei dieser ist die aktuelle Umsetzung beim Ingest in den URN-Service nicht berücksichtigt.
Die ergänzte und kommentierte referenzbeschreibung finden Sie hier.
Inhalt |
---|
indent | 16px |
---|
absoluteUrl | true |
---|
|
Generelle Hinweise
Gültigkeit:
Für Datensätze zur Administration von URNs ist wird xepicur zukünftig nur mehr noch für die Übertragungsart OAI-PMH verbindlich sein.
Hinweise zu Datenstruktur und Syntax
Für den Datensatz ist als Dokumentformat XML verbindlich.
- Elementtypen
- Der Metadatensatz enthält Datenelemente, die nach Elementtypen differenziert in strukturierter Form angegeben sind. Jedes Datenelement wird durch einen Elementbezeichner (tag) eingeleitet, der den Elementnamen angibt.
Beispiel:
- Attribute
- Elementbezeichner werden durch Attribute spezifiziert. Es
wurden - gibt sowohl obligatorische Attribute ("type", "scheme", "imt")
und - als auch optionale Attribute ("role", "status" oder "type")
definiert- .
- Beispiel:
- <identifier
- scheme="url"
- role="primary">
Beschreibung des Datenformates, Reihenfolge und Struktur der Elemente
Generelle Struktur
Ein XML-Datensatz besteht aus einem Wurzelelement
...
<administrative_data>
<record>
Wurzelelement "
...
epicur"
Bezeichnung | epicur | wird ausgewertet |
---|
Attribute | keine |
---|
Unterelemente | - "administrative_data"
- "record"
|
---|
Wiederholbar | nein |
---|
Obligatorisch | ja |
---|
Beschreibung | Das Wurzelelement bildet die äußere Einheit eines XML-Dokumentes. |
---|
Syntax | <epicur> <administrative_data> [...] </administrative_data> <record> [...] </record> < |
---|
Elementgruppe "administrative_data"
...
Element "administrative_data"
Bezeichnung | administrative_data |
---|
wird ausgewertetWird zukünftig nicht mehr ausgewertet, da es aber obligatorisch ist, bitte dennoch liefern. |
Attribute | keine |
|
---|
Unterelemente | |
|
---|
Wiederholbar | nein |
|
---|
Obligatorisch | ja |
|
---|
Beschreibung | Das Element dient der Kapselung von Legitimationsdaten, der Spezifizierung des URN-Meldeprozesses, der verwendeten Transferschnittstelle sowie der Art der Rückmeldung. |
|
---|
Syntax | <administrativ_data> <delivery> [...] </delivery> < |
---|
...
Element "authorization"
wird Wird nicht mehr ausgewertet. Bitte nicht mehr verwenden |
Attribute | keine |
---|
Unterelemente | |
---|
Wiederholbar | nein |
|
---|
Obligatorisch | nein |
---|
Beschreibung | Die Informationen dienen der Spezifizierung des URN-Meldeprozesses wie z. B. URN-Erstmeldung oder URL-Aktualisierung, der verwendeten Transferschnittstelle oder der Art der Rückmeldung. |
---|
Syntax | <administrative_data> <delivery> <authorization> <person_id>F6000123</person_id> <urn_snid>urn:nbn:de:089</urn_snid> </authorization> </delivery> </administrative_data> |
---|
Element "update_status"
wird nicht ausgewertet, da es aber obligatorisch ist mit beliebigem Attribut verwendennur noch mit dem Werten "urn_new" oder "url_update_general" verwenden und aktuelle URN/URL-Zuordungen liefern. |
Attribute | "type" mit folgenden Inhalten: |
---|
- "urn_new"
Kennzeichnung der Meldung als "URN-Erstregistrierung". Bei Einbindung in OAI muss bei Neuerstellung von Records "urn_new" angegeben werden.
|
wird nicht ausgewertetwird Wird nicht mehr ausgewertet |
.wird Wird nicht mehr ausgewertet |
.wird Wird nicht mehr ausgewertet |
. |
- "url_update_general"
Aktualisierung von URLs. Dieses Attribut muss angegeben, wenn der Record nur "neue" URLs beinhaltet. Es werden alle registrierten URLs gelöscht und mit den "neuen" URLs ersetzt.
|
wird nicht mehr ausgewertet.bitte verwenden |
- "url_delete"
Dieses Attribut wird gesetzt, wenn eine URL gelöscht werden soll.
|
wird Wird nicht mehr ausgewertet Hinweis: Wenn url_delete NICHT mit einem OAI-Header <header status="deleted">geliefert wird, wird die gelieferte URL erneut in die Datenbank eingetragen. |
- "url_insert"
Dieses Attribut wird gesetzt, wenn eine neue URL hinzugefügt (im Sinne eines URL-Nachmeldeprozesses) werden soll.
|
wird Wird nicht mehr ausgewertet |
. | |
|
Beschreibung | Das Element dient der Spezifizierung der Art des Meldeprozesses. |
---|
|
|
Syntax | <update_status type="urn_new"/> |
---|
| Element "transfer"
wird Wird nicht mehr ausgewertet. Bitte nicht mehr verwenden. |
Obligatorisch | nein |
|
---|
Element "resupply"
wird Wird nicht mehr ausgewertet. Bitte nicht mehr verwenden |
...
Beispiel "administrative_data"
<epicur> |
| <administrative_data> |
|
|
|
| <delivery> |
|
|
|
| <update_status type="urn_new"/> |
|
| </delivery> |
| </administrative_data> |
[...] |
</epicur> |
Elementgruppe "record"
Element "record"
wird Wird ausgewertet |
Attribute | keine |
---|
Unterelemente | - "identifier"
Mit dem Element "identifier" werden URN und URL mit unterschiedlichen Attributen erfasst.
|
---|
wird |
| - "resource"
Das Element "resource" mit den Unterelementen "identifier" und "format" dient der Abbildung der Zusammenhänge von URN und URL.
|
---|
wird |
| - "isPartOf"
Das Element "isPartOf" dient der Erfassung von Informationen über URNs und URLs für Teildokumente.
| URN und URLs werden zukünftig noch registriert, die hierarische Struktur aber ignoriert. |
---|
| wird Wird nicht mehr ausgewertet. Bitte nicht mehr verwenden. |
| wird Wird nicht mehr ausgewertet. Bitte nicht mehr verwenden. |
Wiederholbar | ja, aber bei Einbindung des Schemas in OAI 2.0 ist die Kardinalität des Elements "record" auf 1 begrenzt. |
---|
Obligatorisch | ja |
---|
Beschreibung | Das Element "record" kapselt URN-URL-Beziehungen der Objekte. Das Element "record" ist dem Wurzelelement "epicur" direkt untergeordnet. Es ist wiederholbar, um Sammelmeldungen zu generieren. Dieser Fall kann bei der Implementation des URN-Melde- und Updateprozesses über eine separate URN-Schnittstelle eintreten. Bei Einbindung des Schemas in OAI 2.0 ist die Kardinalität des Elements "record" auf 1 begrenzt. |
---|
Syntax | <record> [...] < |
---|
Element "identifier"
wird Wird ausgewertet |
Attribute | Mit dem Attribut "scheme" wird URN bzw. URL des Objektes erfasst.
Das Attribut zur Spezifizierung der URN kann folgende Werte annehmen: |
---|
Das Attribut zur Spezifizierung der URL hat folgenden obligatorischen Wert: |
Das Attribut zur Spezifizierung der URN kann folgende Werte annehmen:
"urn"
"urn:nbn"
"urn:nbn:de"
urn:nbn:at" "urn:nbn:ch"
und zusätzlich folgende optionale Attribute: |
wird Wird ausgewertet |
Das optionale Attribut dient zur Kennzeichnung einer URL als Frontpage-URL (landing page) und hat den Wert |
wird Wird zukünftig nicht mehr ausgewertet |
. Bitte nicht mehr verwendenwird Wird nicht mehr ausgewertet. Bitte nicht mehr verwenden. |
Das optionale Attribut kennzeichnet eine URL als "Master-URL", die beim Resolving zuerst ausgewiesen werden soll. Dieser Fall tritt ein, wenn mehr als eine URL zu einer URN registriert ist. Das Attribut hat folgenden Wert: |
wird wird Wird nicht mehr ausgewertet. Bitte nicht mehr verwenden. |
|
wird Wird nicht mehr ausgewertet. Bitte nicht mehr verwenden. |
Unterelemente | keine |
---|
Wiederholbar | ja |
---|
Obligatorisch | ja |
---|
Beschreibung | Das Element "identifier" enthält Informationen über eine URN und URL. Es wird durch obligatorische sowie mehrere optionale Attribute näher spezifiziert. |
---|
Syntax (Auswahl) | <identifier scheme="urn:nbn:de"> [...] < |
---|
<identifier <identifier " type="frontpage" role="primary"> [...] < |
Element "isVersionOf"
Bezeichnung | isVersionOf | wird nicht mehr ausgewertet. Bitte nicht mehr verwenden |
---|
Obligatorisch | nein |
---|
Element "hasVersion"
Bezeichnung | hasVersion | wird nicht mehr ausgewertet. Bitte nicht mehr verwenden |
---|
Obligatorisch | nein |
---|
Element "resource"
Bezeichnung | resource | wird ausgewertet |
---|
Attribute | keine |
---|
|
|
Unterelemente | Mit dem Element "identifier" wird die URL des Objektes erfasst. Aus diesem Grund muss das Attribut "scheme"="url" verwendet werden. ( |
---|
s. siehe Element "identifier") | wird ausgewertet |
Das Element "format" dient der Erfassung des MimeTypes des Objektes. | wird |
nicht mehr . Bitte nicht mehr verwenden |
Wiederholbar | ja |
---|
Obligatorisch | nein |
---|
Beschreibung | Das Element "resource" kapselt die Unterelemente "identifier" mit dem Attribut "scheme"="url" und "format" dient der Erfassung der URL und des MimeTypes (Dateiformat) des Objektes. |
---|
Syntax | <resource> <identifier scheme="url"> [URL des Objektes] </identifier> <format scheme="imt"> [MimeType des Objektes]
|
---|
<Element "format"
??????? | wird ausgewertet |
Attribute | Das Element "format" hat folgendes Attribut: "imt", das als Wert den MimeType des Objektes enthält. |
|
---|
Unterelemente | keine |
|
---|
Wiederholbar | nein |
|
---|
Obligatorisch | nein |
|
---|
Beschreibung | Das Element "format" dient der Erfassung des MimeTypes (Dateiformates) eines Objektes | . |
---|
Syntax | <format scheme="imt"> [MimeType des Objektes] </format> |
---|
| | |
---|
| | |
---|
| | |
---|
| | Element "isPartOf"
Bezeichnung | isPartOf | Zukünftig werden URN und URL |
---|
werden registriert, die hierarchische Struktur aber wird ignoriert. |
Attribute | keine |
---|
Unterelemente | |
---|
Wiederholbar | ja |
---|
Obligatorisch | nein |
---|
Beschreibung | Das Element "isPartOf" kapselt Informationen zu URNs und URLs von Teilobjekten. |
---|
Syntax | <isPartOf> [...] </isPartOf> |
---|
Beispiel "record"
<epicur> |
| <administrative_data> [...] | | |
| | <update_status type="urn_new"/> |
| [...] </administrative_data> | | |
| <record> |
| | <identifier scheme="urn:nbn:de"> urn:nbn:de:gbv:089-3321752945 </identifier> |
| | <resource> |
| | | <identifier scheme="url" role="primary" >http://edok01.tib.uni-hannover.de/edoks/e01dh01/</identifier> |
| | | <format scheme="imt">text/html</format> |
| | </resource> |
| </record> |
</epicur> |