Im Zuge der Modernisierung der technischen Infrastruktur des URN-Service wurde der ursprüngliche Harvester nun endgültig abgelöst. Wie schon vor längerem angekündigt, arbeitet der neue Harvester weniger fehlertolerant, weshalb nur noch valides xepicur-XML verarbeiten werden kann.
Beim Import der geharvesteten xepicur-Datensätze haben wir die Verwendung des sehr komplexen Transferformats etwas vereinfacht und so wieder näher an die ursprüngliche OAI-Funktionalität gebracht. Insbesondere wird die Weiterverarbeitung der xepicur-records NICHT mehr durch sogenannte „Update-Status“ gesteuert. Wie auch sonst beim Einsatz von OAI-PMH, wird die URN-Datenbank entsprechend der auf Ihrem Repository vorhandenen URN und URL-Kombinationen aktualisiert. Dazu muss Ihre Schnittstelle jeweils alle aktuell gültigen URLs liefern. Alle nicht mehr gelieferten URLs werden aus der URN-Datenbank gelöscht.
Wenn die Update-Status wie zuvor verwendet werden, kann es deshalb zu Fehlern kommen. So würde beispielsweise bei „url-delete“ gerade die URL in die Datenbank eingetragen, die eigentlich gelöscht werden sollte, alle anderen vorhandenen URLs aber würden gelöscht. Ähnlich würde bei Verwendung von „url_insert“ anschließend nur noch die aktuell gelieferte URL noch in der Datenbank stehen. Kein Konflikt zur neuen Funktionalität entsteht, wenn ausschließlich „urn_new“ und „url_update_general“ verwendet werden.
Die Update-Status werden also zwar nicht mehr ausgewertet, es muss aber dennoch ein Update-Status angegeben werden, da sonst das xepicur-Format nicht valide ist und beim Harvesten nicht akzeptiert würde. Bei größeren Serverwechseln und Systemwechseln wird die URN-Aktualisierung mit dem neuen Harvester deutlich vereinfacht. Zusätzlichen Komfort für Sie erhoffen wir uns davon, dass nun auch eine Set-Einschränkung möglich ist.
Die ursprüngliche xepicur Dokumentation wird ergänzt mit den Hinweisen, welche Elemente aktuell und in Zukunft tatsächlich ausgewertet werden.
Zu beachten ist insbesondere: Bitte liefern Sie alle aktuell gültigen URLs mit Ihrer URN. Alle nicht mehr mitgelieferten URLs werden in der URN-Datenbank gelöscht.
Inhalt | ||
---|---|---|
|
Generelle Hinweise
Gültigkeit:
Für Datensätze zur Administration von URNs wird xepicur zukünftig nur mehr noch für die Übertragungsart OAI-PMH verbindlich sein.
Hinweise zu Datenstruktur und Syntax
Für den Datensatz ist als Dokumentformat XML verbindlich.
- Elementtypen
- Der Metadatensatz enthält Datenelemente, die nach Elementtypen differenziert in strukturierter Form angegeben sind. Jedes Datenelement wird durch einen Elementbezeichner (tag) eingeleitet, der den Elementnamen angibt.
Beispiel: <identifier>
- Attribute
- Elementbezeichner werden durch Attribute spezifiziert. Es wurden gibt sowohl obligatorische Attribute ("type", "scheme", "imt") und als auch optionale Attribute ("role", "status" oder "type") definiert.
- Beispiel: <identifier scheme="url" role="primary">
Beschreibung des Datenformates, Reihenfolge und Struktur der Elemente
Generelle Struktur
Ein XML-Datensatz besteht aus einem Wurzelelement
...
<administrative_data>
<record>
Wurzelelement "
...
epicur"
Bezeichnung | epicur | wird ausgewertet |
---|---|---|
Attribute | keine | |
Unterelemente |
| |
Wiederholbar | nein | |
Obligatorisch | ja | |
Beschreibung | Das Wurzelelement bildet die äußere Einheit eines XML-Dokumentes. | |
Syntax | <epicur> <administrative_data> <record> < /epicur> |
Elementgruppe "administrative_data"
...
Element "administrative_data"
Bezeichnung | administrative_data | wird Wird zukünftig nicht mehr ausgewertet, da es aber obligatorisch ist, bitte dennoch liefern. |
---|---|---|
Attribute | keine | |
Unterelemente |
| |
Wiederholbar | nein | |
Obligatorisch | ja | |
Beschreibung | Das Element dient der Kapselung von Legitimationsdaten, der Spezifizierung des URN-Meldeprozesses, | |
Syntax | <administrativ_data> <delivery> [...] </delivery> < /administrative_data> |
...
Element "authorization"
Bezeichnung | authorization | wird Wird nicht mehr ausgewertet. Bitte nicht mehr verwenden |
---|---|---|
Attribute | keine | |
Unterelemente |
| |
Wiederholbar | nein | |
Obligatorisch | nein | |
Beschreibung | Die Informationen dienen der Spezifizierung des URN-Meldeprozesses wie z. B. URN-Erstmeldung oder URL-Aktualisierung, der verwendeten Transferschnittstelle oder der Art der Rückmeldung. | |
Syntax | <administrative_data> |
Element "update_status"
Bezeichnung | update_status | wird zukünftig nicht mehr ausgewertet, da es aber obligatorisch istIst obligatorisch, bitte mit beliebigem Attribut verwendennur noch mit dem Werten "urn_new" oder "url_update_general" verwenden und aktuelle URN/URL-Zuordungen liefern. |
---|---|---|
Attribute | "type" mit folgenden Inhalten: | |
| wird aktuell noch ausgewertetbitte verwenden | |
| wird Wird nicht mehr ausgewertet. | |
| wird Wird nicht mehr ausgewertet. | |
| wird aktuell Wird nicht mehr ausgewertet. | |
| wird nicht mehr ausgewertet.bitte verwenden | |
| wird aktuell noch ausgewertetWird nicht mehr ausgewertet Hinweis: Wenn url_delete NICHT mit einem OAI-Header <header status="deleted">geliefert wird, wird die gelieferte URL erneut in die Datenbank eingetragen. | |
| wird aktuell noch ausgewertet.Wird nicht mehr ausgewertet | |
Unterelemente | keine | |
Wiederholbar | nein | |
Obligatorisch | ja | |
Beschreibung | Das Element dient der Spezifizierung der Art des Meldeprozesses. | |
Syntax | <update_status type="urn_new"/> |
Element "transfer"
Bezeichnung | transfer | wird Wird nicht mehr ausgewertet. Bitte nicht mehr verwenden. |
---|---|---|
Obligatorisch | nein |
Element "resupply"
Bezeichnung | resupply | wird Wird nicht mehr ausgewertet. Bitte nicht mehr verwenden. |
---|---|---|
Obligatorisch | nein |
Beispiel "administrative_data"
<epicur> | |||||
<administrative_data> | |||||
<delivery> | |||||
<update_status type="urn_new"/> | |||||
</delivery> | |||||
</administrative_data> | |||||
[...] | |||||
<epicur></epicur> |
Elementgruppe "record"
Element "record"
Bezeichnung | record | wird Wird ausgewertet |
---|---|---|
Attribute | keine | |
Unterelemente |
| wird Wird ausgewertet |
| wird Wird ausgewertet | |
| URN und URLs werden zukünftig noch registriert, die hierarische Struktur aber ignoriert. | |
| wird Wird nicht mehr ausgewertet. Bitte nicht mehr verwenden. | |
| wird Wird nicht mehr ausgewertet. Bitte nicht mehr verwenden. | |
Wiederholbar | ja, aber Bei bei Einbindung des Schemas in OAI 2.0 ist die Kardinalität des Elements "record" auf 1 begrentztbegrenzt. | |
Obligatorisch | ja | |
Beschreibung | Das Element "record" kapselt URN-URL-Beziehungen der Objekte. Das Element "record" ist dem Wurzelelement "epicur" direkt untergeordnet. Es ist wiederholbar, um Sammelmeldungen zu generieren. Dieser Fall kann bei der Implementation des URN-Melde- und Updateprozesses ueber über eine separate URN-Schnittstelle eintreten. Bei Einbindung des Schemas in OAI 2.0 ist die Kardinalität des Elements "record" auf 1 begrentztbegrenzt. | |
Syntax | <record> [...] < /record> |
Element "identifier"
Bezeichnung | identifier | wird Wird ausgewertet |
---|---|---|
Attribute |
Mit dem Attribut "scheme" wird URN bzw. URL des Objektes erfasst. Das Attribut zur Spezifizierung der URN kann folgende Werte annehmen:
Das Attribut zur Spezifizierung der URL hat folgenden obligatorischen Wert:
| wird Wird ausgewertet |
Das optionale Attribut dient zur Kennzeichnung einer URL als Frontpage-URL (landing page) und hat den Wert
| wird Wird zukünftig nicht mehr ausgewertet. | |
| wird Wird nicht mehr ausgewertet. Bitte nicht mehr verwenden. | |
Das optionale Attribut kennzeichnet eine URL als "Master-URL", die beim Resolving zuerst ausgewiesen werden soll. Dieser Fall tritt ein, wenn mehr als eine URL zu einer URN registriert ist. Das Attribut hat folgenden Wert:
| wird Wird ausgewertet | |
| wird Wird nicht mehr ausgewertet. Bitte nicht mehr verwenden. | |
| wird Wird nicht mehr ausgewertet. Bitte nicht mehr verwenden. | |
Unterelemente | keine | |
Wiederholbar | ja | |
Obligatorisch | ja | |
Beschreibung | Das Element "identifier" enthält Informationen über eine URN und URL. Es wird durch obligatorische sowie mehrere optionale Attribute näher spezifiziert. | |
Syntax (Auswahl) | <identifier scheme="urn:nbn:de"> [...] < /identifier> oder < <identifier identifier scheme="url"> [...] < /identifier> oder < <identifier identifier scheme="url" type="frontpage" role="primary"> [...] < /identifier> |
Element "isVersionOf"
Bezeichnung | isVersionOf | wird nicht mehr ausgewertet. Bitte nicht mehr verwenden |
---|---|---|
Obligatorisch | nein |
Element "hasVersion"
Bezeichnung | hasVersion | wird nicht mehr ausgewertet. Bitte nicht mehr verwenden |
---|---|---|
Obligatorisch | nein |
Element "resource"
Bezeichnung | resource | wird ausgewertet |
---|---|---|
Attribute | keine | |
Unterelemente |
Mit dem Element "identifier" wird die URL des Objektes erfasst. Aus diesem Grund muss das Attribut "scheme"="url" verwendet werden. ( s.siehe Element "identifier") | wird ausgewertet |
Das Element "format" dient der Erfassung des MimeTypes des Objektes. | wird ausgewertet | |
Wiederholbar | ja | |
Obligatorisch | nein | |
Beschreibung | Das Element "resource" kapselt die Unterelemente "identifier" mit dem Attribut "scheme"="url" und "format" dient der Erfassung der URL und des MimeTypes (Dateiformat) des Objektes. | |
Syntax | <resource> <identifier scheme="url"> [URL des Objektes] </identifier> <format scheme="imt"> [MimeType des Objektes] < </resource> |
Element "format"
Bezeichnung | format | wird ausgewertet |
---|---|---|
Attribute | Das Element "format" hat folgendes Attribut: "imt", das als Wert den MimeType des Objektes enthält. | |
Unterelemente | keine | |
Wiederholbar | nein | |
Obligatorisch | nein | |
Beschreibung | Das Element "format" dient der Erfassung des MimeTypes (Dateiformates) eines Objektes | . |
Syntax | <format scheme="imt"> > |
Element "isPartOf"
Bezeichnung | isPartOf | Zukünftig werden URN und URL registriert, die hierarchische Struktur aber wird ignoriert. |
---|---|---|
Attribute | keine | |
Unterelemente |
| |
Wiederholbar | ja | |
Obligatorisch | nein | |
Beschreibung | Das Element "isPartOf" kapselt Informationen zu URNs und URLs von Teilobjekten. | |
Syntax | <isPartOf> |
Beispiel "record"
<epicur> | |||||
<administrative_data> [...] | |||||
<update_status type="urn_new"/> | |||||
[...] </administrative_data> | |||||
<record> | |||||
<identifier scheme="urn:nbn:de">urn> | |||||
<resource> | |||||
<identifier scheme="url" typerole="frontpageprimary" >http://edok01.tib.uni-hannover.de/edoks/e01dh01/</identifier> | |||||
<format scheme="imt">text/html</format> | |||||
</resource> | |||||
</record> | |||||
</epicur> |
...