Im Zuge der Modernisierung der technischen Infrastruktur des URN-Service wurde der ursprüngliche Harvester nun endgültig abgelöst. Wie schon vor längerem angekündigt, arbeitet der neue Harvester weniger fehlertolerant, weshalb nur noch valides xepicur-XML verarbeiten werden kann.
Beim Import der geharvesteten xepicur-Datensätze haben wir die Verwendung des sehr komplexen Transferformats etwas vereinfacht und so wieder näher an die ursprüngliche OAI-Funktionalität gebracht. Insbesondere wird die Weiterverarbeitung der xepicur-records NICHT mehr durch sogenannte „Update-Status“ gesteuert. Wie auch sonst beim Einsatz von OAI-PMH, wird die URN-Datenbank entsprechend der auf Ihrem Repository vorhandenen URN und URL-Kombinationen aktualisiert. Dazu muss Ihre Schnittstelle jeweils alle aktuell gültigen URLs liefern. Alle nicht mehr gelieferten URLs werden aus der URN-Datenbank gelöscht.
Wenn die Update-Status wie zuvor verwendet werden, kann es deshalb zu Fehlern kommen. So würde beispielsweise bei „url-delete“ gerade die URL in die Datenbank eingetragen, die eigentlich gelöscht werden sollte, alle anderen vorhandenen URLs aber würden gelöscht. Ähnlich würde bei Verwendung von „url_insert“ anschließend nur noch die aktuell gelieferte URL noch in der Datenbank stehen. Kein Konflikt zur neuen Funktionalität entsteht, wenn ausschließlich „urn_new“ und „url_update_general“ verwendet werden.
Die Update-Status werden also zwar nicht mehr ausgewertet, es muss aber dennoch ein Update-Status angegeben werden, da sonst das xepicur-Format nicht valide ist und beim Harvesten nicht akzeptiert würde. Bei größeren Serverwechseln und Systemwechseln wird die URN-Aktualisierung mit dem neuen Harvester deutlich vereinfacht. Zusätzlichen Komfort für Sie erhoffen wir uns davon, dass nun auch eine Set-Einschränkung möglich ist.
Die ursprüngliche xepicur Dokumentation wird ergänzt mit den Hinweisen, welche Elemente aktuell und in Zukunft tatsächlich ausgewertet werden.
Zu beachten ist insbesondere: Bitte liefern Sie alle aktuell gültigen URLs mit Ihrer URN. Alle nicht mehr mitgelieferten URLs werden in der URN-Datenbank gelöscht.
Generelle Hinweise
Gültigkeit:
Für Datensätze zur Administration von URNs wird xepicur zukünftig nur mehr noch für die Übertragungsart OAI-PMH verbindlich sein.
Für den Datensatz ist als Dokumentformat XML verbindlich.
- Elementtypen
- Der Metadatensatz enthält Datenelemente, die nach Elementtypen differenziert in strukturierter Form angegeben sind. Jedes Datenelement wird durch einen Elementbezeichner (tag) eingeleitet, der den Elementnamen angibt.
Beispiel: <identifier>
- Attribute
- Elementbezeichner werden durch Attribute spezifiziert. Es wurden gibt sowohl obligatorische Attribute ("type", "scheme", "imt") und als auch optionale Attribute ("role", "status" oder "type") definiert.
- Beispiel: <identifier scheme="url" role="primary">
Beschreibung des Datenformates, Reihenfolge und Struktur der Elemente
Generelle Struktur
Ein XML-Datensatz besteht aus einem Wurzelelement
...
<administrative_data>
<record>
Wurzelelement "
...
epicur"
Bezeichnung | epicur | wird ausgewertet |
---|
Attribute | keine |
---|
Unterelemente | - "administrative_data"
- "record"
|
---|
Wiederholbar | nein |
---|
Obligatorisch | ja |
---|
Beschreibung | Das Wurzelelement bildet die äußere Einheit eines XML-Dokumentes. |
---|
Syntax | <epicur> <administrative_data> [...] </administrative_data> <record> [...] </record> < |
---|
Elementgruppe "administrative_data"
...
Element "administrative_data"
Bezeichnung | administrative_data |
---|
wird ausgewertetWird zukünftig nicht mehr ausgewertet, da es aber obligatorisch ist, bitte dennoch liefern. |
Attribute | keine |
---|
| |
|
Beschreibung | Das Element dient der Kapselung von Legitimationsdaten, der Spezifizierung des URN-Meldeprozesses, der verwendeten Transferschnittstelle sowie der Art der Rückmeldung. |
---|
|
|
Syntax | <administrativ_data> <delivery> [...] </delivery> < |
---|
| ...
Element "authorization"
wird Wird nicht mehr ausgewertet. Bitte nicht mehr verwenden |
Attribute | keine |
---|
Unterelemente | - "person_id"
Legitimations_ID einer Person. - "system_id"
Alternative zu "person_id"
|
---|
. Es kann eine ID sein, die nur in Zusammenhang mit maschinengesteuerter URN-Meldung erfolgt |
|
Obligatorisch | nein |
---|
Beschreibung | Die Informationen dienen der Spezifizierung des URN-Meldeprozesses wie z. B. URN-Erstmeldung oder URL-Aktualisierung, der verwendeten Transferschnittstelle oder der Art der Rückmeldung. |
---|
Syntax | <administrative_data> <delivery> <authorization> <person_id>F6000123</person_id> <urn_snid>urn:nbn:de:089</urn_snid> </authorization> </delivery> </administrative_data> |
---|
Element "update_status"
wird zukünftig nicht mehr ausgewertet, da es aber obligatorisch ist mit beliebigem Attribut verwendennur noch mit dem Werten "urn_new" oder "url_update_general" verwenden und aktuelle URN/URL-Zuordungen liefern. |
Attribute | "type" mit folgenden Inhalten: |
---|
- "urn_new"
Kennzeichnung der Meldung als "URN-Erstregistrierung". Bei Einbindung in OAI muss bei Neuerstellung von Records "urn_new" angegeben werden.
|
wird aktuell noch ausgewertetwird Wird nicht mehr ausgewertet |
.wird Wird nicht mehr ausgewertet |
.wird aktuell Wird nicht mehr ausgewertet |
. |
- "url_update_general"
Aktualisierung von URLs. Dieses Attribut muss angegeben, wenn der Record nur "neue" URLs beinhaltet. Es werden alle registrierten URLs gelöscht und mit den "neuen" URLs ersetzt.
|
wird nicht mehr ausgewertet.bitte verwenden |
- "url_delete"
Dieses Attribut wird gesetzt, wenn eine URL gelöscht werden soll.
| Wird nicht mehr ausgewertet |
wird aktuell noch ausgewertetHinweis: Wenn url_delete NICHT mit einem OAI-Header <header status="deleted">geliefert wird, wird die gelieferte URL erneut in die Datenbank eingetragen. |
- "url_insert"
Dieses Attribut wird gesetzt, wenn eine neue URL hinzugefügt (im Sinne eines URL-Nachmeldeprozesses) werden soll.
|
wird aktuell noch ausgewertet.Wird nicht mehr ausgewertet |
Unterelemente | keine |
---|
| |
|
Beschreibung | Das Element dient der Spezifizierung der Art des Meldeprozesses. |
---|
|
|
Syntax | <update_status type="urn_new"/> |
---|
| Element "transfer"
wird Wird nicht mehr ausgewertet. Bitte nicht mehr verwenden. |
Obligatorisch | nein |
---|
| Element "resupply"
wird Wird nicht mehr ausgewertet. Bitte nicht mehr verwenden. |
Obligatorisch | nein |
---|
Beispiel "administrative_data"
| | | | | | | |
|
|
|
| <update_status type="urn_new"/> |
| |
| </administrative_data> |
[...] |
<epicur> Elementgruppe "record"
Element "record"
wird Wird ausgewertet |
Attribute | keine |
---|
Unterelemente | - "identifier"
Mit dem Element "identifier" werden URN und URL mit unterschiedlichen Attributen erfasst.
|
---|
wird |
| - "resource"
Das Element "resource" mit den Unterelementen "identifier" und "format" dient der Abbildung der Zusammenhänge von URN und URL.
|
---|
wird |
| - "isPartOf"
Das Element "isPartOf" dient der Erfassung von Informationen über URNs und URLs für Teildokumente.
| URN und URLs werden zukünftig noch registriert, die hierarische Struktur aber ignoriert. |
---|
wird Wird nicht mehr ausgewertet. Bitte nicht mehr verwenden. |
| wird Wird nicht mehr ausgewertet. Bitte nicht mehr verwenden. |
Wiederholbar | ja, aber bei Einbindung des Schemas in OAI 2.0 ist die Kardinalität des Elements "record" auf 1 begrenzt. |
---|
Obligatorisch | ja |
---|
Beschreibung | Das Element "record" kapselt URN-URL-Beziehungen der Objekte. Das Element "record" ist dem Wurzelelement "epicur" direkt untergeordnet. Es ist wiederholbar, um Sammelmeldungen zu generieren. Dieser Fall kann bei der Implementation des URN-Melde- und Updateprozesses über eine separate URN-Schnittstelle eintreten. Bei Einbindung des Schemas in OAI 2.0 ist die Kardinalität des Elements "record" auf 1 begrenzt. |
---|
Syntax | <record> [...] < |
---|
Element "identifier"
wird Wird ausgewertet |
Attribute | Mit dem Attribut "scheme" wird URN bzw. URL des Objektes erfasst.
Das Attribut zur Spezifizierung der URN kann folgende Werte annehmen: |
---|
Das Attribut zur Spezifizierung der URL hat folgenden obligatorischen Wert: |
Das Attribut zur Spezifizierung der URN kann folgende Werte annehmen:
"urn"
"urn:nbn "urn:nbn:de"
"urn:nbn:at"
"urn:nbn:ch"
und zusätzlich folgende optionale Attribute: |
wird Wird ausgewertet |
Das optionale Attribut dient zur Kennzeichnung einer URL als Frontpage-URL (landing page) und hat den Wert |
wird Wird zukünftig nicht mehr ausgewertet |
.wird Wird nicht mehr ausgewertet. Bitte nicht mehr verwenden. |
Das optionale Attribut kennzeichnet eine URL als "Master-URL", die beim Resolving zuerst ausgewiesen werden soll. Dieser Fall tritt ein, wenn mehr als eine URL zu einer URN registriert ist. Das Attribut hat folgenden Wert: |
wird wird Wird nicht mehr ausgewertet. Bitte nicht mehr verwenden. |
|
wird Wird nicht mehr ausgewertet. Bitte nicht mehr verwenden. |
Unterelemente | keine |
---|
Wiederholbar | ja |
---|
Obligatorisch | ja |
---|
Beschreibung | Das Element "identifier" enthält Informationen über eine URN und URL. Es wird durch obligatorische sowie mehrere optionale Attribute näher spezifiziert. |
---|
Syntax (Auswahl) | <identifier scheme="urn:nbn:de"> [...] < |
---|
< identifier <identifier scheme="url"> [...] < |
<identifier type="frontpage" Element "isVersionOf"
Bezeichnung | isVersionOf | wird nicht mehr ausgewertet. Bitte nicht mehr verwenden |
---|
Obligatorisch | nein |
---|
Element "hasVersion"
Bezeichnung | hasVersion | wird nicht mehr ausgewertet. Bitte nicht mehr verwenden |
---|
Obligatorisch | nein |
---|
Element "resource"
Bezeichnung | resource | wird ausgewertet |
---|
Attribute | keine |
---|
|
|
Unterelemente | Mit dem Element "identifier" wird die URL des Objektes erfasst. Aus diesem Grund muss das Attribut "scheme"="url" verwendet werden. ( |
---|
s. siehe Element "identifier") | wird ausgewertet |
Das Element "format" dient der Erfassung des MimeTypes des Objektes. | wird ausgewertet |
Wiederholbar | ja |
---|
Obligatorisch | nein |
---|
Beschreibung | Das Element "resource" kapselt die Unterelemente "identifier" mit dem Attribut "scheme"="url" und "format" dient der Erfassung der URL und des MimeTypes (Dateiformat) des Objektes. |
---|
Syntax | <resource> <identifier scheme="url"> [URL des Objektes] </identifier> <format scheme="imt"> [MimeType des Objektes] |
---|
<Element "format"
Bezeichnung | format | wird ausgewertet |
---|
Attribute | Das Element "format" hat folgendes Attribut: "imt", das als Wert den MimeType des Objektes enthält. |
---|
| | |
|
Beschreibung | Das Element "format" dient der Erfassung des MimeTypes (Dateiformates) eines Objektes | . |
---|
Syntax | <format scheme="imt" |
---|
> > [MimeType des Objektes] </format> |
| Element "isPartOf"
Bezeichnung | isPartOf | Zukünftig werden URN und URL registriert, die hierarchische Struktur aber wird ignoriert. |
---|
Attribute | keine |
---|
Unterelemente | |
---|
Wiederholbar | ja |
---|
Obligatorisch | nein |
---|
Beschreibung | Das Element "isPartOf" kapselt Informationen zu URNs und URLs von Teilobjekten. |
---|
Syntax |
---|
<isPartOf> <isPartOf> [...] </isPartOf> |
Beispiel "record"
<epicur> |
| <administrative_data> [...] | | |
| | <update_status type="urn_new"/> |
| [...] </administrative_data> | | |
| <record> |
| | <identifier scheme="urn:nbn:de" |
>urn3321752945<3321752945 </identifier> |
| | <resource> |
| | | <identifier scheme="url" |
typefrontpage