Im Zuge der Modernisierung der technischen Infrastruktur des URN-Service wurde der ursprüngliche Harvester nun endgültig abgelöst. Wie schon vor längerem angekündigt, arbeitet der neue Harvester weniger fehlertolerant, weshalb nur noch valides xepicur-XML verarbeiten werden kann.
Beim Import der geharvesteten xepicur-Datensätze haben wir die Verwendung des sehr komplexen Transferformats etwas vereinfacht und so wieder näher an die ursprüngliche OAI-Funktionalität gebracht. Insbesondere wird die Weiterverarbeitung der xepicur-records NICHT mehr durch sogenannte „Update-Status“ gesteuert. Wie auch sonst beim Einsatz von OAI-PMH, wird die URN-Datenbank entsprechend der auf Ihrem Repository vorhandenen URN und URL-Kombinationen aktualisiert. Dazu muss Ihre Schnittstelle jeweils alle aktuell gültigen URLs liefern. Alle nicht mehr gelieferten URLs werden aus der URN-Datenbank gelöscht.
Wenn die Update-Status wie zuvor verwendet werden, kann es deshalb zu Fehlern kommen. So würde beispielsweise bei „url-delete“ gerade die URL in die Datenbank eingetragen, die eigentlich gelöscht werden sollte, alle anderen vorhandenen URLs aber würden gelöscht. Ähnlich würde bei Verwendung von „url_insert“ anschließend nur noch die aktuell gelieferte URL noch in der Datenbank stehen. Kein Konflikt zur neuen Funktionalität entsteht, wenn ausschließlich „urn_new“ und „url_update_general“ verwendet werden.
Die Update-Status werden also zwar nicht mehr ausgewertet, es muss aber dennoch ein Update-Status angegeben werden, da sonst das xepicur-Format nicht valide ist und beim Harvesten nicht akzeptiert würde. Bei größeren Serverwechseln und Systemwechseln wird die URN-Aktualisierung mit dem neuen Harvester deutlich vereinfacht. Zusätzlichen Komfort für Sie erhoffen wir uns davon, dass nun auch eine Set-Einschränkung möglich ist.
Die ursprüngliche xepicur Dokumentation wird ergänzt mit den Hinweisen, welche Elemente aktuell und in Zukunft tatsächlich ausgewertet werden.
Dies ist die ursprüngliche xepicur Dokumentation. Bei dieser ist die aktuelle Umsetzung beim Ingest in den URN-Service nicht berücksichtigt.
Die ergänzte und kommentierte Referenzbeschreibung finden Sie hier. Zu beachten ist insbesondere: Bitte liefern Sie alle aktuell gültigen URLs mit Ihrer URN. Alle nicht mehr mitgelieferten URLs werden in der URN-Datenbank gelöscht.
Generelle Hinweise
Gültigkeit:
Für Datensätze zur Administration von URNs ist wird xepicur zukünftig nur mehr noch für die Übertragungsart OAI-PMH verbindlich sein.
Hinweise zu Datenstruktur und Syntax
Für den Datensatz ist als Dokumentformat XML verbindlich.
- Elementtypen
- Der Metadatensatz enthält Datenelemente, die nach Elementtypen differenziert in strukturierter Form angegeben sind. Jedes Datenelement wird durch einen Elementbezeichner (tag) eingeleitet, der den Elementnamen angibt.
Beispiel: <identifier>
- Attribute
- Elementbezeichner werden durch Attribute spezifiziert. Es
wurden - gibt sowohl obligatorische Attribute ("type", "scheme", "imt")
und - als auch optionale Attribute ("role", "status" oder "type")
definiert- .
- Beispiel: <identifier scheme="url" role="primary">
Beschreibung des Datenformates, Reihenfolge und Struktur der Elemente
Generelle Struktur
Ein XML-Datensatz besteht aus einem Wurzelelement
<epicur>
und zwei hierarchisch untergeordneten Elementen
<administrative_data>
<record>
Wurzelelement "
...
epicur"
Bezeichnung | epicur | wird ausgewertet |
---|
Attribute | keine |
---|
Unterelemente | - "administrative_data"
- "record"
|
---|
Wiederholbar | nein |
---|
Obligatorisch | ja |
---|
Beschreibung | Das Wurzelelement bildet die äußere Einheit eines XML-Dokumentes. |
---|
Syntax | <epicur> <administrative_data> [...] </administrative_data> <record> [...] </record> </epicur> |
---|
Elementgruppe "administrative_data"
...
Element "administrative_data"
Bezeichnung | administrative_data | Wird zukünftig nicht mehr ausgewertet, da es aber obligatorisch ist, bitte dennoch liefern. |
---|
Attribute | keine |
|
---|
Unterelemente | |
|
---|
Wiederholbar | nein |
|
---|
Obligatorisch | ja |
|
---|
Beschreibung | Das Element dient der Kapselung von Legitimationsdaten, der Spezifizierung des URN-Meldeprozesses, der verwendeten Transferschnittstelle sowie der Art der Rückmeldung. |
|
---|
Syntax | <administrativ_data> <delivery> [...] </delivery> </administrative_data> |
---|
...
Element "authorization"
wird Wird nicht mehr ausgewertet. Bitte nicht mehr verwenden |
Attribute | keine |
---|
|
Unterelemente | - "person_id"
Legitimations_ID einer Person. - "system_id"
Alternative zu "person_id"
|
---|
. Es kann eine ID sein, die nur in Zusammenhang mit maschinengesteuerter URN-Meldung erfolgt | | Beschreibung | Die Informationen dienen der Spezifizierung des URN-Meldeprozesses wie z. B. URN-Erstmeldung oder URL-Aktualisierung, der verwendeten Transferschnittstelle oder der Art der Rückmeldung. |
---|
data> <delivery> <authorization> <persondata> <delivery> <authorization> <person_id>F6000123</person_ |
id> <urnid> <urn_snid>urn:nbn:de:089</urn_ |
snid> </authorization> </delivery><snid> </authorization> </delivery> </administrative_data> |
| Element "update_status"
wird nicht ausgewertet, da es aber obligatorisch ist mit beliebigem Attribut verwendennur noch mit dem Werten "urn_new" oder "url_update_general" verwenden und aktuelle URN/URL-Zuordungen liefern. |
Attribute | "type" mit folgenden Inhalten: |
---|
- "urn_new"
Kennzeichnung der Meldung als "URN-Erstregistrierung". Bei Einbindung in OAI muss bei Neuerstellung von Records "urn_new" angegeben werden.
|
wird nicht ausgewertetwird Wird nicht mehr ausgewertet |
.wird Wird nicht mehr ausgewertet |
.wird Wird nicht mehr ausgewertet |
. |
- "url_update_general"
Aktualisierung von URLs. Dieses Attribut muss angegeben, wenn der Record nur "neue" URLs beinhaltet. Es werden alle registrierten URLs gelöscht und mit den "neuen" URLs ersetzt.
|
wird nicht mehr ausgewertet.bitte verwenden |
- "url_delete"
Dieses Attribut wird gesetzt, wenn eine URL gelöscht werden soll.
|
wird Wird nicht mehr ausgewertet Hinweis: Wenn url_delete NICHT mit einem OAI-Header <header status="deleted">geliefert wird, wird die gelieferte URL erneut in die Datenbank eingetragen. |
- "url_insert"
Dieses Attribut wird gesetzt, wenn eine neue URL hinzugefügt (im Sinne eines URL-Nachmeldeprozesses) werden soll.
|
wird Wird nicht mehr ausgewertet |
. | |
|
Beschreibung | Das Element dient der Spezifizierung der Art des Meldeprozesses. |
---|
|
|
Syntax | <update_status type="urn_new"/> |
---|
Element "transfer"
wird Wird nicht mehr ausgewertet. Bitte nicht mehr verwenden. |
Obligatorisch | nein |
---|
Element "resupply"
wird Wird nicht mehr ausgewertet. Bitte nicht mehr verwenden. |
Obligatorisch | nein |
---|
| ...
Beispiel "administrative_data"
| | | | | | | <update_status type="urn_new"/> |
| |
| </administrative_data> |
[...] |
<epicur> Elementgruppe "record"
Element "record"
wird Wird ausgewertet |
Attribute | keine |
---|
Unterelemente | - "identifier"
Mit dem Element "identifier" werden URN und URL mit unterschiedlichen Attributen erfasst.
|
---|
wird |
| - "resource"
Das Element "resource" mit den Unterelementen "identifier" und "format" dient der Abbildung der Zusammenhänge von URN und URL.
|
---|
wird |
| - "isPartOf"
Das Element "isPartOf" dient der Erfassung von Informationen über URNs und URLs für Teildokumente.
| URN und URLs werden zukünftig noch registriert, die hierarische Struktur aber ignoriert. |
---|
| wird Wird nicht mehr ausgewertet. Bitte nicht mehr verwenden. |
| wird Wird nicht mehr ausgewertet. Bitte nicht mehr verwenden. |
Wiederholbar | ja, aber bei Einbindung des Schemas in OAI 2.0 ist die Kardinalität des Elements "record" auf 1 begrenzt. |
---|
Obligatorisch | ja |
---|
Beschreibung | Das Element "record" kapselt URN-URL-Beziehungen der Objekte. Das Element "record" ist dem Wurzelelement "epicur" direkt untergeordnet. Es ist wiederholbar, um Sammelmeldungen zu generieren. Dieser Fall kann bei der Implementation des URN-Melde- und Updateprozesses über eine separate URN-Schnittstelle eintreten. Bei Einbindung des Schemas in OAI 2.0 ist die Kardinalität des Elements "record" auf 1 begrenzt. |
---|
Syntax | <record> [...] </record> |
---|
Element "identifier"
wird Wird ausgewertet |
Attribute | Mit dem Attribut "scheme" wird URN bzw. URL des Objektes erfasst.
Das Attribut zur Spezifizierung der URN kann folgende Werte annehmen: |
---|
Das Attribut zur Spezifizierung der URL hat folgenden obligatorischen Wert: |
Das Attribut zur Spezifizierung der URN kann folgende Werte annehmen:
"urn"
"urn:nbn"
urn:nbn:de" "urn:nbn:at"
"urn:nbn:ch"
und zusätzlich folgende optionale Attribute: |
wird Wird ausgewertet |
Das optionale Attribut dient zur Kennzeichnung einer URL als Frontpage-URL (landing page) und hat den Wert |
wird Wird zukünftig nicht mehr ausgewertet |
.wird Wird nicht mehr ausgewertet. Bitte nicht mehr verwenden. |
Das optionale Attribut kennzeichnet eine URL als "Master-URL", die beim Resolving zuerst ausgewiesen werden soll. Dieser Fall tritt ein, wenn mehr als eine URL zu einer URN registriert ist. Das Attribut hat folgenden Wert: |
wird wird Wird nicht mehr ausgewertet. Bitte nicht mehr verwenden. |
|
wird Wird nicht mehr ausgewertet. Bitte nicht mehr verwenden. |
Unterelemente | keine |
---|
Wiederholbar | ja |
---|
Obligatorisch | ja |
---|
Beschreibung | Das Element "identifier" enthält Informationen über eine URN und URL. Es wird durch obligatorische sowie mehrere optionale Attribute näher spezifiziert. |
---|
Syntax (Auswahl) | <identifier scheme="urn:nbn:de"> [...] </identifier> oder |
---|
< identifier <identifier scheme="url"> [...] </identifier> oder |
< identifier type="frontpage" role="primary"> [...] </identifier> |
Element "isVersionOf"
Bezeichnung | isVersionOf | wird nicht mehr ausgewertet. Bitte nicht mehr verwenden |
---|
Obligatorisch | nein |
---|
Element "hasVersion"
Bezeichnung | hasVersion | wird nicht mehr ausgewertet. Bitte nicht mehr verwenden |
---|
Obligatorisch | nein |
---|
Element "resource"
Bezeichnung | resource | wird ausgewertet |
---|
Attribute | keine |
---|
|
|
Unterelemente | Mit dem Element "identifier" wird die URL des Objektes erfasst. Aus diesem Grund muss das Attribut "scheme"="url" verwendet werden. ( |
---|
s. siehe Element "identifier") | wird ausgewertet |
Das Element "format" dient der Erfassung des MimeTypes des Objektes. | wird ausgewertet |
Wiederholbar | ja |
---|
Obligatorisch | nein |
---|
Beschreibung | Das Element "resource" kapselt die Unterelemente "identifier" mit dem Attribut "scheme"="url" und "format" dient der Erfassung der URL und des MimeTypes (Dateiformat) des Objektes. |
---|
Syntax | <resource> <identifier scheme="url"> [URL des Objektes] </identifier> <format scheme="imt"> [MimeType des Objektes] |
---|
<Element "format"
Bezeichnung | format | wird ausgewertet |
---|
Attribute | Das Element "format" hat folgendes Attribut: "imt", das als Wert den MimeType des Objektes enthält. |
---|
| |
|
Beschreibung | Das Element "format" dient der Erfassung des MimeTypes (Dateiformates) eines Objektes | . |
---|
Syntax | <format scheme="imt" |
---|
> > [MimeType des Objektes] </format> |
Element "isPartOf"
Bezeichnung | isPartOf | Zukünftig werden URN und URL registriert, die hierarchische Struktur aber wird ignoriert. |
---|
Attribute | keine |
---|
Unterelemente | |
---|
Wiederholbar | ja |
---|
Obligatorisch | nein |
---|
Beschreibung | Das Element "isPartOf" kapselt Informationen zu URNs und URLs von Teilobjekten. |
---|
Syntax |
---|
<isPartOf> <isPartOf> [...] </isPartOf> |
Beispiel "record"
<epicur> |
| <administrative_data> [...] | | |
| | <update_status type="urn_new"/> |
| [...] </administrative_data> | | |
| <record> |
| | <identifier scheme="urn:nbn:de" |
>urn3321752945<3321752945 </identifier> |
| | <resource> |
| | | <identifier scheme="url" |
typefrontpage