1. Allgemeine Beschreibung

Ursprüngliche Beschreibung des Programms von Ingo Seiler: V:\Iltis\Doku\CBS\Entwicklung\Doku\Offline\ddbsetverw.doc

In Kategorie 012 (008B Pica+ = Nutzungskennzeichen) eines Normdatensatzes der PND oder SWD der GND soll vermerkt werden, welcher Art etwaige verknüpften Titel sind und in welchem Segment sie zu eben diesem Normdatensatz verknüpft sind. Die Kategorie ist mit Index COD/NC indexiert. Im Portal können damit die zu einem Bestand gehörigen Normdaten gefiltert werden.

Hinweise zur Besetzung gibt es im GND-Erfassungsleitfaden für das Feld 012/008B, Nicht alle dort gelisteten Nutzungskennzeichen sollen maschinell geetzt werden, sondern nur diejenigen, die unten gelistet sind.

2. Welche Datensätze werden verarbeitet?

Es werden die in der vergangenen Woche geloggten Titeldaten-Updates verarbeitet. Zu diesen werden alle verknüpften Normdatensätze der PND und SWD überprüft und ggf. korrigiert. Damit wird ein möglichst aktueller Stand für die in der gleichen Nacht abgezogenen Änderungsdienste PND und SWD hergestellt.

3. Ablauf der Verarbeitung - Status quo prä-GND

SWD
Wenn der selektierte Titeldatensatz über SWD-Verknüpfungen in den Kategorien 51XX oder 5540 verfügt, so wird im verknüpften SWD-Datensatz geprüft, ob die Kategorie 012 bereits vorhanden ist. Wenn das Nutzungskennzeichen w noch nicht vorhanden ist, dann wird es in Kategorie 012 ergänzt

PND
Wenn der selektierte Titeldatensatz über PND-Verknüpfungen in den Kategorien 30XX, 45X1, 45X2 oder 51XX verfügt, so wird im verknüpften PND-Datensatz geprüft, ob die Kategorie 012 bereits vorhanden ist. Je nach Bestandszugehörigkeit des Titeldatensatzes wird das entsprechende Nutzungskennzeichen in Kategorie 012 ergänzt:

Bestand

Kennzeichen

Satzart

Verknüpfungfeld

DNB-Formalerschließung

v

(Standard)

30XX, 31XX, 45X1, 45X2

DNB-Sacherschließung

w

(Standard)

51XX, 5550 (bereits implementiert?)

DMA

m

4. Pos. m

30XX, 45X1, 45X2

DEA

e

4. Pos. e

30XX, 45X1, 45X2

4. Anforderungen, Vorgaben, Dokumente & Diagramme

a. In Zukunft soll das Programm die Nutzungskennzeichen nach folgendem Schema vergeben:

Bestand

Kennzeichen

Satzart

Verknüpfungfeld

DNB-Formalerschließung

v

alle DNB-Datensätze, inkl. DMA, DBSM, DEA; bei ZDB nur wenn DNB-Bestand vorhanden

30XX, 31XX, 45X1, 45X2, 45X3, 45X4, 4050/033H, 3210/022A

DNB-Sacherschließung

w

alle DNB-Datensätze, inkl. DEA, DEA; bei ZDB nur wenn DNB-Bestand vorhanden

51XX, 5550, 5540, 5590

DMA

m

4. Pos. m

30XX, 31XX, 3210/022A

DEA

e

4. Pos. e

30XX, 31XX, 45X1, 45X2, 45X3, 45X4

DBSMo006U $0 beginnt mit "04,P01" oder 017A enthält ein $a mit "yy"
30XX, 31XX, 45X1, 45X2, 45X3, 45X4, 4050/033H, 3210/022A, 51XX, 5550, 5540, 5590 (die selben Felder wie oben v + w zusammen, plus 5590)

ZDB

z

4. Pos. z

30XX, 31XX, 51XX, 4050/033H

26.08.2015: Entscheidung IE (Scheven) / DBSM (Manecke), dass in 5590 verknüpfte Sätze nicht "w" erhalten, sondern nur "o" (s. http://jira.dnb.de/browse/ILT-2899)

Die Entität des verknüpften GND-Satzes ist irrelevant, alle Entitäten Tb, Tf, Tg, Tn, Tp, Ts und Tu sollen das entsprechende Nutzungskennzeichen des Feldes erhalten, in dem sie verknüpft sind. Normdatensätze können mehrere Nutzungskennzeichen (in wiederholten $a von 012/008B) erhalten, z. B. "v" für DNB- und "z" für ZDB-Nutzung.

b. Retrospektiv - GKD, PND, SWD Ablauf: Retrospektive Läufe

Jeder GND-Datensatz wird auf Verknüpfungen zu Titeldatensätzen geprüft. Die Titeldatensätze werden daraufhin überprüft, in welchem Feld die GND-Verknüpfung vorhanden ist und von welcher Satzart der Titel ist. Anhand der obigen Tabelle wird dann das entsprechende Nutzungskennzeichen in Kategorie 012 des Normdatensatzes ergänzt, falls es noch nicht vorhanden ist. Ist ein Nutzungskennzeichen vorhanden, aber keine entsprechende Verknüpfung mehr zu einem Titel, wird das Nutzungskennzeichen aus dem Normdatensatz entfernt. Die Notwendigkeit einer Entfernung kann nur bei einem retrospektivem, vom GND-Satz ausgehenden Lauf festgestellt werden, nicht bei einem regelmäßigen wie unter 4.c beschriebenen Lauf.

GKD: Jeder GKD-Datensatz wird auf Verknüpfungen zu Titeldatensätzen geprüft. Die Titeldatensätze werden daraufhin überprüft, in welchem Feld die GKD-Verknüpfung vorhanden ist und welcher Materialart der Titel ist. Anhand der obigen Tabelle wird das entsprechende Verwendungskennzeichen in Kategorie 012 ergänzt, falls es noch nicht vorhanden ist.

Unter Umständen können so zwei Nutzungskennzeichen vergeben werden: "z" für ZDB und "v" für DNB-Formalerschließung, falls auch DNB-Bestand vorhanden ist. (s. http://jira.d-nb.de/browse/ILT-2317 und Email von Antje Kubbernuß 22.6.2010))

SWD/PND: Anhand einer IDN-Liste werden SWD- und PND-Datensätze auf Verknüpfungen zu ZDB-Sätzen geprüft. Die Normdatensätze erhalten das Nutzungskennzeichen "z" und zusätzlich "v" (PND) bzw. "w" (SWD), falls auch DNB-Bestand am ZDB-Datensatz hängt.

c. Ablauf: Produktiv regelmäßig in der GND

Nach der produktiven Einführung der GND werden alle vorhandenen Entitäten (Tb Tf Tg Tn Tp Ts Tu) regelmäßig nach dem gleichen Schema wie unter 4.a beschrieben behandelt.

Beim regelmäßigen Lauf des Programms wird nicht von den Normdatensätzen ausgegangen, sondern von den Titeldatensätzen, die laut Logdatei seit dem letzten Lauf geändert wurden. (Die laut Log geänderten Normdatensätze können nicht als Grundlage genommen werden, da sie bei einer Verknüpfung ja nicht geändert werden müssen, also u.U. gar nicht im Log erscheinen.) Es werden dazu alle mit dem Titel verknüpften Normdatensätze aufgerufen und nach dem Schema der Tabelle unter 4.a bearbeitet. Entfernungen von bereits vergebenen Nutzungskennzeichen können hier nicht durchgeführt werden, da der entsprechende GND-Satz ja nicht mehr mit dem Titeldatensatz verknüpft ist und daher auch nicht aufgerufen werden kann. Dies ist also nur bei einem retrospektiven Lauf wie unter 4.b beschrieben möglich.

d. Zeitplanung

Die Häufigkeit der regelmäßigen Läufe (wöchentlich oder öfter) sowie von Gesamtläufen, die auch nicht mehr zutreffende Nutzungskennzeichen wieder entfernen können, muss noch konzipiert werden.

5. Wie sind die Laufzeiten?

Dieser Teil muss noch aktualisiert werden, wenn das Verfahren für die GND-Sätze produktiv läuft.

Das Programm läuft derzeit Mittwochabends. Die Dauer der Verarbeitung variiert stark, je nachdem wieviele Titeldatensätze überprüft und wieviele Verknüpfungen darin enthalten sind. Die kürzeste Verarbeitungszeit seit April 2011 dauerte 2 min, die längste 5 h 51 min, die Durchschnittsdauer sind ca. 2 h.

6. Ansprechpartner

  • Anforderungen: Stefan Grund (bzw. FA: AfS)
  • Programmierung: Kirsten Tröller
  • Durchführung der Läufe: Produktionssteuerung

7. Tests der Routine (IT-intern)

Seitenanfang

  • Keine Stichwörter

5 Kommentare

  1. zu 4.

    Anforderung GKD
    "e" darf in der GKD nicht maschinell vergeben werden. (Hier setzt eine Onlineroutine zur Bildung des Sortiernamens für das DEA auf - dieser muss intellektuell gebildet und darf später nicht mehr verändert werden.)

    Anforderung GKD, PND, SWD
    Die Routine muss um die Vergabe von "z" (ZDB) erweitert werden.

  2. Anonym sagt:

    Müsste nicht eigentlich auch das DBSM mit 012 o berücksichtigt werden?

    Grüße

    B Bernhard

    1. Liebe Fr. Bernhardt,

      s. meine Mail vom 10.2.:

      bisher wurden bei der Statistik die Fragen fürs DBSM nie abgefragt. Wieso das so ist, kann ich nicht sagen. Vielleicht interessieren nur die DNB-Gesamtzahlen? [...]

      Das Programm zur Vergabe der Nutzungskennzeichen berücksichtigt das DBSM auch nicht, die DBSM-KollegInnen vergeben das Zeichen händisch. Im Gegensatz zum DMA oder DEA kann man ja auch nicht an der Materialart erkennen, dass es sich bei mit GND-Daten verknüpften Titel-Datensätzen um DBSM-relevante handelt. Da müsste man eigentlich bei den Titel immer in die Exemplarsätze gehen und das dort überprüfen. Das würde die bisherige Logik des Programms sehr ändern, oder wir müssten das Bestandskonzept überdenken. Bevor wir solche Baustellen aufmachen, würde ich aber gerne erst wissen, ob die Zahlen für die statistischen Erhebungen wirklich relevant sind.

  3. Eimer, Sarah sagt:

    Lieber Stefan,

    wenn die Nutzungskennzeichen für die Zuordnung der Normdaten zu den Reitern im Portal genutzt werden sollen, wäre die DBSM-Kennzeichnung schon erforderlich (eigener Reiter Museum). Die DBSM-Daten haben diverse Kennzeichnungen im Titeldatenbereich (zB ein Pseudoheft). Können solche Inhalte ohne größeren Aufwand ausgewertet werden?

    Frage an Meyer, Anke: was sagst Du?

    Viele Grüße
    Sarah

  4. Anonym sagt:

    Liebe Alle, ja ein Kennzeichen der Nutzung des DBSMs ist äußert wünschenswert Neben den Pseudoheften werden in Zukunft auch Qd-Sätze verwendet