Im Rahmen des PETRUS-Sz. 3 wurde unter Einsatz der PICA-Match-und-Merge-Software ein automatisches Verfahren zur Erkennung von parallelen Print- und Onlineausgaben entwickelt.

Ziele sind:

  1. die automatische Verknüpfung von parallelen Print- und Onlineausgaben und
  2. die maschinelle Übernahme bereits vorhandener Inhaltserschließungsdaten und Normdatenverknüpfungen in die Titelaufnahmen der entsprechenden parallelen Ausgaben.

Die Datengrundlage für den regelmäßig stattfindenden Abgleich bildet der gesamte ILTIS-Bestand  an Print- und Online-Monografien. Die Zeitschriften-Datensätze sind ausgenommen, da diese nach dem Zeitschriften-Regelwerk ZETA bereits parallele Verknüpfungen zwischen Ausgaben in unterschiedlichen Materialarten (darunter auch Online-Ausgaben) enthalten.

Implementiert werden zwei Prozesse: einer für die Oaf-Sätze nach ihrem ILTIS-Import und ein zweiter für Aa-/AF-Sätze nach Abschluss ihrer intellektuellen Bearbeitung. Für alle bereits in ILTIS vorhandenen NP-Datensätze (Oa, Oc, OF, Oaf) wird das Verfahren rückwirkend einmalig durchgeführt.

Die Prozesse sehen so aus, dass zuerst mittels eines Datenabgleichs (Match) nach einem passenden Pendant gesucht wird. Werden zwei parallele Datensätze gefunden, können Normdatenverknüpfungen (PND, GKD) übernommen und Inhaltserschließungsdaten wechselseitig ausgetauscht werden.

Nach erfolgreichem Match sind in beiden Datensätzen folgende Felder von Neuerungen betroffen:

Pica3

Pica+

Neuerung bzw. Aktion

0600

017A

Vergabe eines neuen Codes:
- pb (parallele Ausgabe bestätigt): wird vergeben, wenn zwei Datensätze verknüpft wurden
- pn (parallele Ausgabe nicht bestätigt): wird vergeben, wenn zwei Datensätze zwar nicht verknüpft wurden, aber aufgrund ihrer Ähnlichkeit Normdatenverknüpfungen und Inhaltserschließungsdaten untereindander ausgetauscht haben könnten

30XX

028X

Gegenseitiger Abgleich der verbalen Personeneinträge und ggf. Übernahme einer PND-Verknüpfung in das jeweilige Pendant

31XX

029X

Gegenseitiger Abgleich der verbalen Körperschaftseinträge und ggf. Übernahme einer GKD-Verknüpfung in das jeweilige Pendant.
Besonderheit: Fehlt in einem Oaf-Satz bei der Ablieferung der verbale Körperschaftseintrag, wird der verbale Eintrag oder die GKD-Verknüpfung aus der parallelen Ausgabe (pb-Code) übernommen.

4243

039D

Gegenseitige Verknüpfung der parallelen Datensätze (Vergabe des pb-Codes in 0600) mit entsprechendem Vortext:
- Online-Ausg.!IDN des parallelen Titels!
- Druckausg.!IDN des parallelen Titels!

4700

047A

Kurzer Kommentar entsprechend des in 0600 vergebenen Codes:
- |PE|*Parallelverknüpfung wurde automatisch erstellt (bei pb-Code)
- |PE|*Dieser Datensatz kann Normdatenverknüpfungen und Inhaltserschließungsdaten enthalten, die von IDN … übernommen wurden (bei pn-Code)

5050

045E

Die DNB-Sachgruppe wird in den O*-Datensatz übertragen, auch wenn das Feld bereits besetzt ist. Das Feld 5050 ist wiederholbar.
In den A*-Datensatz wird die DNB-Sachgruppe nur übernommen, wenn noch keine 5050 vorhanden ist. Damit gibt es im Print-Datensatz immer nur eine 5050 (oder keine).
Die übernommene Sachgruppe wird in ein weiteres Feld 5050 geschrieben, ergänzt durch $Ep$D<Datum>. Das kleine p in dem neu geschaffenen Unterfeld $E ist der Indikator dafür, dass der Feldinhalt aus einer parallelen Ausgabe übernommen wurde. Das Datum zeigt an, wann die Sachgruppe übertragen wurde. Über Sz. 3 hinaus sind im Unterfeld $E weitere Belegungen möglich: a für abgelieferte Sachgruppen oder m für maschinell erstellte Sachgruppe.

51XX

041A/XX

RSWK-Ketten bzw. -Folgen werden wechselseitig übernommen, sofern sie im jeweiligen Pendant nicht bereits zu finden sind.
Besonderheit: Formschlagwörter, die die Materialart beschreiben, werden nicht in die parallele Ausgabe übernommen.

540X-544X

045F-045J/04

DDC-Notation(en) werden wechselseitig übernommen, sofern sie im jeweiligen Pendant nicht bereits zu finden sind.

5450
5530
5550
5560

045Z
044F
044K
044N

Inhaltserschließungsdaten aus Fremd- und Altdaten werden wechselseitig übernommen, sofern sie im jeweiligen Pendant nicht bereits zu finden sind. Besonderheit: Wenn das Feld 5560 materialartspezifische Informationen enthält, die mit [VLB-PF], [VLB-PG], [VLB-WI], [VLB-WN] oder [Produktform] eingeleitet werden, oder die Formulierung „für Harvesting bereitgestellt“ aufweist, werden die Feldinhalte nicht in den parallelen Datensatz übernommen.

  • Keine Stichwörter