Im Rahmen des PETRUS-Sz. 3 wurde unter Einsatz der PICA-Match-und-Merge-Software ein automatisches Verfahren zur Erkennung von parallelen Print- und Onlineausgaben entwickelt.
Ziele sind:
- die automatische Verknüpfung von parallelen Print- und Onlineausgaben und
- die maschinelle Übernahme bereits vorhandener Inhaltserschließungsdaten und Normdatenverknüpfungen in die Titelaufnahmen der entsprechenden parallelen Ausgaben.
Die Datengrundlage für den regelmäßig stattfindenden Abgleich bildet der gesamte ILTIS-Bestand an Print- und Online-Monografien. Die Zeitschriften-Datensätze sind ausgenommen, da diese nach dem Zeitschriften-Regelwerk ZETA bereits parallele Verknüpfungen zwischen Ausgaben in unterschiedlichen Materialarten (darunter auch Online-Ausgaben) enthalten.
Implementiert werden zwei Prozesse: einer für die Oaf-Sätze nach ihrem ILTIS-Import und ein zweiter für Aa-/AF-Sätze nach Abschluss ihrer intellektuellen Bearbeitung. Für alle bereits in ILTIS vorhandenen NP-Datensätze (Oa, Oc, OF, Oaf) wird das Verfahren rückwirkend einmalig durchgeführt.
Die Prozesse sehen so aus, dass zuerst mittels eines Datenabgleichs (Match) nach einem passenden Pendant gesucht wird. Werden zwei parallele Datensätze gefunden, können Normdatenverknüpfungen (PND, GKD) übernommen und Inhaltserschließungsdaten wechselseitig ausgetauscht werden.
Nach erfolgreichem Match sind in beiden Datensätzen folgende Felder von Neuerungen betroffen:
Pica3 |
Pica+ |
Neuerung bzw. Aktion |
---|---|---|
0600 |
017A |
Vergabe eines neuen Codes: |
30XX |
028X |
Gegenseitiger Abgleich der verbalen Personeneinträge und ggf. Übernahme einer PND-Verknüpfung in das jeweilige Pendant |
31XX |
029X |
Gegenseitiger Abgleich der verbalen Körperschaftseinträge und ggf. Übernahme einer GKD-Verknüpfung in das jeweilige Pendant. |
4243 |
039D |
Gegenseitige Verknüpfung der parallelen Datensätze (Vergabe des pb-Codes in 0600) mit entsprechendem Vortext: |
4700 |
047A |
Kurzer Kommentar entsprechend des in 0600 vergebenen Codes: |
5050 |
045E |
Die DNB-Sachgruppe wird in den O*-Datensatz übertragen, auch wenn das Feld bereits besetzt ist. Das Feld 5050 ist wiederholbar. |
51XX |
041A/XX |
RSWK-Ketten bzw. -Folgen werden wechselseitig übernommen, sofern sie im jeweiligen Pendant nicht bereits zu finden sind. |
540X-544X |
045F-045J/04 |
DDC-Notation(en) werden wechselseitig übernommen, sofern sie im jeweiligen Pendant nicht bereits zu finden sind. |
5450 |
045Z |
Inhaltserschließungsdaten aus Fremd- und Altdaten werden wechselseitig übernommen, sofern sie im jeweiligen Pendant nicht bereits zu finden sind. Besonderheit: Wenn das Feld 5560 materialartspezifische Informationen enthält, die mit [VLB-PF], [VLB-PG], [VLB-WI], [VLB-WN] oder [Produktform] eingeleitet werden, oder die Formulierung „für Harvesting bereitgestellt“ aufweist, werden die Feldinhalte nicht in den parallelen Datensatz übernommen. |