Wir beginnen am 24.03.2010 im DNB-Hauptbestand des ILTIS-Produktionssystems mit der abschließenden Phase der maschinellen Integration des Leipziger Altdatenbestandes aus den Jahren 1974 – 1989.mehr...

Sie betrifft im Wesentlichen Bandsätze von begrenzt mehrbändigen Werken, Zeitschriften und Schriftenreihen aber auch einige Monografien (insbesondere Karten), zumeist also [AKM][Ff]-Sätze aber auch [AKM]a-Sätze. Die davon „mittelbar“ betroffenen übergeordneten Sätze des DNB-Hauptbestandes - darunter auch Zeitschriften und Schriftenreihen der ZDB und der DNB - werden nicht modifiziert.

Mit Hilfe des PICA-Programms Match&Merge werden dabei zunächst nur neue 1. Leipziger Exemplarsätze an solche Frankfurter Titeldatensätze angefügt, die bisher noch kein 1. Leipziger Exemplar besaßen und zu denen ein Satz des Leipziger Altdatenbestandes als „ausreichend identisch“ befunden wurde. Neue – eventuell auch dublette - Titeldatensätze werden erst später übernommen. Die angefügten Exemplarsätze tragen in Kategorie 7001 den Selektionsschlüssel „o“, das Kennzeichen der Leipziger Altdaten. Es gibt natürlich schon relativ viele solche Exemplarsätze, da diese Integration schon längere Zeit läuft. Sie soll mit dieser Phase nun aber weitgehend zum Abschluss gebracht werden. Sie wird voraussichtlich bis etwa 31.05.2010 dauern.

Das Verfahren wird „etappenweise“ ablaufen: Am Anfang steht ein ISBN-Abgleich mit der Zusammenführung der besonders ähnlichen Sätze und am Ende ein Abgleich anhand von Sachtitelangaben mit der Zusammenführung der gerade noch ausreichend ähnlichen Sätze. Als "ausreichend identisch" gelten Datensätze, wenn folgende Kategorien identischen bzw. sehr ähnlichen Inhalt haben: Erscheinungs- bzw. Bearbeitungsjahr, ISBN, Umfang, Sachtitel (einschließlich Gesamttitel und Bandzählung aber ohne „expandierte“ Sachtitel der per IDN verknüpften übergeordneten Sätze), Verfasser- bzw. Urheber, Preis, Abmessung und Dissertationsvermerk. Bei Karten kommen noch Kartenangaben und bei den Kartenmonografien noch die Verlagsangaben hinzu.

Es wird z.B. passieren dass einem Leipziger Kf-Band ein Frankfurter Af-Band oder eine Aa-Monografie zugeordnet wird, da durch Unterschiede bei der Erfassung und Überführung der Leipziger bzw. Frankfurter Altdaten ins PICA-Format nicht immer der gleiche bibliografische Typ entstanden ist. Es wird natürlich Wert darauf gelegt, dass formale Differenzen überbrückt und die wirklich zugehörigen Frankfurter Sätze mit einem Leipziger Exemplar ergänzt werden. Trotz allen Bemühens werden natürlich auch Zuordnungsfehler anfallen, deren Zahl wird aber so gering wie möglich gehalten wird. (Es kann z.B. passieren, dass es zur 1.Auflage einer Publikation noch im gleichen Jahr einen unveränderten Nachdruck gibt. Wenn in Leipzig und Frankfurt nur eine dieser zwei „1. Auflagen“ vorliegt, unglücklicherweise aber nicht die gleiche, ist die Wahrscheinlichkeit eines Zuordnungsfehlers natürlich sehr groß.) Zur Optimierung der Ähnlichkeitsbewertung wurden im Vorfeld umfangreiche Stichproben angefertigt und ausgewertet. Sätze mit „zu wenig“ bzw. „zu kurzen“ miteinander vergleichbaren Angaben (z.B. „1.“ als Bandbezeichnung) werden nicht maschinell zugeordnet, da bei ihnen ohne die Einbeziehung der übergeordneten Sätze die erforderliche Treffsicherheit maschinell nicht erreicht werden kann. Sie werden dann als zusätzliche – oft leider doch dublette – Sätze übernommen und können „im Ereignisfall“ manuell zusammengeführt werden.) Der überwiegende Teil der Daten kann jedoch maschinell zusammengeführt werden.

Im ILTIS-Backupsystem befindet sich eine vor dem Start dieser Phase gebildete unveränderte Kopie des Leipziger Altdatenbestandes. Im Falle des Auffindens von in dieser Phase entstandenen „Ungereimtheiten“ können die Ausgangssätze dort jederzeit recherchiert und zur Klärung der Sachlage herangezogen werden.

  • Keine Stichwörter