ACHTUNG: Ab Montag 3. März 2014 sollen - bis auf wenige Ausnahmen - keine Protypen mehr in ILTIS erfasst werden.

1. Was sind Protypen?

Protypen wurden bisher in ILTIS als Ersatzzeichen verwendet, wenn

  • das eigentliche Zeichen weder über die Normaltastatur noch über das Diakritenfenster erfasst werden konnte,
  • eine Kollision von Text- und Steuerzeichen bestand oder
  • die Hoch- und Tiefstellung von Zeichen in den bibliografischen Produkten der DNB erfolgen sollte.
2. Warum werden Protypen abgeschafft?

Protypen werden unter anderem abgeschafft, weil

  • Protypen in UTF-8-Zeiten nicht mehr benötigt werden, da alle Zeichen darstellbar sind.
  • in fast allen Produkten der DNB eine Umwandlung der Protypen in das eigentliche Zeichen nicht mehr erfolgt.
  • die Suche nach Inhalten bei denen Protypen vorkommen problematisch ist.
  • die Erfassung der Protypen umständlich ist
3. Was wurde schon getan?

Bereits im Jahr 2006 wurde ein Konzept für die Bereinigung der Protypen erstellt. Die erste Stufe bestand darin, ca. 90 Protypen abzuschaffen, die nicht mehr erfasst werden durften oder die inzwischen über das WinIBW-Diakritenfenster erfasst werden konnten. Die Bereinigung der restlichen ca. 100 Protypen (inklusive griechischer Zeichen) wurde auf Stufe 2 verschoben, da hierfür bestimmte Rahmenbedingungen vorausgesetzt werden mussten:

  • Der Katalogisierungs-Client WinIBW musste den vollständigen UTF8-Zeichensatz unterstützen
  • Die Verfahren und Arbeitsabläufe für den Datenimport nach ILTIS und den Datenexport von ILTIS mussten ebenfalls UTF8-fähig sein.

Der erste Punkt wurde mit Einführung der WinIBW3 in 2012 umgesetzt, die Bearbeitung des zweiten Punktes erfolgte im Zusammenhang mit der Einführung der originalschriftlichen Katalogisierung in GND und ZDB abschließend in 2013.

Im 1. Quartal 2014 möchten wir somit den nächsten großen Schritt tun, indem wir alle Protypen, ausgenommen die im nächsten Punkt angegebenen Protypen, in automatischen Verarbeitungen bereinigen. (Einzelheiten siehe 7. Bereinigung der Protypen)

4. Welche Protypen werden weiterhin erfasst? 

Weiterhin als Protypen erfasst werden müssen die folgenden Zeichen, da sie als Steuerzeichen für die Nichtsortierung von Textinhalten verwendet werden und die Bearbeitung mit erhöhtem Klärungs- und Koordinationsbedarf verbunden ist.

ZeichenProtypeBegründungBeispielHinweise
Klammeraffe "@"_372Das Zeichen Klammeraffe "@" wird als Steuerzeichen verwendet.
Text vor dem Zeichen wird nicht indexiert.
Für das Zeichen Klammeraffe innerhalb einer Kategorie wird die Protype verwendet.
LinkACHTUNG: Die Protype wird in der GND nicht erfasst.


geschweifte Klammer links "{"_424

Das Zeichen geschweifte Klammer links "{" wird als Steuerzeichen verwendet.
Das Wort, welches dem Zeichen folgt wird nicht indexiert.
Für das Zeichen geschweifte Klammer links innerhalb einer Kategorie wird die Protype verwendet.

 

Link

ACHTUNG: Die Protype wird in der ZDB nicht erfasst!
Als Ersatzzeichen für die geschweifte Klammer links "{"
wird in der ZDB die
runde Klammer links "(" erfasst.

ACHTUNG: Die Protype wird in der GND nicht erfasst. 

Die Steuerzeichen werden bei den genannten Beispielen nur in der Pica+-Portaldarstellung oder in der WinIBW angezeigt.

5. Wie werden die Zeichen, für die bisher Protypen verwendet werden, zukünftig erfasst?

Die zukünftige Erfassung der Zeichen, für die bisher Protypen verwendet wurden, kann auf unterschiedliche Weise erfolgen:

  1. Eingabe über die Tastatur
  2. Verwendung der WinIBW-Sonderzeichenleiste (siehe auch 6. Änderungen der WinIBW-Sonderzeichenleiste)
  3. Tastenkombinationen für diakritische Zeichen
  4. Verwendung der Windows-Zeichentabelle, z.B. in Windows 7: Start / Ausführen... / Öffnen: charmap
    (in der neuen WinIBW-Version 3.7 kann die Windows-Zeichentabelle bequem per Icon aufgerufen werden!)
  5. Verwendung der virtuellen Bildschirmtastatur (in Kombination mit 3.)
  6. Umschaltung der Windows-Tastatur auf ein anderes Eingabegebiet (und ggf der Verwendung von Tastaturschablonen)
  7. Copy&Paste (=Kopieren und Einfügen) aus anderen Quellen (Webseiten, Worddokumente, Emails)

Die bisherigen Protypen für Hoch- und Tiefstellung werden ersatzlos gestrichen, d.h. die entsprechenden Buchstaben und Ziffern werden einfach auf gleicher Ebene mitgeschrieben.
Sonderzeichen, die gleichzeitig auch als Steuerzeichen für Unterfelder verwendet werden, müssen ohne führende Leerzeichen eingegeben werden, z.B. Gleichheitszeichen.

Detaillierte Informationen zu den einzelnen zu bearbeitenden Protypen und eine Liste der entsprechenden diakritischen Zeichen
(z.B. für das zukünftige Copy&Paste) können Sie der folgenden Wiki-Seite entnehmen: Protypen

6. Änderungen der WinIBW-Sonderzeichenleiste

Die folgenden Änderungen werden in der neuen WinIBW-Version 3.7 für DNB in der Sonderzeichenleiste für die vereinfachte Eingabe von Zeichen, die bisher als Protypen erfasst wurden, umgesetzt:

 - Das Zeichen © = Copyright wurde in die Sonderzeichenleiste integriert.
 - Weitere griechische Zeichen wurden ergänzt und in der Sonderzeichenleiste gruppiert: Alpha, Beta, Delta, Gamma, My, Pi, Omega

ACHTUNG: Damit die aktualisierte Diakritenleiste angezeigt wird, muss einmalig die Funktion Reload Diacritics im Menü "Optionen" aufgerufen werden!

Die WinIBW-Version 3.7 steht bereits jetzt in der WinIBW-Testumgebung der DNB zur Verfügung. Kolleginnen und Kollegen, die die neue Sonderzeichenleiste dringend benötigen, können bereits jetzt die neue WinIBW-Version einsetzen, da ein Zugriff auf das ILTIS-Produktionssystem mit dieser Version möglich ist. Es ist geplant die WinIBW am 01.04.2014 in die produktive WinIBW-Umgebung zu übernehmen.

7. Bereinigung der Protypen

Die Bereinigung der Protypen wird ab Mitte März 2014 erfolgen. Um sicherzustellen, dass keine falschen Textinhalte irrtümlich bearbeitet werden (z.B. URLs), sind bestimmte Kategorien und die Exemplardatenkategorien von der Bearbeitung ausgenommen (siehe auch Protypen).

Zur Vorbereitung wird die Datenbank des ILTIS-Approvalsystems am 11. März 2014 mit den aktuell gesicherten Daten des ILTIS-Produktionssystems neu aufgebaut. Darüber werden wir gesondert ausführlich informieren.

Da bei der Bereinigung der Protypen ca. 150.000 Datensätze angefasst werden (ca. 2.000 GND-Datensätze darunter) wird die Verarbeitung in Kontingenten von ca. 10.000 Datensätzen erfolgen. Einzelne Kontingente können für die Bereinigung der Protype für Copyright und die Bereinigung der griechischen Klein- und Großbuchstaben gebildet werden. Die Bearbeitungen der Protypen für das Gradzeichen, die Hoch- und Tiefstellung und die sonstigen Zeichen müssen wahrscheinlich in mehrere Kontingente aufgeteilt werden. Ggf. werden auch Kontingente aufgrund der Satzart gebildet. Nach erfolgreichem Test der Bereinigung eines Kontingentes im ILTIS-Approvalsystem wird die Änderung dieses Kontingentes zeitnah im ILTIS-Produktionssystem nachvollzogen.

Eine Tabelle mit den geplanten und durchgeführten Verarbeitungen wird im März 2014 auf der bekannten Wiki-Seite Protypen ergänzt. 

Nach Abschluß der Bereinigungsläufe ca. gegen Ende des 2. Quartals 2014 wird ein Kontrolllauf durchgeführt, um ggf. noch stehengebliebene Protypen zu ermitteln.

Weitere Hinweise und konkrete Beispiele finden Sie in den Aktuellen Informationen zu den Datendiensten vom 27.02.2014, Datendienst und Schnittstellen der Deutschen Nationalbibliothek: Protypenbereinigung im Datenbestand – Zeitplan und Datendienst und Schnittstellen der Deutschen Nationalbibliothek: Protypenbereinigung im Datenbestand – Zeitplan: Zweiter Schritt

 

 

 

  • Keine Stichwörter