Versionen im Vergleich

Schlüssel

  • Diese Zeile wurde hinzugefügt.
  • Diese Zeile wurde entfernt.
  • Formatierung wurde geändert.

...

Interessen im Bereich Formaterkennung

Leitfragen

  • Was versprechen Sie sich von der Teilnahme in der AG?
  • Welche Formate und/oder Tools sind für Sie besonders interessant?
  • Welche Aufgaben sind für Sie interessant (Testen von Tools, Zuarbeit zu Pronom, (Weiter-)entwickeln von nützlichen Tools?

Yvonne Friese (ZBW):

  • Zuarbeit zur Pronom-Formatbibliothek (bisher nicht bekannte Formate) - hier besteht Interesse, aber noch keine Erfahrung!
  • Erweiterungen der DROID-Funktionalitäten (Ausgabestatistik)
  • Erweiterungen der JHOVE-Fähigkeiten, speziell zu PDF-Dateien (Informationen zu Fehlermeldungen, bisher nicht erkannte Fehler), dies ist u. a. ein Thema des geplanten PDF-Hackathon an der ZBW Hamburg
  • Hilfsprogramme und Plugins für die LZA / den Umgang mit Dateiformaten (Passwortschutzerkennung bei PDFs, Validierung, Qualitätskontrolle nach Migrationsaktionen)
  • Edit: Die Idee von Herrn Kramski, Test-Sets zu erstellen (oder bereits vorhandene zu recherchieren) wäre auch für mich nützlich. So etwas ist mir bisher nur für PDF-Dateien bekannt und da reicht die Vielfalt jetzt für meine Bedürfnisse auch noch nicht aus (immerhin sammle ich aber bereits "böse" PDF-Dateien). Zip-Files nutzen wir für die CD-Archivierung, Erfahrungen sind aber bisher begrenzt.

 

Georg Büchler, Claire Röthlisberger (KOST):

  • Wir hoffen, dass diese AG zunächst als Forum für grundsätzliche Diskussionen dienen kann:
    • Welche Art der Formaterkennung brauchen wir? Wie detailliert soll sie sein? Wie ist das Zusammenspiel mit der Formatvalidierung?
    • Welches sind die konzeptionellen Limiten der aktuellen Ansätze und Tools zur Formaterkennung?
    • Wie können diese Limiten überwunden werden?
  • Interessant sind für uns in erster Linie die für die Archive idealen oder akzeptablen Formate: PDF/A-1 und -2, TIFF, JPEG, JPEG2000, PNG, MP3, WAV, MPEG4, SIARD (siehe http://www.kost-ceco.ch/wiki/whelp/KaD/index.php).
  • Bevor sich die AG konkreten Aufgaben zuwendet, ist es unabdingbar, dass sie sich über die oben skizzierten grundsätzlichen Fragen Klarheit verschafft. Erst dann können diese Erkenntnisse in Tools etc. umgesetzt werden. Von der Zuarbeit zu PRONOM würden wir momentan auf jeden Fall absehen.

...

Heinz Werner Kramski (DLA):

  • Aus literarischen Nachlässen sind wir mit unkalkulierbaren Formaten konfrontiert. Absprachen dazu sind meist nicht möglich.
  • Interessant sind deshalb für uns vor allem Tools und Verfahren, Formate zuverlässig zu erkennen, Metadaten herauszuziehen und in archivgeeignete zu überführen (möglichst gescriptet).
  • Aktuelle Frage: Umgang mit geschachtelten Container-Formaten, z.B. MS-Office-Einbettungen in MS-Office-Dateien, PDF/A V.3, Zip-Files usw.
  • Gibt es international Test-Sets von frei verfügbaren Dateien, mit denen die Güte von Erkennungstools quantifiziert werden kann (so ähnlich wie der Acid-Test für Web-Browser)? Falls nicht könnte ich mir vorstellen, dass die AG so etwas entwickelt, ggf. für verschiedene Anwendungsgebiete (Office, Grafik, Audio usw.).

 

Leitfragen:

...

Agenda für das erste Treffen

...

  1. Vorstellung Teilnehmende + Vorstellungen der AG-Arbeit
  2. Ziel und Scope der AG
  3. Erfahrungsaustausch (Tools, Formate,...)
  4. Mögliche Aufgaben
    1. Zuarbeit zu Pronom pro und contra
    2. Testen von Tools, Sammlung bereits erfolgter Tests, Überprüfung der Tests (noch aktuell? neue Versionen der Tools?)
    3. Entwicklung von offen zugängliche Test-Sets
  5. Aufgabenteilung

...