Sie zeigen eine alte Version dieser Seite an. Zeigen Sie die aktuelle Version an.

Unterschiede anzeigen Seitenhistorie anzeigen

« Vorherige Version anzeigen Version 38 Nächste Version anzeigen »

(diese Seite befindet sich im Entwurfsstadium, die AG ist noch in der Gründungsphase)

Ziele und Aufgaben

Von vorneherein liegt der Fokus hier auf der Zuarbeit zu bereits implementierten Aktivitäten, Tools und Formatbibliotheken wie DROID, JHOVE und Pronom. Vernetzung und gemeinsame Arbeit steht im Vordergrund. Hier haben wir nämlich noch viel Luft nach oben in der internationalen LZA-Community, wie auch der Blogeintrag zu COPTR von Paul Wheatley zeigt - COPTR Wiki.

Ideen zur Arbeitserleichterung:

  • deutschsprachige Kurzanleitung in diesem Wiki "Wie füge ich ein neues Format zu Pronom zu und reiche es ein?"
  • deutschsprachige Kurzanleitung(en) für beliebte Tools wie FITS, JHOVE usw. (für FITS haben wir intern etwas erstellt, dies könnte als Basis dienen)
  • Dokumentation bereits von der AG einreichten Formate

Der Aufruf zum Mitmachen erfolgte im Q1 des Jahres 2014 (Deadline 31.03.14).

Input der Interessenten

Die Konzeption der Formate in Pronom wird neueren Kompositformaten (zusammengesetzte Formate) nicht gerecht.

Ggf. ist Fido besser für Ausgabestatistik geeignet als DROID (Fazit aus dem KOST-Paper) - Test mit CSV Export der Analyse in DROID sind aber auch mgl.

Ansprechpartner

Name, VornameEinrichtungKontakt
Friese, YvonneZBWy.friese@zbw.eu
   

Mitglieder

NameEinrichtungKontakt
Hein, StefanDNBS.Hein@dnb.de
Steinke, TobiasDNBT.Steinke@dnb.de
Lindlar, MichelleTIB HannoverMichelle.Lindlar@tib.uni-hannover.de
Schmidt, ChristophLA NRWChristoph.Schmidt@lav.nrw.de
Hasler, TimKonrad-Zuse-Zentrum Berlinhasler@zib.de

Büchler, Georg

Vertretung: Röthlisberger-Jourdan, Claire)

KOST BernGeorg.Buechler@kost.admin.ch
Germies, MarionAbbVie Ludwigshafenmarion.germies@abbvie.com
Kramski, Heinz WernerDLA MarbachHeinz.Werner.Kramski@dla-marbach.de
Röhrle, Mario

Staatliche Akademie der Bildenden Künste, Stuttgart

mario.roehrle@abk-stuttgart.de
Schilke, Steffen

IT-Stelle der hessischen Justiz 

Steffen.Schilke@it-stelle.justiz.hessen.de
Bousfiha, AdnaneLandesarchiv Baden-Württembergadnane.bousfiha@la-bw.de
Müller, AndreGESIS Kölnandre.mueller@gesis.org

 

  • erl.: Für AG-Mitglieder nestor-Wiki-Zugang beantragen // Frau Germies, Herr Bücher, Herr Hasler brauchen noch Zugang (via Armin Straube beantragt am 26.02.14, für Herrn Bousfiha am 17.03., Andre Müller am 01.04.14)
  • nestor Mailingliste nestor-formaterkennung@lists.dnb.de
  • Erstes Treffen 12. Mai 2014 in der DNB Frankfurt

 

Interessen im Bereich Formaterkennung

Leitfragen

  • Was versprechen Sie sich von der Teilnahme in der AG?
  • Welche Formate und/oder Tools sind für Sie besonders interessant?
  • Welche Aufgaben sind für Sie interessant (Testen von Tools, Zuarbeit zu Pronom, (Weiter-)entwickeln von nützlichen Tools?

Yvonne Friese (ZBW):

  • Zuarbeit zur Pronom-Formatbibliothek (bisher nicht bekannte Formate) - hier besteht Interesse, aber noch keine Erfahrung!
  • Erweiterungen der DROID-Funktionalitäten (Ausgabestatistik)
  • Erweiterungen der JHOVE-Fähigkeiten, speziell zu PDF-Dateien (Informationen zu Fehlermeldungen, bisher nicht erkannte Fehler), dies ist u. a. ein Thema des geplanten PDF-Hackathon an der ZBW Hamburg
  • Hilfsprogramme und Plugins für die LZA / den Umgang mit Dateiformaten (Passwortschutzerkennung bei PDFs, Validierung, Qualitätskontrolle nach Migrationsaktionen)
  • Edit: Die Idee von Herrn Kramski, Test-Sets zu erstellen (oder bereits vorhandene zu recherchieren) wäre auch für mich nützlich. So etwas ist mir bisher nur für PDF-Dateien bekannt und da reicht die Vielfalt jetzt für meine Bedürfnisse auch noch nicht aus (immerhin sammle ich aber bereits "böse" PDF-Dateien). Zip-Files nutzen wir für die CD-Archivierung, Erfahrungen sind aber bisher begrenzt.

Georg Büchler, Claire Röthlisberger (KOST):

  • Wir hoffen, dass diese AG zunächst als Forum für grundsätzliche Diskussionen dienen kann:
    • Welche Art der Formaterkennung brauchen wir? Wie detailliert soll sie sein? Wie ist das Zusammenspiel mit der Formatvalidierung?
    • Welches sind die konzeptionellen Limiten der aktuellen Ansätze und Tools zur Formaterkennung?
    • Wie können diese Limiten überwunden werden?
  • Interessant sind für uns in erster Linie die für die Archive idealen oder akzeptablen Formate: PDF/A-1 und -2, TIFF, JPEG, JPEG2000, PNG, MP3, WAV, MPEG4, SIARD (siehe http://www.kost-ceco.ch/wiki/whelp/KaD/index.php).
  • Bevor sich die AG konkreten Aufgaben zuwendet, ist es unabdingbar, dass sie sich über die oben skizzierten grundsätzlichen Fragen Klarheit verschafft. Erst dann können diese Erkenntnisse in Tools etc. umgesetzt werden. Von der Zuarbeit zu PRONOM würden wir momentan auf jeden Fall absehen.

Heinz Werner Kramski (DLA):

  • Aus literarischen Nachlässen sind wir mit unkalkulierbaren Formaten konfrontiert. Absprachen dazu sind meist nicht möglich.
  • Interessant sind deshalb für uns vor allem Tools und Verfahren, Formate zuverlässig zu erkennen, Metadaten herauszuziehen und in archivgeeignete zu überführen (möglichst gescriptet).
  • Aktuelle Frage: Umgang mit geschachtelten Container-Formaten, z.B. MS-Office-Einbettungen in MS-Office-Dateien, PDF/A V.3, Zip-Files usw.
  • Gibt es international Test-Sets von frei verfügbaren Dateien, mit denen die Güte von Erkennungstools quantifiziert werden kann (so ähnlich wie der Acid-Test für Web-Browser)? Falls nicht könnte ich mir vorstellen, dass die AG so etwas entwickelt, ggf. für verschiedene Anwendungsgebiete (Office, Grafik, Audio usw.).

 

Agenda für das erste Treffen

kann von allen editiert werden

  1. Vorstellung Teilnehmende + Vorstellungen der AG-Arbeit
  2. Ziel und Scope der AG
  3. Erfahrungsaustausch (Tools, Formate,...)
  4. Mögliche Aufgaben
    1. Zuarbeit zu Pronom pro und contra
    2. Testen von Tools, Sammlung bereits erfolgter Tests, Überprüfung der Tests (noch aktuell? neue Versionen der Tools?)
    3. Entwicklung von offen zugänglichen Test-Sets (siehe Idee Heinz Kramski)
  5. Aufgabenteilung

Validierungstool KOST-Val

Archivierung von Unterlagen aus digitalen Systemen, 2012, URL

Pronom

Google Forum von Pronom (User und Entwickler)

Die Zukunft von JHOVE und JHOVE 2 und mögliche Weiterentwicklungen

 

  • Keine Stichwörter