Versionen im Vergleich

Schlüssel

  • Diese Zeile wurde hinzugefügt.
  • Diese Zeile wurde entfernt.
  • Formatierung wurde geändert.

Ziele und Aufgaben

Werden beim ersten Treffen von allen festgelegt.

Für das erste Treffen am 12. Mai haben zugesagt:

  • Tobias Steinke
  • Armin Straube
  • Yvonne Friese
  • Georg Büchler
  • Andre Müller
Agenda für das erste Treffen

kann von allen editiert werden

  1. Vorstellung Teilnehmende + Vorstellungen der AG-Arbeit
  2. Ziel und Scope der AG
  3. Erfahrungsaustausch (Tools, Formate,...)
  4. Mögliche Aufgaben
    1. Zuarbeit zu Pronom pro und contra
    2. Testen von Tools, Sammlung bereits erfolgter Tests, Überprüfung der Tests (noch aktuell? neue Versionen der Tools?)
    3. Entwicklung von offen zugänglichen Test-Sets (siehe Idee Heinz Kramski)
  5. Aufgabenteilung

(diese Seite befindet sich im Entwurfsstadium, die AG ist noch in der Gründungsphase)

Ziele und Aufgaben

Von vorneherein liegt der Fokus hier auf der Zuarbeit zu bereits implementierten Aktivitäten, Tools und Formatbibliotheken wie DROID, JHOVE und Pronom. Vernetzung und gemeinsame Arbeit steht im Vordergrund. Hier haben wir nämlich noch viel Luft nach oben in der internationalen LZA-Community, wie auch der Blogeintrag zu COPTR von Paul Wheatley zeigt - COPTR Wiki.

Ideen zur Arbeitserleichterung:

  • deutschsprachige Kurzanleitung in diesem Wiki "Wie füge ich ein neues Format zu Pronom zu und reiche es ein?"
  • deutschsprachige Kurzanleitung(en) für beliebte Tools wie FITS, JHOVE usw. (für FITS haben wir intern etwas erstellt, dies könnte als Basis dienen)
  • Dokumentation bereits von der AG einreichten Formate

...

Input der Interessenten

Die Konzeption der Formate in Pronom wird neueren Kompositformaten (zusammengesetzte Formate) nicht gerecht.

...

Name, VornameEinrichtungKontakt
Friese, YvonneZBWy.friese@zbw.eu
   

Mitglieder

NameEinrichtungKontakt
Hein, StefanDNBS.Hein@dnb.de
Steinke, TobiasDNBT.Steinke@dnb.de
Lindlar, MichelleTIB HannoverMichelle.Lindlar@tib.uni-hannover.de
Schmidt, ChristophLA NRWChristoph.Schmidt@lav.nrw.de
Hasler, TimKonrad-Zuse-Zentrum Berlinhasler@zib.de

Büchler, Georg

Vertretung: Röthlisberger-Jourdan, Claire)

KOST BernGeorg.Buechler@kost.admin.ch
Germies, MarionAbbVie Ludwigshafenmarion.germies@abbvie.com
Kramski, Heinz WernerDLA MarbachHeinz.Werner.Kramski@dla-marbach.de
Röhrle, Mario

Staatliche Akademie der Bildenden Künste, Stuttgart

mario.roehrle@abk-stuttgart.de
Schilke, Steffen

IT-Stelle der hessischen Justiz 

Steffen.Schilke@it-stelle.justiz.hessen.de
Bousfiha, AdnaneLandesarchiv Baden-Württembergadnane.bousfiha@la-bw.de
Müller, AndreGESIS Kölnandre.mueller@gesis.org

 

...

nestor Mailingliste nestor-formaterkennung@lists.dnb.de

...

...

  • Zugesagt:
  • Tobias Steinke
  • Armin Straube
  • Yvonne Friese
  • Georg Büchler
  • Andre Müller

 

Interessen im Bereich Formaterkennung

...

  • Zuarbeit zur Pronom-Formatbibliothek (bisher nicht bekannte Formate) - hier besteht Interesse, aber noch keine Erfahrung!
  • Erweiterungen der DROID-Funktionalitäten (Ausgabestatistik)
  • Erweiterungen der JHOVE-Fähigkeiten, speziell zu PDF-Dateien (Informationen zu Fehlermeldungen, bisher nicht erkannte Fehler), dies ist u. a. ein Thema des geplanten PDF-Hackathon an der ZBW Hamburg
  • Hilfsprogramme und Plugins für die LZA / den Umgang mit Dateiformaten (Passwortschutzerkennung bei PDFs, Validierung, Qualitätskontrolle nach Migrationsaktionen)
  • Edit: Die Idee von Herrn Kramski, Test-Sets zu erstellen (oder bereits vorhandene zu recherchieren) wäre auch für mich nützlich. So etwas ist mir bisher nur für PDF-Dateien bekannt und da reicht die Vielfalt jetzt für meine Bedürfnisse auch noch nicht aus (immerhin sammle ich aber bereits "böse" PDF-Dateien). Zip-Files nutzen wir für die CD-Archivierung, Erfahrungen sind aber bisher begrenzt.
  • deutschsprachige Kurzanleitung in diesem Wiki "Wie füge ich ein neues Format zu Pronom zu und reiche es ein?"
  • deutschsprachige Kurzanleitung(en) für beliebte Tools wie FITS, JHOVE usw. (für FITS haben wir intern etwas erstellt, dies könnte als Basis dienen)
  • Dokumentation bereits von der AG einreichten Formate

Erfahrung mit Formaten: Hauptsächlich Standard-PDF, etwas JPEG, dazu neuerdings diverse andere Formate (aber erst Phase der Bestandsaufnahme) aufgrund der CD-ROM-Archivierung

...

  • Aus literarischen Nachlässen sind wir mit unkalkulierbaren Formaten konfrontiert. Absprachen dazu sind meist nicht möglich.
  • Interessant sind deshalb für uns vor allem Tools und Verfahren, Formate zuverlässig zu erkennen, Metadaten herauszuziehen und in archivgeeignete zu überführen (möglichst gescriptet).
  • Aktuelle Frage: Umgang mit geschachtelten Container-Formaten, z.B. MS-Office-Einbettungen in MS-Office-Dateien, PDF/A V.3, Zip-Files usw.
  • Gibt es international Test-Sets von frei verfügbaren Dateien, mit denen die Güte von Erkennungstools quantifiziert werden kann (so ähnlich wie der Acid-Test für Web-Browser)? Falls nicht könnte ich mir vorstellen, dass die AG so etwas entwickelt, ggf. für verschiedene Anwendungsgebiete (Office, Grafik, Audio usw.).

 

Agenda für das erste Treffen

kann von allen editiert werden

...

  • .

...

  1. Zuarbeit zu Pronom pro und contra
  2. Testen von Tools, Sammlung bereits erfolgter Tests, Überprüfung der Tests (noch aktuell? neue Versionen der Tools?)
  3. Entwicklung von offen zugänglichen Test-Sets (siehe Idee Heinz Kramski)

...

...