Hinweis: Diese Collaborative Notes sind im Rahmen des virtuellen nestor-Praktikertags 2021 entstanden. Während der Veranstaltung konnten die Teilnehmer*innen in einem öffentlich zugänglichen Pad gemeinsame Notizen verfassen. Diese wurden nach dem Ende der Veranstaltung ins nestor-Wiki übernommen.

Bereits während der Veranstaltung wurden Fragen des Publikums und Antworten der Vortragenden in den Collaborative Notes dokumentiert. Einige Vortragende haben sich die Mühe gemacht, die an sie gerichteten Fragen nach der Veranstaltung zudem schriftlich zu beantworten. Auch dafür wurden die Collaborative Notes genutzt, sodass hier nun eine Mischung aus Vortragsnotizen und Fragen mit Antworten zu lesen ist.


Begrüßung, Vorstellung von nestor und der AG Formaterkennung (Svenia Pohlkamp, nestor-Geschäftsstelle / DNB und Yvonne Tunnat, ZBW)

An den nestor-AGs können auch Interessierte aus Institutionen teilnehmen, die nicht in nestor-Partnerinstitutionen arbeiten. Auch für interessierte Privatpersonen ist eine Mitarbeit möglich.

nestor for newbies musste coronabedingt aussetzen und wird hoffentlich 2022 wieder stattfinden. Teilweise wird diese Reihe allerdings durch die Angebote der Webseminare aus der Reihe “nestor virtuell” ersetzt, da dort einige Angebote auch speziell für Einsteiger:innen gedacht sind.

Worum geht es in den nestor Schools?

Formatauswahl (Claire Röthlisberger-Jourdan, KOST)

Claire fragt die Teilnehmenden, welche Datei-Endungen ihnen einfallen und bittet darum, diese in den Chat zu schreiben. Abgesehen von mal den Antworten “alle” und “keine” gibt es einen großen Zoo an Datei-Endungen, von Textverarbeitung, Bild, Video, Ton, verpackten Formaten, Tabellenformate etc.

Die Teilnehmenden dürfen Fragen oder Ergänzungen zum Sinn und Zweck der Formatauswahl in den Chat schreiben, Claire geht dann während des Vortrags darauf ein.

Sind Significant properties ein Faktor für die Formatauswahl?

Gibt es “technology watch” bei den Formatkriterien? Bzw. gibt es eine jährliche Überprüfung?

Wird PDF/R als Bildformat von der KOST betrachtet werden?

Wie ist das genau zu verstehen? PDF/A-2 mit JPEG2000? Dass Bilder im Format JPEG2000 in PDF/A-2 eingebettet werden?

Gibt es Planungen, epub als gängiges Buchhandelsformat (multimedia- und hypertestfähig) zu prüfen?

Was ist mit Kriterien auf Exemplarebene? PDF kann Kopierschutz haben, was - wenn vorhanden - problematisch ist.

Was ist mit xls-Dateien?

Formatidentifizierung (Micky Lindlar, TIB)

Die TIB hat einen sehr großen Formatzoo, da sie stets die Originale archivieren und es gibt einen recht langen Long tail.

Frage zu Syntax/Semantik: Dass in einer Matrix jede Zeile gleich viele Spalten haben muss - wäre das eher Syntax oder Semantik?

Ob man nun einen Satz textuell (wie auf dem Blatt geschrieben) oder Binär (wie auf ner Schallplatte gesprochen) aufnimmt, hat doch keinen Unterschied, ob die Anordnung eher sequentiell oder eher beliebig ist. Die Unterscheidung verstehe ich noch nicht.

Gibt es Droid auch als maven repository (oder allgemein als Java Bibliothek), um innerhalb eines Java-Programms Dateiformate zu erkennen und die Infos zurück zu kriegen? Wie ist das bei Siegfried?

Hält wikidp.org auch Signaturen vor?

Datei-Validierung - Wie kaputt ist das denn? (Yvonne Tunnat, ZBW)

Kennt jemand eine Software, mit der man leichter eigene Spezifikation erstellen und validieren kann?

Validiert ihr die Migrationsergebnisse, die ihr selbst erstellt habt, oder vertraut ihr Euren Migrationstools in dieser Hinsicht?
Ist bei Invalidität des Migrationsergebnisses dann ein nochmaliges migrieren die Lösung oder, wenn nicht, kriegt ihr dies anderweitig gelöst oder lebt ihr letztlich doch damit?

Kann man Adobe Acrobat als Validierungstool verwenden?

Problembehandlung - Am Beispiel TIFF (Andreas Romeyke, SLUB)

Ich bin mir nicht ganz sicher, wie das zu verstehen war. Ist z.B. 270 für tiffset -s 270 eine Konstante oder nur in einem Beispiel so und man muss immer erstmal schauen wo der entsprechender Tag gerade ist?

Wenn die Tags in der falschen Reihenfolge sind, könnte das auf einen Softwarefehler hindeuten? Heißt das nicht, dass das sortieren den Softwarefehler nicht bloß an die richtige Stelle verschiebt?

Kennt sich jemand mit Photoshop-Metadaten in TIFFs aus? Laut Exiftools können sie in den betroffenen Dateien nicht ausgelesen werden. Laut Photoshop CS5 sind sie beschädigt.

Werden bei fixit_tiff Reparaturen dokumentiert?

Wenn man den Inhalt verlängert, muss man die Offsets neu berechnen, oder? Welche alle?

Wie sind die Erfahrungen hinsichtlich Aufwand und Nutzen; resp. wann lohnt es sich?

Wie verhält sich mit GeoTIFFs? Würden diese in einem Archiv akzeptiert werden, oder müssten diese konvertiert werden?

Sollte man beschädigte TIFFs aufheben schon alleine weil es in Zukunft geeignete Tools zur Wiederherstellung geben könnte?