Am 10. März 2021 zwischen 11 und 12 Uhr fand das erste Webseminar im Rahmen von nestor virtuell statt.

Die Folien wurden mittlerweile auf der nestor Webseite veröffentlicht.

Folgen Sie nestor bei Twitter.

Folgen Sie Dino Wutschka bei Twitter.

Folgen Sie Yvonne Tunnat bei Twitter.

Der offizielle DROID-Userguide ist hier.

Es waren bis zu 112 Teilnehmer:innen anwesend, was im Nachgang zu vielen Fragen und Antworten (größtenteils ebenfalls von den Teilnehmer:innen) geführt hat, die hier gesammelt werden sollen.

Bedienung via Command Line und Einbindung von DROID in Langzeitarchivsysteme

Frage:  Haben Sie auch Erfahrungen mit der Command-Line oder der Implementierung von DROID in OAIS-Systemen?

Frage:  Gibt es Erfahrungen oder Beispiele für Droid als (interner) Webservice in einer Microservice-Architektur?

Antwort: Ja, für in iPRES-Poster haben Yvonne Tunnat und Micky Lindlar im großen Stil die CLI (und auch Batches) genutzt. DROID ist z. B. in Rosetta eingebunden. In FITS ist es ebenfalls ein Bestandteil. Auch viele andere Archive (wie DIMAG) haben DROID in ihre Langzeitarchivierungssysteme eingebunden. Archivematica hat zurzeit Siegfried eingebunden, ein anderes Identifizierungstool, das ebenfalls die Formatbibliothek PRONOM nutzt.

Als erste Idee würde es reichen, mit SystemD eine Port-Unit zu bauen, da reichen Linux-Bordmittel. Alternativ kann man xinetd nutzen.


Frage: Wo liegen die Unterschiede,  wenn ich DROID über GUI oder CLI benutze?

Antwort: Bei DROID sollte Feature Parity zwischen CLI und GUI herrschen. Wie bei CLI-Tools normalerweise der Fall, kann DROID bei der Bedienung via CLI einfacher parametrisiert werden.


Wie gut ist DROID?

Jede Formatidentifizierung kann immer nur eine Heuristik sein, aber gerade für bekannte/verbreitete Formate ist die Heuristik schon ziemlich gut.

Es gibt drei Erkennungsstufen: Extension, Signatur, Container. Ersteres ist unzuverlässig, letztere verlässlicher, Container am verlässlichsten

Neben der Erkennungsrate an sich gibt es natürlich auch eine Rate von "false positiv", also falsche Identifizierungen.

Wobei die Erkennung nur auf die PronomID abbildet. Zu EPUB gibt es z. B. keine PronomIPDs, die die Formatversionen angeben. Also wird das auch nicht erkannt.

Natürlich gibt es auch Dateien, die für DROID (und andere Identifizierungsprogramme) schwer zu erkennen sind. Beim nestor Praktikertag 2017 hatten wir dazu Ange Albertini für die Keynote eingeladen. Von seinen Vorträgen gibt es auch einen bei YouTube.

Die Erkennungsrate lässt sich auch durch die Voreinstellungen beeinflussen, durch die Anzahl an Bytes die analysiert werden. Gerade bei PDF kann das wichtig sein. Z. B. PDF/A wird sonst nicht erkannt.


Performance und Grenzen von DROID

Frage: Gibt es Input-Limits für die Identifizierung von Ordner-Inhalten?

Antwort: Meiner Erfahrung nach gibt es keine Limits, es dauert nur ggf. länger. Bei der Arbeit am iPRES Poster hat Yvonne Tunnat DROID ziemlich strapaziert, indem über 90 Signaturen hintereinander für ein recht großes Sample durchgelaufen sind.

Output von DROID

Frage: Ich überprüfe 20 Dateien. Wie kann ich die Ergebnisse, z.B. die Pronom-ID, z.B. als CSV exportieren? Geht's auch durch die User Interface?

Antwort: Der Export der Ergebnisse von DROID im CSV-Format ist möglich, auch in der GUI.


Kann DROID mehr als nur identifizieren?

Frage: Kann DROID auch zur automatischen Korrektur bei erkannten file extension mismatches genutzt werden?

Antwort: Nein. Das muss stets ein Mensch oder eine erstellte Regel im Nachgang entscheiden.


Kommunikation, Fehlerbehebung durch TNA

Man sollte die Ergebnisse gerade bei neuen oder speziellen Ablieferungen stichprobenartig prüfen und ev. Verbesserungen / Korrekturen an PRONOM weitergeben

Das DROID-Team ist eigentlich recht fix, am Einfachsten via GitHub-Issues.

Zuständig ist David Clipsham

Bei komplexen Anfragen (Beispiel ePub) kann das natürlich länger dauern.


Arbeitsweise der Identifikationsmethoden in DROID

https://zenodo.org/record/4593878

 

DROID Reference Card

https://zenodo.org/record/4593880

 

Erkennungstiefe bei Identifikations- und Validierungstools

https://zenodo.org/record/4593851


DROID

https://www.nationalarchives.gov.uk/information-management/manage-information/preserving-digital-records/droid/


PRONOM

https://www.nationalarchives.gov.uk/PRONOM/Default.aspx


  • Keine Stichwörter