Versionen im Vergleich

Schlüssel

  • Diese Zeile wurde hinzugefügt.
  • Diese Zeile wurde entfernt.
  • Formatierung wurde geändert.

Pronom Library Updates und die Persistenz von PUIDs (PRONOM's Persistent Unique Identifier)

Unterschied zwischen x-fmt und fmt-PUIDS

Rund 450 Nummern sind sowohl als fmt als auch als x-fmt in der Pronom Library enthalten. Es gibt keine Relation zwischen z. B. fmt/382 und x-fmt/382 (in diesem Fall Microsoft Visual FoxPro database container und Macromedia FLV). Jeder Identifikator ist eindeutig.

...

Diese Idee rührt daher, erst eine fmt-PUID zu vergeben, wenn man sicher war, dass die Byte Sequenz (oder eine andere formale Identifizierungsstrategie) korrekt war. Sie wurde aber zugunsten der Persistenz rasch wieder verworfen, die Priorität lautet nun Stabilität der PUIDs (letzter Paragraph hier).

Deprecated PUIDs

Grundsätzlich bleibt jede PUID persistent, d. h. eine einmal verwendete PUID wird nicht eines Tages für ein anderes Format verwendet. Es kann aber durchaus sein, dass eine PUID fürderhin nicht mehr verwendet wird und somit als "deprecated" gilt. Im Normalfall wird für das Dateiformat dann eine aktuellere PUID verwendet.

...

In PRONOM können zurückgezogene PUIDs über eine Einfache Suche nach "Deprecated" angezeigt werden. Mit akutellem Stand 13.07.2015 sind 58 PUIDs als zurückgezogen gekennzeichnet.

Signature Patterns von deprecated PUIDs anhand des Beispiels TIFF

Während die PUIDs von zurückgezogenen Einträgen weiter bestehen bleiben, werden die Signaturen von zurückgezogenen PUIDs aus dem Registryeintrag entfernt und die Verlinkung zwischen PUID und Pattern in DROID aufgehoben.
Beispiel für das o.g. fmt/7 anhang von DROID Signature Versionen:

File Format Eintrag in DROID Signature Pattern v45 - PUID Status "aktiv":

...

Neben Änderungen der Zuordnung von Signaturen zu PUIDs sind aber auch bei Signature Pattern selbst Änderungen möglich - diese werden in den DROID Signature Pattern Release Notes angekündigt (z.B. " Macromedia Flash 1. Improved signature through PRONOM research.").

Beispiel deprecated PUID TIFF

So war zwischen 2005 und 2011 die PUID für das TIFF-Format Version 6.0 noch fmt/10 (für die anderen drei TIFF-Versionen fmt/9, fmt/8 und fmt/7). Seit Juli 2011 jedoch wird das TIFF-Format für alle Versionen unter der fmt/353 geführt. Es gibt unter fmt/10 einen Verweis auf fmt/353. Unter der fmt/353 wird zwar angedeutet, dass es Schwierigkeiten mit der Identifikation gab und daher eine neue Interpretation des Standards notwendig war, es gibt einen aber keinen direkten Verweis auf die deprecated PUID fmt/10.

Weiterentwicklung von DROID und Pronom und die praktischen Auswirkungen auf Dateiformatidentifizierung

Aufgrund der Weiterentwicklung der Pronom-Bibliothek wachsen die Möglichkeiten, ein Dateiformat sicher zu erkennen mit jedem Update der Bibliothek. Zum Beispiel war es früher nicht möglich, das Format "epub" zu erkennen, dies wurde lediglich als Containerformat erkannt (auch richtig, aber sehr allgemein).

Außerdem wurden vor der DROID v6 viele Office-Objekte einfach als "OLE2 Compound Document fmt/111" identifiziert, erst seitdem können sie gezielt als Word 97 -2003 Objekt identifiziert werden. Es ist daher sehr empfehlenswert, im Archiv eine Re- Identifizierung anzustoßen, wenn eine neue Version von DROID bzw. ein Update der Library bereitgestellt wird.

Beispiel vormals nicht erkanntes Format epub

Das epub-Format wird erst seit 2013 (Droid v6) erkannt. Soweit zurzeit (07/2015) bekannt ist, macht Pronom aber noch keinen Unterschied zwischen epub 2 und epub 3.

Praktischer Einfluss von mittlerweiele 82 Pronom Libraries auf den Identifzierungsalltag

Sofern man ein ausreichend großes Sample nimmt und es über die verschiedenen DROID-Versionen / Pronom Libraries laufen lässt, erhält man definitiv für einige Dateien im Laufe der Zeit verschiedene PUIDs.

...

Formatidentifizierung ist keine exakte Wissenschaft. DROID und Pronom - und auch andere Ansätze - werden sich immer weiterentwickeln und somit wird es immer mal wieder zu Änderungen kommen, diese sind ja auch gewünscht und Ergänzungen ja sowieso. Wichtig ist ja vor allem, dass einmal vergebene PUIDs stets weiterhin dokumentiert sind.

Referenzen

Historische Entwicklung von Pronom (neue PUIDs, Updates usw.)

...