Versionen im Vergleich

Schlüssel

  • Diese Zeile wurde hinzugefügt.
  • Diese Zeile wurde entfernt.
  • Formatierung wurde geändert.

...

So war zwischen 2005 und 2011 die PUID für das TIFF-Format noch fmt/10 (für die anderen drei TIFF-Versionen fmt/9, fmt/8 und fmt/7). Seit Juli 2011 jedoch wird das TIFF-Format unter der fmt/353 geführt. Es gibt unter fmt/10 einen Verweis auf fmt/353. Unter der fmt/353 wird zwar angedeutet, dass es Schwierigkeiten mit der Identifikation gab und daher eine neue Interpretation des Standards notwendig war, es gibt einen keinen direkten Verweis auf die deprecated PUID fmt/10.

...

Außerdem wurden vor der DROID v6 viele Office-Objekte einfach als "OLE2 Compound Document fmt/111" identifiziert, erst seitdem können sie gezielt als Word 97 -2003 Objekt identifiziert werden. Es ist daher sehr empfehlenswert, im Archiv eine Re- Identifizierung anzustoßen, wenn eine neue Version von DROID bzw. ein Update der Library bereitgestellt wird.

...

Praktischer Einfluss von mittlerweiele 82 Pronom Libraries auf den Identifzierungsalltag

Sofern man ein ausreichend großes Sample nimmt und es über die verschiedenen DROID-Versionen / Pronom Libraries laufen lässt, erhält man definitiv für einige Dateien im Laufe der Zeit verschiedene PUIDs (David Tarrant hatte da auch mal einen interessanten Zeitstrahl gebastelt, ML fragt bei der OPF nach, was daraus geworden ist).

Die hat diverse Ursachen, z. B.:

  • eine bereits existierende PUID war fehlerhaft und wurde korrigiert
  • von Zeit zu Zeit werden neue Methoden eingeführt. Z. B. kamen erst mit DROID v6 Container Signatures auf (was auch die Wende bei den Office-Dateien erklärt und auch bei epub ( ?) ).
  • oftmals gibt es neue PUIDs und Dateien, die vorher in allgemeinere Kategorien verfrachtet worden waren (siehe fmt/111), erhalten nun eine detailliertere Identifzierung
  • manchmal ändert sich auch konzeptionell etwas, so hatte TIFF früher vier PUIDs für die Verschiedenen TIFF-Versionen (fmt/7, fmt/8, fmt/9 und fmt/10), seit 2011 ist es aber nur fmt/353 (es gibt noch andere mit dem mimetype/TIFF, aber die Unterteilung in die vier TIFF-Versionen wurde aufgegeben). Hintergrund war, dass es nicht möglich war, die vier TIFF-Versionen verlässlich voneinander zu unterscheiden.

Formatidentifizierung ist keine exakte Wissenschaft. DROID und Pronom - und auch andere Ansätze - werden sich immer weiterentwickeln und somit wird es immer mal wieder zu Änderungen kommen, diese sind ja auch gewünscht und Ergänzungen ja sowieso. Wichtig ist ja vor allem, dass einmal vergebene PUIDs stets weiterhin dokumentiert sind. 

Referenzen

Historische Entwicklung von Pronom (neue PUIDs, Updates usw.)

...