Sie zeigen eine alte Version dieser Seite an. Zeigen Sie die aktuelle Version an.

Unterschiede anzeigen Seitenhistorie anzeigen

« Vorherige Version anzeigen Version 6 Nächste Version anzeigen »

Pronom Library Updates und die Persistenz von PUIDs

//TODO: Mit Referenzen und Links belegen

Unterschied zwischen x-fmt und fmt-PUIDS

Rund 450 Nummern sind sowohl als fmt als auch als x-fmt in der Pronom Library enthalten. Es gibt keine Relation zwischen z. B. fmt/382 und x-fmt/382 (in diesem Fall Microsoft Visual FoxPro database container und Macromedia FLV). Jeder Identifikator ist eindeutig.

In der Historie waren x-fmt-PUIDs mal als vorübergehende PUIDs gedacht:

PUID types prefixed by 'x-' are used to provide temporary, privat or experimental namespaces for that type. These may be used, for example, where a system requires a PUID identifier to be present which has not yet been formally assigned. Thus, format PUIDs of the type 'x-fmt' might be assigned for formats which have not yet been assigned an 'fmt' identifier. An 'x-' PUID should not be considered persistent.

 (PUID Schema von 2006, S. 7)

Diese Idee wurde aber zugunsten der Persistenz rasch wieder verworfen, die Priorität lautet nun Stabilität der PUIDs (letzter Paragraph hier).

Deprecated PUIDs

Grundsätzlich bleibt jede PUID persistent, d. h. eine einmal verwendete PUID wird nicht eines Tages für ein anderes Format verwendet. Es kann aber durchaus sein, dass eine PUID fürderhin nicht mehr verwendet wird und somit als "deprecated" gilt. Im Normalfall wird für das Dateiformat dann eine aktuellere PUID verwendet.

Deprecated PUIDs bleiben allerdings auch weiterhin in der Dokumentation erhalten (TODO: Link einfügen) und werden keinesfalls gelöscht (es gibt zwei historische Ausnahmen, x-fmt/366 und x-fmt/431, die zwar gelöscht, aber dokumentiert sind). Die letzte deprecatedPUID ist vom 26.02.2013.

Beispiel deprecated PUID TIFF

So war zwischen 2005 und 2011 die PUID für das TIFF-Format noch fmt/10. Seit Juli 2011 jedoch wird das TIFF-Format unter der fmt/353 geführt. Es gibt unter fmt/10 einen Verweis auf fmt/353. Unter der fmt/353 wird zwar angedeutet, dass es Schwierigkeiten mit der Identifikation gab und daher eine neue Interpretation des Standards notwendig war, es gibt einen keinen direkten Verweis auf die deprecated PUID fmt/10.

Weiterentwicklung von DROID und Pronom und die praktischen Auswirkungen auf Dateiformatidentifizierung

Aufgrund der Weiterentwicklung der Pronom-Bibliothek wachsen die Möglichkeiten, ein Dateiformat sicher zu erkennen mit jedem Update der Bibliothek. Zum Beispiel war es früher nicht möglich, das Format "epub" zu erkennen, dies wurde lediglich als Containerformat erkannt (auch richtig, aber sehr allgemein).

Außerdem wurden vor der DROID v6 viele Office-Objekte einfach als "OLE2 Compound Document" identifiziert, erst seitdem können sie gezielt als Word 97 -2003 Objekt identifiziert werden. Es ist daher sehr empfehlenswert, im Archiv eine Re- Identifizierung anzustoßen, wenn eine neue Version von DROID bzw. ein Update der Library bereitgestellt wird.

 

Referenzen

Historische Entwicklung von Pronom (neue PUIDs, Updates usw.)

Fragen kann man auch an die offizielle Mailingliste schicken: PRONOM@nationalarchives.gsi.gov.uk

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(Yvonne erstellt hier eine Seite aus den Infos von Michelle und Jay Gattuso/NLNZ)

  • Keine Stichwörter