Versionen im Vergleich

Schlüssel

  • Diese Zeile wurde hinzugefügt.
  • Diese Zeile wurde entfernt.
  • Formatierung wurde geändert.

Entwurf: "Wie füge ich ein neues Dateiformat zu

...

PRONOM dazu?"

Benötigt werden:

  • Hex Viewer
  • XML Viewer/Editor (es reicht Notepad++)

...

Die Reihenfolge ist egal, da DROID sich eh nach der angegeben Stelle richtet und nicht danach, welche Zeile zuerst kommt. Da der Pattern 6 Stellen lang ist, und +1 genommen wird, ist das ist dann der DefaultShift-Wert. Die Strings sind allerdings nicht immer so kurz wie beim GIF Beispiel.

Eigene Signaturen eintragen in sieben Schritten

  1. Mehrere Dateien desselben Formats sammeln. Es muss darauf geachtet werden, dass die Files aus verschiedenen Quellen stammen.
  2. Hex: Nach gemeinsamen Patterns/Strings suchen (besonders BOF (Begin of File) und EOF (End of File), kann aber auch mittendrin sein). Dies kann auch durch das Lesen der Formatspezifikation erleichtert bzw. auch ersetzt werden, da die BOF und EOF dort definiert sind.
  3. Falls Hex keine Ergebnisse liefert: TrIDScan (von Marco Pontello), das sucht nach gemeinsamen String in den Dateien und gibt es als XML aus. (Marco möchte die XMl Ausgabe als Feedback zu seiner Knowledge Base)
  4. Format Identifizierung: z. B. Hex String in Google suchen (Wikipedia listet auch die Hex signatures auf)
  5. XML Snippet erstellen: Hier gibt es eine UI-Vorlage, die so aussehende XML Files erstellt.
  6. Test - man kann die Signatur in DROID hochladen (upload signature file menu) und auf das Test Set jagen (testweise auch gegen andere File-Formats, die dann kein Treffer sein dürfen, testen ob es false positives gibt) + Full XML erstellen + erneuter Test
  7. http://www.nationalarchives.gov.uk/PRONOM/submitinfo.htm, und einreichen

Informationen aus dem TNA Guide

  • Extensions sind nicht eindeutig und verschiedene Formate können die gleichen Extension haben (Beispiel .wks für Lotus 1-2-3 worksheets und MS Works documents)
  • Die Version ist an der Extension nicht erkennbar (Beispiel .pdf, man weiß nicht einmal ob es sich um ein PDF/A, PDF/X oder eines der Standard-PDFs handelt)
  • Extensions können per Hand verändert und überschrieben werden

Beispiele für deutlich und einfach zu identifizierende interne Signaturen im Hex Viewer

Format
Signatur
Entsprechung
Bemerkungen
html68 74 6D 6Chtml 
GIF87a47 49 46 38 37 61GIF87A 
GIF89a47 49 46 38 39 61GIF89a 
CDA43 44 44 41 66 6D 74CDDAfmt 
PDF25 50 44 46%PDFDahinter erfolgt i.d.R. die Versionsnummer, z. B. -1.5 (2D 31 2E 35)
MS Excel

4D 69 63 72 6F 73 6F 66 74 20 45 78 63 65 6C

45 78 63 65 6C 2E 53 68 65 65 74

Microsoft Excel

Excel Sheet

Eher gegen Ende aber nicht ganz am Ende (mehrfach in der Datei gefunden)
jpeg4A 46 49 46JFIF 

 

Quellen