Auswahl des zu archivierenden Materials

Selektionskriterien bilden die Entscheidungsgrundlage für die Frage, ob ein Objekt langfristig gesichert werden soll. Hierbei spielen neben rechtlichen auch inhaltliche Kriterien eine Rolle. Besondere Bedeutung kommt der Frage nach den Ressourcen zu.
Empfehlung
Privatanwender sollten in Abhängigkeit von ihren persönlichen Anforderungen bewusst selektieren, z.B. nach thematischen Schwerpunkten oder der Relevanz eines Objekts für eine spezifische Fragestellung. Auch größtmögliche Vollständigkeit einer Sammlung kann eine Rolle spielen.

Beschreibung der vorgesehenen Nutzungsszenarien

Empfehlung

Vorgesehene Nutzerzielgruppen sind für Privatanwender nicht relevant, es sollte aber die zukünftige Nutzung der Objekte berücksichtigt werden.

Qualitätsmanagement

Qualitätsmanagement bezeichnet Verfahren und Prozesse, die die Qualität der Objekte sowie der Prozesse im digitalen Langzeitarchiv sicherstellen sollen.

Darunter fallen z.B.:

  • Übernahmevereinbarung (ein Dokument, das organisatorische, rechtliche und technische Punkte bei der Übernahme berücksichtigt)
  • Eingangskontrolle der Objekte (Überprüfung der Objekte beim Eingang in das digitale Langzeitarchiv)
  • Prüfung auf Lesbarkeit und inhaltliche Vollständigkeit
  • Prüfung auf inhaltliche Übereinstimmung mit den deskriptiven Metadaten
  • technische Fehlerfreiheit
  • Standardkonformität
  • Dokumentation von Prozessen (Genaue Beschreibung von Prozessen im digitalen Langzeitarchiv: Was wird wann warum wie gemacht? Z.B. schriftlich oder in einer Notation für Prozessdokumentation wie BPMN 2.0.)
  • Evaluierung von Prozessen (Dokumentierte Prozesse können nach Kriterien wie Praxistauglichkeit, Zeitaufwand, Ressourcenaufwand, Überschneidungen mit anderen Prozessen usw. untersucht werden. Die Analyse ist Voraussetzung für die Optimierung der Prozesse.)
  • Kontrollverfahren (technische und organisatorische Verfahren für die Kontrolle von definierten Regeln und Strukturen oder zur Evaluierung von Ergebnissen nach Änderungen an Objekten)
  • Regelkonformität von Transfer- und Archivpaketen
  • Qualitätsprüfung nach Formatmigrationen
  • Lesbarkeit und Vollständigkeit nach Änderungen am Objekt
  • Nutzung von Standards
  • Beachtung der Kriterien für die vertrauenswürdige Langzeitarchivierung (nestor-Siegel nach DIN 31644[1], auch Data Seal of Approval)

 

Empfehlung

Von Privatanwendern ist ein umfassendes Qualitätsmanagement nicht zu leisten. Trotzdem wird Privatanwendern empfohlen, im Rahmen ihrer Möglichkeiten eine Eingangskontrolle durchzuführen und die Ergebnisse von Formatmigrationen anhand festgelegter Kriterien zu prüfen.


Erhaltungsstrategien

Erhaltungsstrategien stellen sicher, dass das Objekt als Datenstrom erhalten und nutzbar bleibt. Dabei sichern Verfahren für die Bitstream-Preservation den Datenstrom und Verfahren für die Content-Preservation die Les- und Interpretierbarkeit des Objekts.

Bitstream-Preservation

Digitale Datenträger sind nur von begrenzter Haltbarkeit. Sie sind nicht nur von Verschleiß betroffen, auch Hardwareobsoleszenz ist problematisch. Aus diesem Grund ist ein Speicherkonzept essenziell für die Erhaltung des Bitstroms der digitalen Objekte.


Grundlegende Anforderungen an das Speicherkonzept sind:

  • redundante, geografisch verteilte Speicherlösung
  • Integritätschecks, z.B. mit Prüfsummen
  • Viruscheck
  • Datenschutzkonzept
  • regelmäßiger Austausch von Datenträgern
  • Monitoring
  • Skalierbarkeit


Die Sicherung des Bitstroms eines Objekts ist ein stetig wiederkehrender Prozess und Basis jeder Erhaltungsstrategie.

Empfehlung

Von Privatanwendern ist kaum zu erwarten, einen entsprechenden Speicher zu betreiben. Deswegen werden an dieser Stelle Alternativen empfohlen.
Sinnvoll ist die geografisch getrennte, redundante Speicherung mehrerer Kopien eines Objekts, z.B. eine Arbeitskopie und zwei Backups auf mehreren Festplatten, und regelmäßiges Ersetzen der Speichermedien. Ein Viruscheck sollte beim Eingang eines Objekts durchgeführt werden.
Eine Alternative ist die Speicherung der Objekte in einer Cloud, wobei der Anbieter sich um die Verwaltung und Erhaltung der Speichermedien kümmert. Cloudspeicher ist meist mit laufenden Kosten als monatliche Pauschale oder nach Datenaufkommen verbunden. Neben den Kosten sind auch die Nutzungsbedingungen zu beachten: Werden dem Anbieter mit dem Upload Nutzungsrechte an den Objekten eingeräumt? Wie schützt der Anbieter die Objekte vor unbefugtem Zugriff? In welchem Land stehen die Server?
Spezialisierte Dienstleister sind eine weitere Möglichkeit. Zu beachten ist hierbei, ob der Dienstleister lediglich die Speicherung der Objekte anbietet oder darüber hinaus tatsächlich die digitale Langzeitarchivierung der Objekte gewährleistet. Einige große Informations- und Gedächtnisinstitutionen in Deutschland konzipieren derzeit Dienstleistungsangebote, es gibt aber auch kommerzielle Anbieter. Sinnvoll ist die Wahl von zwei verschiedenen Speicherkonzepten.
Wenn der Verwaltungsaufwand der Festplatten und die Kosten für den Cloudspeicher und den Dienstleister zu hoch sind, sollte in Betracht gezogen werden, ob die Objekte an eine Gedächtnisinstitution abgegeben werden können, die die adäquate Langzeitarchivierung leisten kann.

Content-Preservation

Content-Preservation soll sicherstellen, dass der Inhalt eines Objekts auch nach Jahren wiedergegeben und interpretiert werden kann.
Dafür ist es erforderlich:

  • Das Dateiformat, die -version und den Codec zu identifizieren und zu validieren. Bei AV-Medien wird diese Erkenntnis durch den Codec erschwert, der in dem Containerformat enthalten ist.
  • technische Metadaten zu extrahieren (siehe Tabelle mit Tools, S. 110 ff.)
  • Informationen über geeignete Wiedergabesoftware zu sammeln
  • Risikofaktoren zu identifizieren
  • signifikante Eigenschaften festzulegen
  • Kontextinformationen bereitzustellen, die die Wiedergabe des Objekts und die Interpretation des Inhalts ermöglichen  


Auf Basis dieser Informationen können Bestandserhaltungsmaßnahmen konzipiert und durchgeführt werden. Dafür gibt es zwei Verfahren: Formatmigration und Emulation.

Empfehlung

Privatanwender können umfassende Bestandserhaltungsmaßnahmen wie oben beschrieben kaum leisten. Aus diesem Grund sollen hier nur minimale Anforderungen aufgeführt werden.
Es wird die Formatmigration empfohlen, da es für die meisten audiovisuellen Objekte nicht erforderlich ist, die ursprüngliche Nutzungsumgebung zu erhalten. Eine Ausnahme stellt Videokunst dar, die im Wissenschaftlichen Film aber nicht als solche, sondern höchstens als Repräsentation vorkommt.
Gleichzeitig sollte die Anzahl der Archivformate nach Möglichkeit auf ein bis einige wenige ausgewählte Dateiformate begrenzt werden. Es wird empfohlen, Objekte, die in anderen Dateiformaten vorliegen, in eines der ausgewählten Dateiformate umzuwandeln. Dafür stehen eine Reihe von Open-Source- und kommerzieller Software zur Verfügung.
Das Dateiformat sollte identifiziert und validiert werden. Es genügt nicht, ein Objekt über die Dateiendung zu identifizieren, da diese auch irreführend sein kann. Außerdem sollten technische Metadaten extrahiert werden. Das Dateiformat eines Objekts und der Codec müssen bekannt sein, da alle Erhaltungsmaßnahmen hierauf basieren.
Signifikante Eigenschaften sollten in geringem Umfang festgelegt werden. Der Fokus sollte auf den Eigenschaften eines Objektes liegen, die dem Privatanwender wichtig sind (z.B. das Seitenverhältnis, der Farbraum, die Auflösung). Diese Anforderungen sollten nach einer Bestandserhaltungsmaßnahme überprüft werden.
Risikomanagement kann von Privatanwendern kaum geleistet werden, trotzdem soll ein Risikofaktor hier festgehalten werden: Wenn es für ein Objekt zunehmend schwieriger wird, aktuelle Wiedergabesoftware zu finden, ist dies ein deutlicher Hinweis darauf, dass das Format von aktueller Software nicht mehr unterstützt wird und von Obsoleszenz bedroht ist. In diesem Fall sollten so bald wie möglich alle Objekte, die in dem betroffenen Format vorliegen, in ein neues Zielformat migriert werden.

Authentizität

Die Sicherung der Authentizität bedeutet, nachweisen zu können, dass ein Objekt ist, was es zu sein vorgibt. Da Bestandserhaltungsmaßnahmen wie Formatmigrationen zwangsläufig eine Veränderung eines Objekts verursachen, ist die Sicherung der Authentizität nicht ganz unproblematisch. Von einem Privatanwender wird die Sicherung der Authentizität nicht gefordert. Folgende Maßnahmen sind zur Sicherung der Authentizität etabliert:

  • die Aufbewahrung des Originals und aller Bearbeitungen des Objekts (Versionierung)
  • der Nachweis von Veränderungen am Objekt in den Metadaten

 

Metadaten

Metadaten beschreiben ein Objekt. Es wird zwischen folgenden Metadatenkategorien unterschieden:
deskriptive Metadaten: Es handelt sich um klassische Erschließungsmetadaten. Diese beschreiben ein Objekt und gewährleisten, dass es wiederauffindbar ist. Erschließungsmetadaten unterteilen sich in formale Metadaten wie Titel, Urheber, Erscheinungsjahr usw. und inhaltsbeschreibende Metadaten wie Schlagworte, ein Abstract, ein Transkript, Sequenzbeschreibungen usw.
administrative Metadaten: Administrative Metadaten sind für die Verwaltung der Objekte im Langzeitarchiv und den Betrieb des Systems erforderlich, z.B. systeminterne Identifier, Nutzerdaten, Rollen- und Rechtevergabe.
rechtliche Metadaten: Rechtliche Metadaten beschreiben den Nutzerzugriff auf die Objekte. Sie legen auch fest, ob die Objekte bearbeitet und wie sie bereitgestellt werden dürfen.
technische Metadaten: Technische Metadaten beschreiben z.B. Dateiformat und -version, den Codec, Laufzeit, Dateigröße, Bitrate usw. Technische Metadaten können aus der Datei extrahiert werden.
strukturelle Metadaten: Strukturelle Metadaten beschreiben die Zusammensetzung eines Objekts und Zusammenhänge mit anderen, z.B. wenn ein Objekt aus mehreren Dateien in einer festgelegten Reihenfolge besteht oder wenn Objekte Teil einer Serie sind.
Provenienzmetadaten: Diese Metadaten beschreiben die Objektgeschichte, um zu dokumentieren, welcher Nutzer wann mit welchen Tools welche Bearbeitung vorgenommen hat. Diese Metadaten sind von großer Wichtigkeit für die Authentizität.

Empfehlung

Die Erfassung von Metadaten bedeutet für Privatanwender einen erheblichen Aufwand, wenn diese nicht aus einer Quelle importiert werden können. Während für Kinofilme häufig deskriptive Metadaten in Form von Filmdatenbanken wie der Internet Movie Database (IMDB) vorhanden sind, ist dies für den Wissenschaftlichen Film aufgrund der geringeren Popularität eher unwahrscheinlich. Deshalb sollten sich Privatanwender auf grundlegende deskriptive und technische Metadaten beschränken.
Die erfassten Metadaten müssen verwaltet werden. Es wird dringend davon abgeraten, die Metadaten ausschließlich in der Datei selbst zu speichern. Bei einer Formatmigration können diese Metadaten verloren gehen. Sinnvoller ist es, Objekt und Metadaten getrennt voneinander zu verwalten. Von der Metadatenverwaltung in Excel- oder Worddateien wird abgeraten. Besser geeignet ist frei verfügbare Datenbanksoftware für Multimediaobjekte.

Präsentation/Zugriff

Weitverbreitete, offene Formate und Codecs sollten bevorzugt werden; proprietäre Formate und Codecs sind häufig an eine spezielle Wiedergabesoftware gebunden, binden an einen Hersteller und begrenzen die Nutzung.
Für verschiedene Nutzungsszenarien können verschiedene Nutzungsformate erforderlich sein.

Empfehlung

Bei Privatanwendern ist das Nutzungsformat oft identisch mit dem Archivformat. In diesem Fall muss das Archivformat für die Nutzung geeignet sein. Alternativ kann eine Konvertierung in ein geeigneteres Format in Betracht gezogen werden.

Bei Privatanwendern kommen in erster Linie folgende Nutzungsszenarien vor:

  • lokale Nutzung
  • Versand von Datenträgern
  • Onlinezugriff

Dateiformate und Codecs

Für das Archivformat und den verwendeten Codec sind offene, standardisierte und weitverbreitete Formate zu bevorzugen, die nicht oder verlustfrei komprimieren, um einem späteren Qualitätsverlust vorzubeugen. Proprietäre Dateiformate sind oft an eine spezifische Software eines Herstellers gebunden und stellen eine potenzielle Gefahr für die langfristige Verfügbarkeit dar, da der Code nicht öffentlich zugänglich ist und Formatmigrationen so erschwert oder sogar unmöglich werden. Zu beachten ist bei der Wahl des Archivformats auch die Kompatibilität von Format und Codec. Eine Zusammenstellung finden Sie unter AG Media.
Darüber hinaus muss basierend auf den Anforderungen der vorgesehenen Nutzerzielgruppen auch eine Entscheidung über die Formate für Nutzungskopien getroffen werden.

Empfehlung

Die große Vielfalt potenzieller Ablieferungsformate und Codecs stellt Privatanwender vor eine große Herausforderung. Je höher die Anzahl der Dateiformate und Codecs, desto größer ist der Aufwand für die Bestandserhaltung (Content-Preservation). Es ist deshalb sinnvoll, die Anzahl der Dateiformate und Codecs im digitalen Langzeitarchiv auf eine kleine Auswahl zu beschränken.
Wenn möglich, sollte eine Normalisierung (Vereinheitlichung) in ein offenes und standardisiertes Dateiformat erfolgen, um den Verwaltungsaufwand für verschiedene Dateiformate und Wiedergabesoftware zu minimieren. Für die Normalisierung stehen verschiedene Konvertierungsprogramme als proprietäre oder Open-Source-Software zur Verfügung.
Wenn Normalisierung nicht möglich ist, ist darauf zu achten, dass das Dateiformat die o.g. Anforderungen so gut wie möglich erfüllt.
Soll für die Nutzung auf den Archivmaster zugegriffen werden, ist unbedingt zu beachten, dass die Wiedergabesoftware den Archivmaster nicht (versehentlich) manipulieren kann. Dies lässt sich z.B. durch read-only-Zugriff auf den Archivmaster erreichen.
Als Archivformat bietet sich v.a. Matroska (*.mkv) an. Dabei handelt es sich um ein freies, robustes, wenig komplexes, plattformunabhängiges und weitverbreitetes Containerformat mit vergleichsweise geringen Dateigrößen. Die Konvertierung nach Matroska ist mit gängiger Konvertierungssoftware (z.B. Wondershare, XMedia Recode, FFmpeg) ohne Weiteres möglich. Ebenso wichtig wie das Containerformat an sich ist ein geeigneter Codec. Matroska unterstützt zahlreiche Codecs, von denen die meisten allerdings aufgrund der verlustbehafteten Kompression nicht für die Langzeitsicherung geeignet sind. Zu empfehlen ist der verlustfreie Codec FFV1 v.3. Bei einer Konversion ist sicherzustellen, dass keine signifikanten Eigenschaften verloren gehen.

 

  • Keine Stichwörter