Auswahl des zu archivierenden Materials

In der dLZA wird mit der Auswahl die begründete Entscheidung getroffen, warum etwas archiviert werden sollte. I.d.R. werden all diejenigen Materialien archiviert, die von kulturellem Wert sind. Viele Gedächtnisorganisationen haben einen gesetzlichen Auftrag, durch den sie verpflichtet sind, bestimmte Materialien dauerhaft zu sichern.

Für den Privatanwender gibt es diese Pflichten nicht, er wird oft auch Materialien sichern, die nicht einzigartig sind oder einen hohen kulturellen Wert haben. I.d.R. hat er ein privates Interesse, etwas langfristig verfügbar zu halten. Sei es sein eigenes Filmarchiv, Teile seines Lebenswerkes, oder vielleicht nur eine Materialsammlung seiner Hobbies.

Auch wenn Privatanwender bei der Auswahl Dritten gegenüber nicht verpflichtet sind, so sollten sie dennoch Notizen hinterlegen, warum sie etwas archiviert haben. Dies ermöglicht es, noch zu Lebzeiten oder in der Beurteilung des Nachlasses festzustellen, ob eine Nutzung (noch) sinnvoll ist oder nicht.

Die Festlegung, warum etwas archiviert werden soll, wird „Archivwürdigkeit" genannt. Ob das Material auch „archivfähig" ist, sprich: in einem Format vorliegt, welches guten Wissens und Gewissens als Archivformat genutzt werden kann, wird in den Abschnitten Erhaltungsstrategien und Formate näher beleuchtet.

Beschreibung der vorgesehenen Nutzungsszenarien

Die Archivierung und insbesondere die Langzeitarchivierung sind mit hohen Kosten verbunden. Um sicherzustellen, dass das ausgewählte Material auch langfristig nicht nur gesichert, sondern auch zur Nutzung verfügbar gehalten wird, ist es wichtig, im Auge zu behalten, welche Nutzer des Archivs infrage kommen und welche Anforderungen sich daraus ergeben.Für den Privatanwender ist es nicht notwendig, diese Nutzerzielgruppen zu definieren, da er und sein Umfeld i.d.R. die einzigen Nutzer des Archivs sein werden.

Auch ein Privatanwender sollte sich Gedanken machen, welche Aspekte des Fernsehmitschnittes für ihn wichtig sind. Soll der Zweikanalton erhalten bleiben, weil man die Sendung später noch einmal in Englisch schauen möchte? Spielt die Audioqualität eine besondere Rolle, da es sich um ein Konzert aus dem Gewandhaus handelt? Oder ist die Bildqualität wichtig, weil man nur dann die Vortragsfolien lesen kann?
Auch ist es sinnvoll, sich Gedanken darüber zu machen, wie man später auf seine Fernsehmitschnitte zugreifen will. Wie findet man diese wieder? Wie möchte man das Archiv nutzen? Es kann nicht schaden, sich auch hierüber ein paar Notizen zu machen.

Qualitätsmanagement

Unter Qualitätsmanagement wird verstanden, dass das zu archivierende Material in einer Form übernommen wird, die technisch fehlerfrei ist, voll den Spezifikationen entspricht und auch inhaltlich mit den Metadaten übereinstimmt. Der Privatanwender wird i.d.R. keinen Aufwand für das Qualitätsmanagement betreiben und zumindest eine grobe Sichtprüfung des Fernsehmitschnittes vornehmen.

Erhaltungsstrategien

Bitstream-Preservation

Basis der Erhaltungsstrategien ist immer die Bitstream-Preservation, d.h. die bitgenaue digitale Kopie des zu archivierenden Materials. Um festzustellen, ob die zu sichernden Materialien korrekt gespeichert sind, bietet es sich an, Prüfsummen zu erstellen (z.B. Sha256), mit denen man feststellen kann, ob der Inhalt verändert ist (Integritätssicherung). Diese sollten direkt nach der Erstellung des Materials (hier: Aufzeichnung des Fernsehmitschnittes) berechnet und nach jedem Kopiervorgang geprüft werden. Es gibt verschiedene Technologien, um Datenströme effizient und möglichst sicher zu speichern.
Nach aktuellem Stand der Technik ist für den Privatanwender nur die Speicherung von Mehrfach-Kopien sinnvoll. Als einfachste, automatische Lösung bieten sich hier Raid-10-Systeme, z.B. in Form von NAS-Boxen, an:

  • Raid-5-Systeme sind nicht zu empfehlen, da bei der Wiederherstellung von ausgefallenen Platten die restliche Hardware übermäßig beansprucht wird.
  • Eine Sicherung auf DVDs und CD-ROMs wird ebenfalls nicht empfohlen, da handelsübliche Medien schnell altern und Endkunden-Hardware keine der speziellen Rohlinge für die Archivierung brennen kann.
  • Im Notfall tut es auch das händische Sichern des Archivs auf mehrere USB-Festplatten oder (verschlüsselt) in Clouds.
Content-Preservation

Um das zu archivierende Material nicht nur zu sichern, sondern auch langfristig nutzbar zu halten, im Falle der Fernsehmitschnitte also abzuspielen und anzuschauen, muss die Darstellbarkeit des Inhalts gesichert werden (Content-Preservation).

Dabei sollte frühzeitig bekannt sein, welche Eigenschaften des Materials über die Zeit unbedingt erhalten bleiben müssen, da diese signifikant für die Nutzung sind. Dies kann in dem einen Fall der hochwertige Mehrkanalton sein, im zweiten die Bildqualität und im dritten die Farbtreue.

Bei den Erhaltungsstrategien unterscheidet man grob zwischen Emulation und Formatmigration. Im ersten Fall erstellt man eine Emulation einer bestimmten Umgebung, die Hardware, Betriebssystem und installierte Software umfasst, die zum Archivierungszeitpunkt in der Lage ist, die gesicherten Materialien wiederzugeben. Sollte ein Videoformat eines Fernsehmitschnittes nicht mehr von aktueller Software unterstützt werden, so kann man dieses über die emulierte Umgebung noch abspielen. Im zweiten Fall versucht man, die zu archivierenden Materialen in einem besonders für die Archivierung geeigneten Format zu speichern. Sollte dann ein Dateiformat veralten, kann rechtzeitig und unter der Beachtung der zu bewahrenden, signifikanten Eigenschaften eine Konvertierung in ein anderes Dateiformat vorgenommen werden.

Für den Privatanwender empfiehlt sich der zweite Ansatz. Eine Empfehlung für archivfähige Formate finden Sie unter AG Media.

Authentizität

Die Sicherung der Authentizität ist i.d.R. keine Anforderung, die an einen Privatanwender gestellt wird. Damit ist gemeint, dass nachgewiesen wird, dass ein gesichertes Objekt auch das ist, was es vorgibt zu sein. Dies ist z.B. bei elektronischen Urkunden wichtig, wo man auch bei zwischenzeitlich veralteten elektronischen Signaturen nachweisen möchte, dass die Urkunde nicht verändert wurde.

Metadaten

Unter Erschließung wird zum einen die Erfassung von filmografischen Metadaten verstanden (Katalogisierung), zum anderen die Inhaltserschließung.
Die filmografischen Metadaten umfassen i.d.R. die Urheber des Werkes, das Erscheinungsdatum, Herausgeber und Verleger, sonstige Mitwirkende und Besonderheiten wie Aufnahmezeitpunkt, Sender usw.

Die inhaltliche Erschließung von Filmmitschnitten ermöglicht es, in einer größeren Sammlung von Werken nach bestimmten Szenen, gesprochenen Worten, Stimmungen usw. zu suchen. Für den Privatanwender ist die Erschließung mit hohem Aufwand verbunden. Dennoch erleichtert eine leichtgewichtige, standardisierte Metadaten-Datei die spätere Nutzung. Viele Mediendatenbanken erlauben eine komfortable Eingabe. Als ein Beispiel seien die freien Softwarepakete Tellico (<http://tellico-project.org/>), DataCrow (<http://www.datacrow.net/>) und GCStar (<http://www.gcstar.org/>) genannt.

Präsentation/Zugriff

Für die Nutzung der archivierten Medien wird oft auf Vorschauen zurückgegriffen, die das archivierte Material in reduzierter Auflösung, speziell kodiert oder in Sequenzen unterteilt repräsentieren. Dies macht insbesondere dann Sinn, wenn das Archiv über Webplattformen erreichbar sein soll und die Kosten für die Datenübertragung eine große Rolle spielen.

Dateiformate und Codecs

Für den Privatanwender ist die Trennung in Präsentationsformate und Archivformate i.d.R. nicht sinnvoll. Wenn der Zugriff (Access) auf die archivierten Daten (Master) direkt erfolgen soll, ist unbedingt darauf zu achten, dass die Abspielprogramme das Archiv nicht kompromittieren können (z.B. durch read-only-Zugriff).

Im Folgenden werden Anforderungen an ein Archivformat (Dateiformat und Codec) aufgeführt:

  • Standardisierung und Offenheit des Format (notfalls offen spezifiziert)
  • Robustheit (einzelne Bitfehler sind in Wirkung begrenzt)
  • hohe Verbreitung
  • niedrige Komplexität (benötigte Rechenzeit)
  • Selbstbeschreibung (Bin ich ein Matroska-File?)
  • Lizenz- und Patentfreiheit
  • Erkennbarkeit/Validierbarkeit des Formates (Gibt es ein Prüftool?)
  • Verschlüsselungsfreiheit
  • Unabhängigkeit von spezieller Hard-/Software


Fernsehmitschnitte werden i.d.R. via DVB-T, DVB-S oder DVB-C empfangen. Die Ausstrahlung über die digitalen Fernsehkanäle nach Digital Video Broadcasting (DVB) 3 resultiert oft in Dateien (MPEG-TS), die verschiedene Datenströme für Video, Audio, Teletext, MHP und EPG enthalten. Die Videodaten sind MPEG-2 oder MPEG-4 (in H.264) kodiert, die Audiodaten in MP2 oder AC-3. Da diese MPEG-TS-Daten oftmals mehrere Audio- und Videodaten von unterschiedlichen Sendern enthalten, bietet es sich an, diese mithilfe von Werkzeugen wie mplayer (<http://www.mplayerhq.hu/>) oder FFmpeg (<https://www.ffmpeg.org/>) in Matroska-Container (Endung .mkv) zu konvertieren.

Dabei können die Codecs für die Video- und Audiodatenströme von DVB ohne Rekodierung weiterverwendet werden, da o.g. Codecs standardisiert sind und als weitverbreitet angesehen werden können. Dabei sollte man im Hinterkopf behalten, dass diese Codecs verlustbehaftet und für den Videoschnitt eher ungeeignet sind.

Matroska (<http://www.matroska.org/>) als Container bietet sich an, weil es sich um ein freies Containerformat für Videodateien handelt, welches Synchronität gewährleistet und eine gute Verbreitung besitzt.

 

  • Keine Stichwörter