Auswahl des zu archivierenden Materials

In der dLZA wird mit der Auswahl die begründete Entscheidung getroffen, warum etwas archiviert werden sollte. I.d.R. werden all diejenigen Materialien archiviert, die von kulturellem Wert sind. Viele Gedächtnisorganisationen haben ein Mandat (z.B. einen gesetzlichen Auftrag), durch den sie verpflichtet sind, bestimmte Materialien dauerhaft zu sichern.

Kleinere Einrichtungen müssen oft abwägen, wie sie ihre sehr knappen Ressourcen einsetzen. Um diese manchmal auch schmerzhaften Entscheidungen transparent zu machen, sollten sie anhand der erwarteten Nutzergruppen (siehe nächster Abschnitt) einen objektiven Kriterienkatalog anlegen.

Mit diesem Kriterienkatalog können sie Dritten gegenüber argumentieren, warum sie etwas archivieren und wieso dies die entstehenden Kosten rechtfertigt. Auch ermöglicht dies festzustellen, ob man und wie man eine notwendige Langzeitarchivierung auslagert, z.B. wenn eine ordentliche Betreuung des Archivs nach aktuellem Stand der Technik oder aufgrund der Qualifikationen der Mitarbeiter nicht möglich ist.
Diese Festlegung, warum etwas archiviert werden soll, wird „Archivwürdigkeit" genannt. Ob das Material auch „archivfähig" ist, sprich: in einem Format vorliegt, welches guten Wissens und Gewissens als Archivformat genutzt werden kann, wird in den Abschnitten „Erhaltungsstrategien“, S. 99, und „Datenformate und Codecs“, S. 101, näher beleuchtet.

Beschreibung der vorgesehenen Nutzungsszenarien

Die Archivierung und insbesondere die Langzeitarchivierung sind mit hohen Kosten verbunden. Um sicherzustellen, dass das ausgewählte Material auch langfristig nicht nur gesichert, sondern auch zur Nutzung verfügbar gehalten wird, ist es wichtig, im Auge zu behalten, welche Nutzer des Archivs denn infrage kommen und welche Anforderungen sich daraus ergeben. Wenn man die Anforderungen der verschiedenen Nutzer gruppiert und die für diese jeweils relevanten Aspekte festhält, erreicht man zwei Dinge: Erstens lernt man seine Nutzergruppen kennen und kann seine Arbeit priorisieren.

Beides erleichtert die Zielgruppenanalyse, d.h. die stetige Überprüfung, ob man als Einrichtung auf die Anforderungen seiner Nutzer eingestellt ist und ggf. Korrekturen vornehmen sollte. Zweitens ergeben sich daraus die signifikanten Eigenschaften, d.h. welche Aspekte des Fernsehmitschnittes im Laufe des Archivlebens in seinen grundlegenden Eigenschaften bewahrt werden müssen. Soll der Zweikanalton erhalten bleiben, weil Nutzer die Sendung später auf Englisch und Deutsch schauen wollen? Spielt die Audioqualität eine besondere Rolle, da es sich um ein Konzertmitschnitt aus dem örtlichen Konzerthaus handelt und die Einrichtung Musikstudenten als Nutzer hat? Oder ist die Bildqualität wichtig, weil man nur dann die Vortragsfolien lesen kann?

Aus der Analyse der Nutzerzielgruppen ergibt sich in Teilen auch die Frage des Zugriffs auf das Archiv. Wie und wem (einem Bereitstellungssystem oder dem Kunden direkt) werden die Daten bereitgestellt? Müssen Nutzungsrechte berücksichtigt werden und wo werden diese geprüft?

Qualitätsmanagement

Unter Qualitätsmanagement wird verstanden, dass das zu archivierende Material in einer Form übernommen wird, die technisch fehlerfrei ist, voll den Spezifikationen entspricht und auch inhaltlich mit den Metadaten übereinstimmt.

Kleinere Einrichtungen werden in der Regel kaum Aufwand für das Qualitätsmanagement betreiben können. Sie sollten zumindest eine Sichtprüfung des Fernsehmitschnittes vornehmen und sich nicht nur auf die Ausgabe von Standardsoftware wie Videoschnittprogrammen verlassen.

Erhaltungsstrategien

Bitstream-Preservation

Basis der Erhaltungsstrategien ist immer die Bitstream-Preservation, d.h. die bitgenaue digitale Kopie des zu archivierenden Materials. Um festzustellen, ob die zu sichernden Materialien korrekt gespeichert sind, bietet es sich an, Prüfsummen zu erstellen (z.B. Sha256), mit denen sich feststellen lässt, ob der Inhalt verändert ist (Integritätssicherung). Diese sollten direkt nach der Erstellung des Materials (hier: Aufzeichnung des Fernsehmitschnittes) berechnet und nach jedem Kopiervorgang geprüft werden.

Es gibt verschiedene Technologien, um Datenströme effizient und möglichst sicher zu speichern. Nach aktuellem Stand der Technik ist für kleine Einrichtungen nur die Speicherung von Mehrfach-Kopien sinnvoll. Als einfachste, automatische Lösung bieten sich hier Raid-10-Systeme, z.B. in Form von NAS-Boxen, an die regelmäßig auf Magnetbänder abgezogen werden. Raid-5-Systeme sind nicht zu empfehlen, da bei der Wiederherstellung von ausgefallenen Platten die restliche Hardware übermäßig beansprucht wird.

Eine Sicherung auf DVDs und CD-ROMs ist generell nicht empfehlenswert, da handelsübliche Medien schnell altern. In Einzelfällen können Speziallaufwerke mit speziellen Rohlingen für DVDs zur Archivierung genutzt werden. Wenn man die Wahl hat, sollte man auf Bänder mit LTO-Bandlaufwerken sichern. Dies ist günstiger und bei ordentlicher Lagerung die haltbarste Variante.

Content-Preservation

Um aber das zu archivierende Material nicht nur zu sichern, sondern auch langfristig nutzbar zu halten, im Falle der Fernsehmitschnitte also abzuspielen und anzuschauen, muss die Darstellbarkeit des Inhalts gesichert werden (Content-Preservation). Dabei sollte frühzeitig bekannt sein, welche Eigenschaften des Materials über die Zeit unbedingt erhalten bleiben müssen, d.h. welche Eigenschaften signifikant für die Nutzung sind. Dies kann in dem einen Fall der hochwertige Mehrkanalton sein, im zweiten die Bildqualität und im dritten die Farbtreue.

Bei den Erhaltungsstrategien unterscheidet man grob zwischen Emulation und Formatmigration. Im ersten Fall erstellt man eine Emulation einer bestimmten Umgebung, die Hardware, Betriebssystem und installierte Software umfasst und die zum Archivierungszeitpunkt in der Lage ist, die gesicherten Materialien wiederzugeben. Sollte ein Videoformat eines Fernsehmitschnittes nicht mehr von aktueller Software unterstützt werden, so kann man diesen über die emulierte Umgebung noch abspielen. Im zweiten Fall versucht man die zu archivierenden Materialien in einem besonders für die Archivierung geeigneten Format zu speichern. Sollte dann ein Dateiformat veralten, kann rechtzeitig und unter Beachtung der zu bewahrenden, signifikanten Eigenschaften eine Konvertierung in ein anderes Dateiformat vorgenommen werden.

Für kleinere Einrichtungen empfiehlt sich meist der zweite Ansatz. Eine Empfehlung für archivfähige Formate finden Sie unter AG Media.

Authentizität

Unter Authentizität wird verstanden, dass nachgewiesen wird, dass ein gesichertes Objekt auch das ist, was es vorgibt zu sein. Dies ist z.B. bei elektronischen Urkunden wichtig, wo man auch bei zwischenzeitlich veralteten elektronischen Signaturen nachweisen möchte, dass die Urkunde nicht verändert wurde.

Für Fernsehmitschnitte ist in den Metadaten mitzuführen, welche Sendung wann aufgenommen wurde. Ebenso sind Prüfsummen über die Fernsehmitschnitte zu erstellen. Während der Archivierung sind Änderungen an den gespeicherten Archivdaten (AIP) zu protokollieren und ggf. auszuweisen. Für ein digitales Langzeitarchiv empfiehlt sich, immer die Originaldaten aus dem Ingest im Archiv zu behalten und auf diese mitzuverweisen. Dies gilt auch für den Fall, dass eine Formatmigration stattgefunden hat.

Durch technische und organisatorische Maßnahmen ist sicherzustellen, dass eine Überprüfung der Protokollierung möglich ist.

Metadaten

Unter Erschließung wird zum einen die Erfassung von filmografischen Metadaten verstanden (Katalogisierung), zum anderen die Inhaltserschließung. Die filmografischen Metadaten umfassen i.d.R. die Urheber des Werkes, das Erscheinungsjahr, Herausgeber und Verleger, sonstige Mitwirkende und Besonderheiten.
Die inhaltliche Erschließung von Filmmitschnitten ermöglicht es, in einer größeren Sammlung von Werken nach bestimmten Szenen, gesprochenen Worten, Stimmungen usw. zu suchen. Die Basiskatalogisierung kann dabei selbstständig oder, wenn möglich, aus Beständen Dritter übernommen werden.
Um eine schnellere Verarbeitung in Fällen der Formatmigration oder Metadaten-Updates zu gewährleisten, sollten die filmografischen Metadaten separat zum Mitschnitt (und nicht primär innerhalb des Datenformats des Mitschnitts) in einem allgemein akzeptierten Metadatenstandard gespeichert werden. I.d.R. liegt man mit METS/MODS richtig, welches u.a. als Standardformat im DFG-Viewer eingesetzt wird.

Präsentation/Zugriff

Für die Nutzung der archivierten Medien wird oft auf Vorschauen zurückgegriffen, die das archivierte Material in reduzierter Auflösung, speziell kodiert oder in Sequenzen unterteilt repräsentieren. Dies macht insbesondere dann Sinn, wenn das Archiv über Webplattformen erreichbar sein soll und die Kosten für die Datenübertragung eine große Rolle spielen.
Kleinere Einrichtungen sollten sich bemühen, diese Trennung in Präsentationsformate und Archivformate vorzunehmen.
Wo dies nicht sinnvoll umgesetzt werden kann, sollte der Kompromiss darin bestehen, den im folgenden Abschnitt beschriebenen Anforderungen an ein Archivformat den Vorrang einzuräumen und aus o.g. Gründen erforderliche Qualitätsabstriche abhängig von den definierten Nutzeranforderungen zu bewerten. Der Zugriff auf die archivierten Daten muss so abgesichert sein, dass die Abspielprogramme bzw. Webzugriffe das Archiv nicht kompromittieren können (z.B. durch read-only-Zugriff und Proxies).

Dateiformate und Codecs

Im Folgenden werden Anforderungen an ein Archivformat (Dateiformat und Codec) aufgeführt:

  • Standardisierung und Offenheit des Formats (notfalls offen spezifiziert)
  • Robustheit (einzelne Bitfehler sind in ihrer Wirkung begrenzt)
  • hohe Verbreitung
  • niedrige Komplexität (benötigte Rechenzeit)
  • Selbstbeschreibung (Bin ich ein Matroska-File?)
  • Lizenz- und Patentfreiheit
  • Erkennbarkeit/Validierbarkeit des Formates (Gibt es ein Prüftool?)
  • Verschlüsselungsfreiheit
  • Unabhängigkeit von spezieller Hard-/Software


Fernsehmitschnitte werden i.d.R. via DVB-T, DVB-S oder DVB-C empfangen. Die Ausstrahlung über die digitalen Fernsehkanäle nach Digital Video Broadcasting (DVB) resultiert oft in Dateien (MPEG-TS), die verschiedene Datenströme für Video, Audio, Teletext, MHP und EPG enthalten. Die Videodaten sind MPEG-2 oder MPEG-4 (in H.264) kodiert, die Audiodaten in MP2 oder AC-3. Da diese MPEG-TS-Daten oftmals mehrere Audio- und Videodaten von unterschiedlichen Sendern enthalten, bietet es sich an, diese mithilfe von Werkzeugen wie mplayer (<http://www.mplayerhq.hu/>) oder FFmpeg (<https://www.ffmpeg.org/>) in Matroska-Container (Endung .mkv) zu konvertieren.

Dabei können die Codecs für die Video- und Audiodatenströme von DVB ohne Rekodierung weiterverwendet werden, da o.g. Codecs standardisiert sind und als weitverbreitet angesehen werden können. Dabei sollte man im Hinterkopf behalten, dass diese Codecs verlustbehaftet und für den Videoschnitt eher ungeeignet sind.

Matroska (<http://www.matroska.org/>) als Container bietet sich an, weil es sich um ein freies Containerformat für Videodateien handelt, welches Synchronität gewährleistet und eine gute Verbreitung besitzt.

 

  • Keine Stichwörter