Im Gegensatz zu den anderen Medientypen dieser Handreichung werden die Empfehlungen für die Archivierung von professionellen Filmen nicht in die einzelnen Gruppen der Privatanwender und der verschiedenen Institutionstypen unterteilt. Die digitale Langzeitarchivierung von professionellen Filmen erfordert hohe personelle und technische Ressourcen, die i.d.R. durch private Personen oder kleinere Institutionen nur sehr schwer zu leisten sind. Selbst große Institutionen, die mit der Archivierung von professionellem Film betraut sind, liegen in der Entwicklung einer vertrauenswürdigen Langzeitarchivierung hinter Bibliotheken und Archiven weit zurück.

Das Kapitel „Archivierung von professionellen Filmen“ orientiert sich an DIN 31644 „Information und Dokumentation – Kriterien für vertrauenswürdige digitale Langzeitarchivierung“ und nimmt Bezug auf die Besonderheiten und Herausforderungen für professionelle AV-Materialien. Dabei werden vorwiegend jene Kriterien der DIN 31644, die durch diesen Medientyp beeinflusst werden, in den Vordergrund gerückt. In manchen Abschnitten wie z.B. über den Umgang mit deskriptiven Metadaten können dabei Empfehlungen ausgesprochen werden, in anderen Fällen gelingt lediglich eine Bestandsaufnahme der Herausforderungen. Der Text stellt deshalb gleichsam einen Anfangspunkt für noch zu entwickelnde Lösungen dar.
Die Differenzierung zwischen Amateurfilmen und professionellen Filmen wird in dieser Handreichung nicht technisch oder qualitativ unterschieden, sondern strukturell. Professioneller Film zeichnet sich durch eine Produktionsgesellschaft oder -firma aus, die die Herstellung, also insbesondere Finanzierung, Dreharbeiten und Postproduktion koordiniert. Bekannte Produktionsgesellschaften in Deutschland sind z.B. Constantin Film AG oder Bavaria Film GmbH.

Für kleinere Filmproduktionen werden jedoch auch kleinere Produktionsgesellschaften gegründet, an denen Regisseure und andere Filmschaffende beteiligt sein können oder diese innehaben. Ein Beispiel ist Harun Farocki GbR (Berlin). An Fernsehproduktionen können Produktionsgesellschaften beteiligt sein, oft übernehmen auch Fernsehanstalten diese Rolle selbst. Nicht selten sind Koproduktionen verschiedener Produktionsfirmen für Film- oder Fernsehproduktionen.


Auswahl des zu archivierenden Materials

Für die Auswahl des zu archivierenden Materials bilden in der digitalen – genauso wie in der analogen – Archivierung zunächst sogenannte Selektionskriterien die Grundlage. Selektionskriterien können inhaltlich, formal, rechtlich oder qualitativer Art sein. So können z.B. ein spezifisches Sammlungsprofil, ein gesetzlicher Auftrag oder ein Depositalvertrag zwischen Archiv und Produzent rechtliche Selektionskriterien sein. Ein Archiv bestimmt damit, welche Objekte es für archivwürdig hält.
Daneben bilden auch formale Selektionskriterien eine Rolle. Diese beinhalten, mit welchen digitalen Formaten ein Archiv umgehen kann. Solche digitalen Formate werden auch als archivfähig beschrieben. Durch eine Übernahmeregelung bzw. einen Erhaltungsplan legt ein Archiv fest, welche Formate es als archivfähig definiert.
Professionelle Filmproduktionen zeichnen sich jedoch mehr als andere Medientypen durch komplexere Produktionsprozesse und verschiedene Distributionsformate und -fassungen aus. Beispielsweise durch Verleihfassungen für den nationalen oder internationalen Markt, veränderte Schnittfassungen wie beispielsweise ein Director‘s Cut oder durch die Veröffentlichung für bestimmte Zielgruppen wie z.B. eine Kinodistribution oder eine erwerbbare DVD.
Durch die unterschiedlichen Varianten, aber auch durch die verschiedenen Displayformate in den jeweiligen Anwendungskontexten entstehen große Datenmengen. Soll neben autorisierten Masterfassungen auch noch das Drehmaterial archiviert werden – ein Drehverhältnis für professionelle Film- und Fernsehproduktionen reicht von 1:6 bis 1:100 – potenzieren sich entsprechend Aufwand und notwendige Ressourcen.
All diese Umstände stellen spezielle Herausforderungen bei der Auswahl des zu archivierenden Materials dar:

  1. Ein Archiv muss dafür Sorge tragen, dass die sorgfältige Erschließung der professionellen Filme, ihrer unterschiedlichen Varianten und Manifestationen gewährleistet wird, um Informationsobjekte genau zu bestimmen. Erst dadurch kann eine Auswahl hinreichend erfolgen, die Authentizität gewahrt, und gleichzeitig eine mögliche redundante Archivierung in verschiedenen Institutionen vermieden werden. Als derzeitige dafür vorauszusetzende Standards für die Erschließung filmografischer Daten sind CEN TC 372 Metadata Standards und die FIAF Cataloguing Rules zu nennen.
  2. Ein Archiv sollte seine Sammlungspolitik und seine Selektionskriterien genau bestimmen und im optimalen Fall transparent veröffentlichen. Diese sollten auch in Abhängigkeit der verfügbaren Ressourcen betrachtet werden. So wäre z.B. möglich,dass eine Institution, deren Zielgruppe durch die Vermittlung von Filmen bestimmt wird, sich lediglich auf die Archivierung von autorisierten Manifestationen beschränkt, die für die Veröffentlichung bestimmt sind. Die dLZA des Drehmaterials könnte z.B. die Produktionsgesellschaft selbst übernehmen oder an eine andere Institution abgeben. Dabei ist eine redundante Speicherung in verschiedenen Institutionen zu vermeiden. Mehr als in der analogen Archivierung ist in der dLZA eine vorausschauende Planung von der Produktion bis zur Fertigstellung eines Filmprojekts notwendig. Sowohl für das Archiv, welches die Ressourcen für die Archivierung bereitstellen muss,als auch für die Produzenten, die sich auf die Anforderungen und Bedingungen des Archivs einstellen müssen, können dabei Übernahmevereinbarungen bzw. -richtlinien hilfreich sein, die rechtliche, formale und technische Absprachen zwischen Archiv und Produzenten definieren.
  3. Abhängig der jeweiligen unterschiedlichen Produktions-, aber auch Digitalisierungsverfahren sieht sich ein Archiv mit unterschiedlichsten Dateiformaten und Codecs konfrontiert. Infolgedessen muss ein Archiv deshalb definieren, welche Formate archivfähig sind.

Beschreibung der vorgesehenen Nutzungsszenarien

Die erläuterte Auswahl von Archivmaterialien hängt mit den Nutzungsszenarien zusammen. Durch eine entsprechende Auswahl, beispielsweise durch eine entsprechende Sammlungspolitik oder andere Selektionskriterien, ergeben sich zunächst bestimmte Nutzungsszenarien. Darunter werden Anfragen einer oder mehrerer bestimmter Gruppen an das Archiv verstanden, z.B. können digitale Filme an Kinos für Vorführungen verliehen werden. Auch der Filmwissenschaftler, der einen Filmausschnitt in seine Präsentation einarbeiten will, kann ein Nutzungsszenario darstellen.

Nutzungsszenarien von digitalen AV-Materialien zeichnen sich jedoch durch unterschiedliche Anforderungen und eine Bandbreite an Akteuren aus. Das Kino wird Wert auf eine hohe Auflösung legen, der Filmwissenschaftler eher auf eine geringe Dateigröße. Das Archiv bzw. der Regisseur legt Wert darauf, dass sich innerhalb der verschiedenen Nutzungsszenarios die Authentizität des Werks nicht verfälscht; beispielsweise durch eine Farbverschiebung infolge einer Formatmigration.

Die erste Herausforderung für die Archive liegt darin, die jeweiligen Nutzungsszenarien zu beschreiben, um den Bedürfnissen und Anforderungen der Nutzer entsprechend gerecht werden zu können. Eine geeignete Methode dafür ist eine Zielgruppenanalyse anhand einer Befragung oder auch eine Evaluierung der bisherigen Nutzungsszenarien. Dadurch können die häufigsten und relevanten Szenarien definiert bzw. eingegrenzt werden. In Anbetracht der Vielfalt von technischen Systemen und Akteuren wird ein Archiv jedoch nicht alle Anforderungen und Spezifikationen für die Nutzung von AV-Materialien abdecken können.

Die zweite Herausforderung für das Archiv beinhaltet die Definition der sogenannten signifikanten Eigenschaften. Darunter versteht man Attribute eines Informationsobjekts, welche für die Authentizität als relevant erachtet werden. Signifikante Eigenschaften für alle Nutzungsszenarien können z.B. Farbigkeit, Aufnahmegeschwindigkeit oder das Seitenverhältnis sein – Eigenschaften, die sich also keinesfalls ändern sollten. Eine signifikante Eigenschaft für ein spezifisches Nutzungsszenario, beispielsweise die Projektion eines Films im Kino, kann z.B. der Raumklang, also ein Mehrkanalton sein.

Drittens muss das Archiv auf Änderungen von Anforderungen entsprechend reagieren. Beispielsweise ändern sich durch entsprechende Displayentwicklungen wie z.B. UHD oder die digitale Projektion von AV-Materialien auch deren Dateiformate und Codecs. Das Archiv muss infolgedessen notwendige Nutzungsformate auch anpassen können.

Empfehlung

Beschreibung und klare Abgrenzung der Nutzergruppen
Definition der signifikanten Eigenschaften
Festlegung von spezifischen Formaten für die Nutzung
kontinuierliche Analyse der Bedürfnisse der Nutzer

Qualitätsmanagement

Aufgrund der leichten Manipulierbarkeit von digitalen Objekten sind Qualitätssicherung und Validierung wesentliche Arbeitsschritte in der dLZA, die v.a. in der Übernahme, aber auch in den anderen funktionalen Bereichen des OAIS-Modells vorausgesetzt werden. In der Übernahme sind diese Verfahren ein besonders kritischer Prozess, da sie maßgeblich alle weiteren Prozesse der dLZA beeinflussen.

Die Qualitätssicherung stellt durch die Validierung der Persistenzinformationen sicher, dass das Inhaltsinformationsobjekt sich nicht undokumentiert verändert. Verfahren der Qualitätssicherung sind erstens Dateiintegritätsprüfungen, z.B. durch zyklische Redundanzprüfungen (CRC-Verfahren) oder durch Prüfsummen, die Transferprozesse dokumentieren, und zweitens die Verfahren der Formatvalidierungen und Formatspezifizierungen. Nach den Vorgaben der DIN 31645 lassen sich Validierungen demnach in zwei verschiedene Klassen von Vergleichszielen unterscheiden:

Einerseits wird das zu validierende Objekt anhand seines „Eltern-Objekts“ überprüft, indem die Prüfsummen des digitalen Objekts vor und nach dem Transferprozess miteinander verglichen werden. Diese erste Klasse kann gleichgesetzt werden mit der Definition der Überprüfung der Dateiintegrität.  
Andererseits wird nach inhaltlichen und formalen Vorgaben überprüft, ob das Format einer Datei auch seiner dokumentierten Spezifikation entspricht, bzw. inwieweit es davon abweicht. Dafür sind bestimmte Validierungs- und Verifizierungsschlüssel erforderlich, anhand derer die Authentizität des digitalen Objekts überprüft wird. Es wird damit sichergestellt, dass eine Information auch tatsächlich das ist, was sie vorgibt zu sein. Diese zweite Klasse kann mit den Begriffen Formatvalidierung und Formatspezifizierung gleichgesetzt werden.

Das Archiv muss dabei zunächst diese beiden Klassen von Validierungsprozessen (also Dateiintegritätsprüfung und Formatspezifizierung und -validierung) konkret definieren, abgrenzen und benennen. Schließlich muss das Archiv den Rahmen und die Bedingungen dieser Prozesse, d.h. ihren Erfüllungsgrad bestimmen.

Abhängig von den Richtlinien der Institution und dem Erfüllungsgrad der Qualitätssicherung und Validierung werden bei der Übernahme spezifische Dateiformate oder definierte Übergabepakete (SIP) unter Berücksichtigung der Dateiintegrität übernommen. Zur Veranschaulichung lassen sich zwei verschiedene Extrema nennen: Im optimalen Fall liegt einerseits ein definiertes Übergabepaket vor, das andererseits Dateiformate beinhaltet, die seitens des Archivs als Archivformate akzeptiert sind. Folglich lassen sich in der Qualitätssicherung und der Validierung des Dateiformats bestimmte – anschließend erläuterte – Prozesse anwenden,  und es kann darüber hinaus auf eine Migration der Dateiformate verzichtet werden. Im ungünstigsten Fall übernimmt das Archiv Dateiformate, die sich nicht als Archivformate eignen und außerdem nicht als Übergabepaket definiert sind. Dementsprechend lassen sich in der Qualitätssicherung und Validierung bestimmte Maßnahmen zum einen nicht durchführen, zum anderen ist ein Migrationsprozess in ein akzeptiertes Archivformat obligatorisch.

In der Praxis werden Qualitätssicherung und Validierungsprozesse durch Software unterstützt. In vielen Fällen greift dabei eine Software auf gepflegte Registraturen von Dateiformaten zurück, in welchen Formate beschrieben und charakterisiert sind. An dieser Stelle sollen drei weitverbreitete, softwareunterstützte Registraturen vorgestellt werden, die von verschiedenen Institutionen bzw. Initiativen derzeit weiterentwickelt und gepflegt werden.

Erstens die Initiative PRONOM der britischen Behörde The National Archives. Das Online-Informationssystem PRONOM stellt dabei eine Formatregistratur bereit, die sich mithilfe der Software DROID (Digital Record Object Identification), ebenfalls entwickelt von The National Archives, abfragen lässt. PRONOM stellt zudem ein API (application programming interface) bereit, also eine Schnittstelle, die ermöglicht, dass PRONOM neben DROID auch mit anderer Software kommunizieren kann. Beispielsweise nutzt die Software FIDO mittels dieser Schnittstelle das Verzeichnis des PRONOM. Ein weiteres bedeutendes Merkmal seitens PRONOM ist die Bereitstellung von Persistent Unique Identifieres (PUIDs) für die jeweiligen Formate.

Als zweite Initiative einer softwareunterstützten Registratur ist JHOVE (JSTOR/Harvard Object Validation Environment) zu nennen. Sie wurde durch die gemeinnützige Organisation Journal Storage (JSTOR) und die Harvard University Library entwickelt und unterstützt – neben anderen Funktionen – die Formaterkennung und -validierung von digitalen Objekten.

Als dritte Initiative ist die Koordinationsstelle für die dauerhafte Archivierung von elektronischen Unterlagen (KOST) zu nennen, die ebenfalls einen Validator zur Verfügung stellt.

Für die Formaterkennung und -validierung von AV-Objekten lassen sich in den drei Initiativen jedoch Unterschiede erkennen: Der Validator der KOST unterstützt derzeit nur spezifische Text- und Bildformate und Formate für die Archivierung von Datenbanken. Die Software JHOVE schließt bestimmte AV-Materialien ebenso von der Validierung und Formaterkennung aus. Lediglich PRONOM beinhaltet Unterstützung für AV-Materialien, dabei vornehmlich jedoch für digitale Videoformate, während sich die im Kapitel „Digitaler Film“ angeführten Formate des DCP, DCDM oder IMF nicht durch PRONOM validieren lassen.

Einen sehr vielversprechenden Ausblick, insbesondere für die Validierung von AV-Materialien, bietet das im Januar 2014 gestartete EU-Projekt „Preservation formats for culture information/e-archives (PREFORMA)“. Die Hauptziele des mit 2,8 Millionen Euro ausgestatteten Projekts sind die Entwicklung und Bereitstellung von Open-Source-Software für die Formatvalidierung und Formatstandardisierung von spezifischen Dateiformaten der Medientypen Text, Bilder und AV-Medien. Für die Umsetzung des Arbeitspakets AV-Materialien wurde die Firma MediaArea beauftragt, welche für die Containerformate MKV und Ogg sowie die Codecs FFV1 und Dirac v2.2.3 den Validator MediaConch entwickeln wird.

Erhaltungsstrategien

Die Erhaltung digitaler Daten ist das Kerngeschäft des digitalen Langzeitarchivs. Maßnahmen für die Erhaltung digitaler Daten sollten nicht ad hoc erfolgen, sondern durch eine langfristige Planung sichergestellt werden. Die Beschreibung von Erhaltungsstrategien wird auch als Preservation Strategies bzw. Policies oder auch als Erhaltungsplan bezeichnet. Ein Erhaltungsplan lässt sich in zwei Bereiche gliedern: die Bitstream- und die Content-Preservation.

Bitstream-Preservation

Dabei behandelt die Bitstream-Preservation den reinen physischen Erhalt der Daten. Maßgebliche Verfahren für die Bitstream-Preservation sind eine redundante Datenhaltung, also eine Herstellung von Sicherheitskopien und eine Diversität eingesetzter Speichertechnik. Seitens der Technologie, d.h. also der Entwicklung von Speichermedien und Speichertechnik, stellt dies keine große Herausforderung mehr dar. Aktuelle technologische Lösungen sind z.B. Festplattenverbundsysteme (RAID = Redundant Array of Indepentent Disks) oder Bandbibliotheken (Tape Libraries). Unter Berücksichtigung der Notwendigkeit einer ständigen Aktualisierung solcher Systeme kann diese Frage prinzipiell als gelöst betrachtet werden. Die Frage der Bitstream-Preservation ist v.a. eine ökonomische, die abhängig von verfügbaren Mitteln und Ressourcen beantwortet wird.
Grundlegende Anforderungen an die Bitstream-Preservation sind:

  • Gewährleistung der Langzeitverfügbarkeit
  • Schutz vor unbefugtem Zugriff durch ein Rechtemanagement
  • redundante, geodiverse Speicherung
  • Integritätschecks
  • Viruschecks
  • regelmäßiger Austausch von Datenträgern
  • Monitoring und Skalierbarkeit
  • Absicherung des physischen Zugangs durch Zugriffsberechtigungen und Einbruchmeldeanlage
  • Brandschutz
  • Desaster Recovery

 

Content-Preservation

Zum anderen benötigt die dLZA jedoch tragfähige Konzepte und Verfahren für die Erhaltung der logischen und konzeptuellen digitalen Objekte. Bedingt durch die Veränderung von Interpreten der Daten wie z.B. Software, aber auch durch Veränderungen der Hardwareumgebung können Dateiformate und/oder Software obsolet werden. D.h., es sind Strategien notwendig, um die Informationen auch zukünftig verstehbar zu halten. Diese Strategien werden unter dem Begriff Content-Preservation zusammengefasst.

Dabei haben sich maßgeblich zwei verschiedene Konzepte etabliert, die beide unabhängig voneinander oder auch kombiniert zum Tragen kommen können: Migration und Emulation. Eine Definition für Migration ist „die rechtzeitige und genau dokumentierte, hinreichend ausgetestete Überführung von Daten aus einem nicht mehr beherrschbaren Format in ein anderes, das [...] eine Zukunftsperspektive hat.“ Zu differenzieren ist die Migration in vier verschiedene Arten von Migrationsprozessen. Diese sind: Refreshment, Replication, Repackaging und Transformation.

Dabei zählen Refreshment (der Austausch von gleichwertigen Datenträgern) und Replication (ein Austausch von Datenträgern, der zudem eine Anpassung der Speicherinfrastruktur vornimmt) genau genommen zu den Methoden der Bitstream-Preservation, da sie den Datenstrom nicht verändern. Repackaging und Transformation hingegen überführen die Dateien in eine andere Struktur bzw. ein anderes Format und wandeln den Bitstream um. Nur diese beiden Migrationsverfahren werden im Begriff Formatmigration zusammengefasst und sind ein Teil der Content-Preservation.
Bei der Formatmigration entsteht eine neue Repräsentation des digitalen Objekts. Es handelt sich eben nicht mehr um eine bitgenaue Kopie, sondern um eine Veränderung des Bitstreams. Der Anspruch, den verstehbaren Inhalt des Informationsobjekts, also dessen Authentizität, nicht zu verändern, kommt dabei aber zur Geltung; es werden schließlich nur die Schreib- und Lesart des Objekts geändert, nicht aber der daraus extrahierte Inhalt.
Die zweite Erhaltungsstrategie für digitale Daten bildet die Emulation. Das Konzept der Emulation sieht keine Formatmigration vor, die digitalen Objekte liegen in der Langzeitarchivierung deshalb unverändert, bitgenau vor. Zweifelsohne wird damit die Authentizität der digitalen Objekte vollständig erhalten.

Um jedoch der Obsoleszenz von veralteten Dateiformaten, der Veränderung von Hardwareumgebungen oder Betriebssystemen vorzubeugen, werden stattdessen andere Vorkehrungen getroffen. Die Emulation bildet die originale Umgebung der digitalen Objekte nach. Die originalen Anwendungsprogramme oder Betriebssysteme werden innerhalb einer weiteren, moderneren Hardware- und Softwareumgebung mit Emulatoren ausgeführt, um das Informationsobjekt zu interpretieren. Die Erforschung und Anwendung von Emulationsstrategien kommt derzeit in der Archivierung von Software, insbesondere von Computerspielen, zum Tragen – hauptsächlich weil Formatmigration sich aufgrund der Komplexität dieser digitalen Objekte ausschließt.


Für die dLZA von AV-Materialien sind derzeitig noch keine der beiden Erhaltungsstrategien entschieden. Auf fachlicher Ebene überwiegen jedoch die Debatten über die Formatmigration als zukünftige Strategie. Dabei ist anzumerken, dass sich innerhalb der Archivierung von AV-Archivalien – insbesondere durch die Digitalisierung analoger Materialien – bereits ein Bewusstsein für die Problematik geschärft hat: Es wurde von Beginn an auf archivfähige Formate gesetzt, deshalb ist bislang auch noch keine im größeren Umfang stattfindende zwingende Formatmigration bekannt.


Authentizität

Ein wesentliches Kriterium für die digitale Langzeitarchivierung ist der Erhalt der Authentizität des Informationsobjekts in den jeweiligen Repräsentationen sowie Bearbeitungsstufen. Dabei lässt sich der Erhalt bzw. die Sicherstellung der Authentizität in drei verschiedene Teilaspekte in der dLZA untergliedern. Diese sind Aufnahme, Erhaltungsmaßnahmen und schließlich Nutzung von Informationsobjekten.
Zunächst muss bei der Aufnahme, also dem Übernahmeprozess in das Archiv sichergestellt werden, dass das Informationsobjekt authentisch ist. Damit wird sichergestellt, dass ein digitales Objekt auch dem entspricht, was es inhaltlich vorgibt zu sein.
Wie im Abschnitt „Erhaltungsstrategien“ beschrieben, können durch notwendige Formatmigrationen jedoch z.B. neue Repräsentationen des Informationsobjekts entstehen. Zwangsläufig wird dadurch das Objekt verändert. Um die Authentizität nach der Formatmigration sicherzustellen, bieten sich folgende Maßnahmen an:

  • die Aufbewahrung des Originals und aller folgenden Bearbeitungen des Objekts (Versionierung der Repräsentationen)
  • der Nachweis von Veränderungen am Objekt in den Metadaten


Der dritte und letzte Teilaspekt bei der Sicherstellung der Authentizität betrifft die Nutzung von digitalen Objekten. Für die jeweiligen Nutzungsszenarien werden die verschiedenen Archivpakete zu Nutzungspaketen transformiert. Dies erfordert für AV-Materialien i.d.R. auch unterschiedliche Transkodierungen für z.B. unterschiedliche Displays. Auch hierbei muss sichergestellt werden, dass die Authentizität in den jeweiligen Nutzungsrepräsentationen gewährleistet ist.

Signifikante Eigenschaften

Ein Konzept, welches als Sicherstellung der Authentizität für alle drei Teilaspekte gilt, ist die Definition von signifikanten Eigenschaften. Das digitale Archiv identifiziert, welche Eigenschaften der digitalen Objekte als wichtig erachtet werden und damit sowohl für mögliche Erhaltungsmaßnahmen, aber auch Nutzungsszenarien voraussetzend sind. Dabei steht der Umfang der zu bewahrenden Eigenschaften einerseits in Zusammenhang mit dem Aufwand, der für die digitale Langzeitarchivierung notwendig wird, und andererseits mit den Bedürfnissen der jeweiligen Nutzungsszenarien.
Dabei lassen sich die signifikanten Eigenschaften digitaler AV-Materialien in folgenden Gruppen mit unterschiedlichen Attributen unterscheiden:

  • signifikante Eigenschaften für einzelne Pixel
  • Pixelseitenverhältnis, Farbraum, Farbmodell, Bittiefe, Subsampling
  • signifikante Eigenschaften für einen Frame (Einzelbild)
  • Auflösung horizontal und vertikal, Bildseitenverhältnis, Bildkaschierung (Pillarboxed, Letterboxed), Zeilensprungverfahren
  • signifikante Eigenschaften für die Bildfolge (Video)
  • Bildrate (Aufnahmegeschwindigkeit und Abspielgeschwindigkeit), Laufzeit, Kanäle
  • signifikante Eigenschaften für den Ton (Audio)
  • Kanäle, Abtastrate, Bittiefe, Rauschunterdrückung, Raumklang
  • signifikante Eigenschaften für Text (Untertitel, Zwischentitel o.a. Titel)
  • Schriftart, Schriftgröße, Einblend- und Ausblendzeiten, Schriftfarbe
  • signifikante Eigenschaften für Dimensionen (2D/3D/VR)
  • signifikante Eigenschaften für Kompositionen bzw. Abspielfolgen (Timecode und Elemente)


Für AV-Materialien bestimmen die signifikanten Eigenschaften auch maßgeblich Archiv- und Nutzungsformate, da diese in unmittelbarer Abhängigkeit zueinander stehen. So lassen sich z.B. Untertitel oder auch bestimmte Farbräume nur mit bestimmten Formaten abbilden.

Metadaten

Eine hohe Relevanz von Standardisierungen kommt innerhalb der dLZA insbesondere bei den Metadaten zum Tragen. Für die Dokumentation und Archivierung digitaler AV-Materialien lassen sich zunächst Metadaten hinsichtlich ihrer Funktion kategorisieren:
deskriptive Metadaten (descriptive) – beschreibende filmografische Daten
technische Metadaten (technical) – technische und formatspezifische Attribute von AV-Dateien
strukturelle Metadaten (structural) – Daten über die Zusammensetzung von digitalen Objekten
Erhaltungsmetadaten (preservation) – Metadaten für die langfristige Interpretation
administrative Metadaten (administrative) – Metadaten für die Verwaltungsinformation
rechtliche Metadaten (rights) – Metadaten über Rechteinhaber

Für jede Funktion existieren verschiedene Metadatenstandards, die Grenzen sind dabei jedoch nicht immer klar zu ziehen, mehrere Standards können auch mehrere Funktionen beinhalten. Einen universellen Metadatenstandard für die dLZA von AV-Materialien gibt es nicht, die Herausforderung liegt vielmehr darin, für den jeweiligen Anforderungskontext die geeigneten Metadatenstandards festzulegen und dabei die wesentlichen Funktionen abzudecken.

Deskriptive Metadaten

Unter deskriptiven Metadaten versteht man die bibliografische, identifizierende Beschreibung eines Objekts, dazu zählen der Autor oder der Titel eines Werks. Die Funktionen deskriptiver Metadaten lassen sich anhand der wichtigsten theoretischen Grundlage innerhalb der bibliografischen Dokumentation nachvollziehen: Das FRBR-Modell (Funktional Requirements for Bibliographic Records) postuliert vier Anforderungen an deskriptive Metadaten. Sie müssen es ermöglichen, Objekte durch eine Suchanfrage aufzufinden, ein spezifisches Informationsobjekt zu identifizieren und zu filtern, um letztlich Zugang zum Objekt zu erhalten.

Ein weitverbreitetes Metadatenschema – das Dublin Core Metadata Element Set (DCMES), welches für diese Anforderungen entwickelt wurde – stammt von der Dublin Core Metadata Initiative (DCMI). Auf einer Konferenz in Dublin in den 1990er Jahren einigten sich die Teilnehmer auf 15 Elemente, die alle inhaltlichen Kernelemente (core elements) eines Dokuments abdecken sollen. Das Ergebnis wurde schließlich als ISO Norm 15836 zertifiziert; dabei lag das Hauptaugenmerk der Konzeption auf Retrieval, d.h. auf der stichwortbasierten Abfrage innerhalb von Webressourcen.
Für vielschichtigere Dokumente bzw. Objekte erweist sich dieser – wenn auch von der Idee her richtige – universelle Ansatz jedoch als unzureichend. So wird bei der Katalogisierung häufig eine höhere Erschließungstiefe angestrebt als durch die Beschreibung der in den core elements erfassten Kernelementen möglich ist. Ein komplexes Objekt wie Film lässt sich nicht nur auf einen Urheber (creator) reduzieren, neben dem Regisseur kommen auch die Verantwortlichen für Kamera, Schnitt u.v.m. zum Tragen.

Standardisierte, deskriptive Metadatenschemata von Filmen und audiovisuellen Medien sind dagegen unterrepräsentiert. In den verschiedenen Institutionen, die mit der Archivierung und der Distribution von AV-Materialien betraut sind, haben sich – v.a. mangels eines geeigneten Datenmodells – individuelle Erschließungskonzepte entwickelt, die sich international sowie national folglich unterscheiden.

Nicht unbegründet forderte die Politik seitens des Europäischen Rates im November 2005 die EU-Mitgliedsstaaten auf, „die europaweite Standardisierung und die Interoperabilität filmografischer Datenbanken sowie deren Verfügbarkeit für die Öffentlichkeit [zu] verbessern […].“ Die Umsetzung dieser politischen Forderung lässt sich durch die Beauftragung des Europäischen Komitees für Normung (CEN, Comité Européen de Normalisation) nachvollziehen: Das Mandat beinhaltet die Entwicklung eines „umfassende[n] Metadatenvokabular[s] sowie eine[r] umfassende[n] und einheitliche[n] Terminologie zur Beschreibung kinematographischer Werke“ und die Definition von Datenelementen, „die als vorrangig zur Unterscheidung und Identifikation einzelner kinematographischer Werke angesehen werden.“

Zwischen 2009 und 2010 wurde durch das CEN der Standard CEN TC 372 schließlich veröffentlicht und damit ein erster Schritt zur Standardisierung von deskriptiven filmografischen Daten getan. Der Standard untergliedert sich in die Normen DIN EN 15744:2009 (Identifikation von Filmen – Mindestsatz von Metadaten für kinematographische Werke) und DIN EN 15907:2010 (Identifikation von Filmen – Verbesserung der Interoperabilität von Metadaten – Elementsätze und Strukturen). Ein wesentlicher Teil dieser Normen beinhaltet die Eingliederung der anfangs vorgestellten Funktionen deskriptiver Metadaten nach dem FRBR-Modell, angepasst an die Bedürfnisse und Bedingungen zur Beschreibung von AV-Medien. Die schematische Darstellung (Abb. 1: CEN TC 372) zeigt die Differenzierungen von Entitäten und ihre jeweiligen Assoziationen analog zum FRBR-Schema.



Abb. 1: CEN TC 372. Entitäten und ihre Assoziationen


Anschaulicher lässt sich der Vorteil dieses Datenmodells an einem Beispiel erläutern: Das kinematographische Werk (Cinematographic Work) METROPOLIS (FRITZ LANG, DE 1925/26) wird durch mehrere Varianten (Variant), so z.B. durch abweichende Schnittfassungen für die jeweilige länderspezifische Distribution, repräsentiert. Die jeweiligen Varianten können jedoch durch eine Restaurierung zudem eine neue Ausprägung (Manifestation) erhalten, die sich wiederum in spezifische physische Objekte (Items) unterteilt. In Verbindung mit den Entitäten Events und Agent-Relationship lässt sich deshalb in der deskriptiven Beschreibung folgende hypothetische Identifizierung herstellen:

Beispiel

Das Werk METROPOLIS (FRITZ LANG, DE 1925/26) in seiner Variante (Zensurfassung, DE, 1926) restauriert durch Hans Mustermann (Agent-Relationship) wurde als Distributionsfassung (HANS MUSTERMANN, DE 2012) (Manifestation) am 26.10.2012 uraufgeführt (Event) in Form eines Digital Cinema Package (Item).

Diese differenzierte Beschreibung erreicht damit eine hohe Genauigkeit bei der Identifizierung von AV-Materialien. Deshalb ist CEN TC 372, wenngleich auch noch ein sehr junger, der derzeitig vielversprechendste europäische Standard für die Erhebung deskriptiver, filmografischer Daten. Beispiele für die Umsetzung des Standards sind z.B. am British Film Institute (BFI), im EU-Projekt EFG 1914 (2013-2014) oder auch im Bestandskatalogprojekt des Kinematheksverbunds (2013-2015) zu verzeichnen. Auch das größte deutsche Filmarchiv, das Bundesarchiv, hat CEN TC 372 in der neuen Datenbankapplikation implementiert.

Kritisch zu hinterfragen bleibt die Praxis, bei diesen unterschiedlichen Implementierungen von CEN TC 372 auf Teile der Standardisierung zu verzichten bzw. diese zu modifizieren. Das angepasste CEN TC 372-Datenmodell des BFI, des EYE-Filminstituts oder auch der Deutschen Kinemathek verzichtet z.B. auf die Differenzierung in Varianten. Eine wenn auch geringfügige Modifikation untergräbt die Idee von Standardisierungen, also deren Vorteile der Interoperabilität und der zukünftigen Nachhaltigkeit. Zusätzlich fehlen weitestgehend Implementierungen in verschiedene Datenbankmanagementsysteme, weshalb der Handlungsspielraum bei der Auswahl von Datenbanken eingeschränkt ist.

Technische Metadaten

Neben der deskriptiven Ebene lassen sich digitale Objekte durch technische Metadaten erfassen, welche einerseits qualitative Aussagen beinhalten, andererseits auch die Provenienz und den Herstellungsprozess dokumentieren. Im Gegensatz zu deskriptiven müssen technische Metadaten nicht zwingend erschlossen werden, da eine Bereitstellung durch Dateispezifikationen erfolgt.

Typisch für technische Metadaten ist deshalb, dass sie sich aus digitalen Objekten extrahieren lassen. Bei AV-Materialien lassen sich Elemente wie z.B. das Dateiformat, die Auflösung eines Videos, dessen Codierung oder auch der Farbraum aus den digitalen Objekten herauslesen. Diese Metadaten liegen in der Datei bereits vor (embedded Metadata). Eine aufwändige Erschließung erübrigt sich deshalb ganz im Gegensatz zur Erfassung deskriptiver Metadaten; die Herausforderung liegt vielmehr darin, geeignete automatisierbare Methoden zu benutzen und in die bestehenden Systeme und Workflows zu integrieren. Softwares für die Extraktion technischer Metadaten von AV-Objekten sind z.B. ffprobe, MediaInfo und VideoSpec. Der Support und die Entwicklung der Software sind eingestellt worden und deshalb nur bedingt zu empfehlen (vgl. „VideoSpec by houdini Software – Analyze your video“ 2015).

Erhaltungsmetadaten

In der dLZA werden neben der deskriptiven und technischen Erfassung von digitalen Objekten Erhaltungsmetadaten differenziert. Für die digitale Archivierung kommen Langzeiterhaltungsmetadaten eine besonders hohe Bedeutung zu, so liegt in ihnen erst die Grundvoraussetzung für die langfristige Erhaltung digitaler Objekte: „Langzeitarchivierungsmetadaten sind – vereinfacht ausgedrückt – strukturierte Informationen über digitale Objekte, ihre Kontexte, ihre Beziehungen und Verknüpfungen, welche die Prozesse der digitalen Langzeitarchivierung ermöglichen, unterstützen oder dokumentieren.“

Erhaltungsmetadaten gewährleisten somit, dass der langfristige Verbleib, die Lesbarkeit und Verwendbarkeit von digitalen AV-Materialen im Archiv gesichert sind. Sie verknüpfen ausgesuchte Metadaten aus allen Funktionen miteinander, geben Information über die zukünftige Erreichbarkeit der Datei und initiieren und dokumentieren notwendige Maßnahmen für den weiteren Erhalt.

Die Bereitstellung von Metadatenschemata ist jedoch überschaubar, es lassen sich maßgeblich zwei etablierte Ansätze verfolgen: PREMIS und LMER.
Neben einem Datenmodell stellt PREMIS zudem ein Data Dictionary bereit, welches die Implementierung von Langzeiterhaltungsmetadaten in einem Metadatenschema ermöglicht. Darüber hinaus können mit PREMIS Erhaltungsmaßnahmen protokolliert werden. Das Schema greift dabei bewusst lediglich auf eine Schnittmenge von Metadaten zurück, welche ein digitales Langzeitarchiv insgesamt erhebt. Abb. 2 veranschaulicht, dass sich PREMIS im Zentrum befindet und nur eine Teilmenge (dunkelgrau) von technischen, deskriptiven sowie rechtlichen und administrativen Metadaten, welche zu den Erhaltungsmetadaten (grau) zählen, vereinnahmt. Die fehlenden Metadaten, welche für eine digitale Archivierung als wichtig erachtet werden, stehen nicht im Fokus des Datenmodells PREMIS und müssen demnach aus anderen Metadatenstandards bereitgestellt werden.



Abb. 2: Schnittmenge von Metadatenfunktionen innerhalb PREMIS


Die dabei erhobenen Daten werden im PREMIS-Modell zusätzlich klassifiziert (Abb. 3), es sind fünf Entities (Entitäten) definiert: Objects, Rights, Agents, Events und Intellectual Entities werden durch das PREMIS Data Dictionary als semantische Einheiten (semantic units) näher beschrieben.





Abb. 3: PREMIS Datenmodell


Der Vollständigkeit halber sei an dieser Stelle das zweite Schema für Erhaltungsmetadaten LMER (Langzeitarchivierungsmetadaten für elektronische Ressourcen) erwähnt, entwickelt von der Deutschen Nationalbibliothek (DNB). Aufgrund einer anhaltenden Weiterentwicklung sowie der Bereitstellung eines geeigneten Datenmodells seitens PREMIS ist erstgenanntes Schema gegenüber LMER zu bevorzugen.

Rechtliche und administrative Metadaten

Administrative und rechtliche Metadaten sind für die Organisation, Verwaltung und Nutzung von Objekten im digitalen Archiv notwendig. Beispielsweise können somit bestimmte vertragsbedingte Nutzungen formuliert werden, etwa nicht kommerzieller Verleih oder auch nur interne Nutzung. Rechtliche/administrative Metadaten sollten systematisch erschlossen werden, damit im Verlauf der Langzeitarchivierung auch nur vereinbarte Maßnahmen bzw. Nutzungen durchgeführt werden. So können z.B. eine redundante Speicherung oder auch Formatmigrationen vertraglich festgesetzt sein. Ansätze für Standardisierungen von administrativen Metadaten lassen sich z.B. bei PREMIS „Rights“ nachweisen.  

Strukturelle Metadaten

Die breitgefächerte Funktionalität und die Anforderungen von Metadaten sowie die Vielfalt von existierenden Metadatenstandards wurden dargestellt. Dabei entsteht der nachvollziehbare Wunsch, die relevanten Metadaten und ihre Standards zu strukturieren. Der de facto – da gewissermaßen alternativlose – Standard für die Bereitstellung von strukturellen Metadaten in der dLZA ist der Metadata Encoding and Transmission Standard (METS). Entwickelt von der Library of Congress reichen die Anfänge des METS bis 2001 zurück; eine Weiterentwicklung findet aktuell statt. Eine umfassende Dokumentation des Standards sowie seines XML-Schemas wird auf der METS-Webseite bereitgestellt.
Die Entwicklung von METS erfolgte, um folgende Ziele zu erreichen:

  • Kodierung von Erschließungs-, Verwaltungs- und Strukturangaben
  • Beschreibung der komplexen Bezüge zwischen Metadatenkategorien
  • Austausch von digitalen Objekten zwischen Sammlungen
  • Verknüpfung von Metadatenstandards
  • Flexibilität zwischen Metadatenstandards

 

Präsentation/Zugriff

Das Langzeitarchiv muss sicherstellen, dass berechtigte Nutzer einen Zugang zu den Informationsobjekten sowie seinen Repräsentationen erhalten. Dabei ist es zunächst unerheblich, ob eine Nutzung z.B. über einen Fernzugriff wie z.B. Webseiten oder VoD-Plattformen gewährleistet wird oder die Objekte nur vor Ort genutzt werden können. Gerade durch die für Filme zu klärenden Rechte sind Online-Nutzungen i.d.R. nur eingeschränkt möglich.
Für die Präsentation und den Zugriff sind weiterhin für die entsprechenden Nutzungsszenarien die entsprechenden Formate zu definieren. Grundsätzlich gelten dafür dieselben Bedingungen wie für Archivformate. So sollten auch beim Zugriff Formate zum Einsatz kommen, die offen, weitverbreitet und robust sind.

Dateiformate und Codecs

Für die Archivierung von digitalen Objekten sind zunächst die Formate zu definieren, welche im Archiv behandelt werden sollen. In einer Übernahmeregelung werden diese archivwürdigen Formate formuliert und damit die Voraussetzung für ihre Überprüfung geschaffen. Gegebenenfalls müssen Formate migriert werden, wenn sie den Erhaltungsrichtlinien des Archivs widersprechen. Technisch gesehen muss deshalb das Archiv in der Lage sein, Formate zu erkennen, Archivformate zu definieren und diese schließlich zu validieren.

Für die dLZA lassen sich verschiedene Kriterien für archivwürdige Dateiformate definieren, die auf eine Vielzahl von Autoren und Publikationen zurückgehen, die diese Faktoren beschreiben. Dabei lassen sich Abstraktionen zusammenfassen, die in verschiedene Kriterien differenziert werden können: Maßgeblich für ein geeignetes Archivformat ist demnach erstens die Offenheit eines Formats, d.h. inwieweit Lizenzierungen davon abhängig sind und ob eine Norm vorliegt. Zweitens wie weit ein Dateiformat verbreitet ist; dies ist ein Indiz für die Bereitstellung von unterschiedlicher Software, die unabhängig mit dem Format umgehen kann. Als drittes Kriterium kann differenziert werden, wie komplex ein Dateiformat aufgebaut ist. Komplexität erschwert zum einen die Interpretation und zum anderen die Nutzung von Dateiformaten. Vorhandene Schutzmechanismen für Dateiformate sind ein Ausschlusskriterium für die dLZA, nur die exakte und nachhaltige Kenntnis über Verschlüsselungsmechanismen kann zur Akzeptanz solcher Formate führen. Als letzte Kriterien sind Robustheit eines Dateiformats, d.h. die Fehleranfälligkeit für die Veränderung einzelner Bits für die Interpretierbarkeit des digitalen Objekts, und die Abhängigkeiten von spezieller Hard- oder Software ausschlaggebend.

Die aufgeführten Kriterien werden überwiegend gleichsetzend auch von der Library of Congress (LoC) verwendet, die eine ausführliche Dokumentation von Dateiformaten hinsichtlich der Kriterien auf ihrer Webseite bereitstellt. Die Dokumentation wird beständig aktualisiert und bietet eine gute Übersicht über jeweilige Dateiformate anhand ihrer definierten Kriterien.

Für AV-Materialien gilt hinsichtlich dieser Kriterien jedoch zu hinterfragen, inwieweit diese für ein vertrauenswürdiges Archivformat gelten können. Anders als digitale Text- oder Bildformate sind digitale AV-Formate schwieriger und vielfältiger zu definieren. Oft wird dieser Aspekt in der Forschung der dLZA von AV-Objekten nicht hinreichend beleuchtet.

Vergleicht man zunächst analoge und digitale AV-Materialien, lassen sich zwei Kategorien differenzieren. Zum einen die Kategorie Film, zum anderen die Kategorie Video. In der digitalen Welt ist diese Trennung zwar nicht so eindeutig und belastbar wie im analogen Bereich. In der Projektion handelt es sich auch im digitalen Kino um Videobilder. Dennoch ist es sinnvoll, die Unterteilung zu treffen, da sich digitale AV-Objekte durch eine hohe Anzahl von unterschiedlichen Dateiformaten, Kompressionsmöglichkeiten und Standardisierungen auszeichnen. Die Kategorisierung hilft dabei, unterschiedliche Formatgruppen zu definieren und dabei auch unterschiedliche Konzepte für Archivformate auseinanderzuhalten. Die folgende Einteilung wird dabei die Strukturierung der vorhandenen digitalen Objekte ermöglichen.

Digitaler Film

Digitaler Film zunächst zeichnet sich darin aus, dass er für die Projektion in digitalen Kinos bestimmt ist. Merkmale von digitalem Film sind u.a. eine hohe Bild- und Tonauflösung, ein großer Farbraum, Mehrkanal-Ton und eine hohe Bildfrequenz – und auch nicht selten eine Verschlüsselung. Unter einer Verschlüsselung wird ein Digital Rights Management (DRM)-System verstanden. Ein DRM-System verhindert das unerlaubte Kopieren von digitalen Objekten, des Weiteren kann es den wiederholten Zugriff einschränken. Digitaler Film wird zudem professionell produziert, i.d.R. sind dabei Produktionsgesellschaften oder eine hinreichende Finanzierung involviert. Kennzeichnend für digitalen Film ist, dass sich das Informationsobjekt durch Bildsequenzen auszeichnet, die aus jeweils einzelnen Bilddateien bestehen. Dieser Umstand ist herstellungsbedingt, denn digitale Filmkameras generieren Einzelbilder, somit kommen auch in der Projektion des D-Cinema (digitales Kino) Einzelbildsequenzen zum Einsatz. Bei einer typischen Bildfrequenz von 24 Bildern pro Sekunde werden 84.000 Einzelbilder pro Stunde Filmdauer projiziert. Die Audioinformation liegt bei digitalem Film separiert in eigenen Dateien bzw. Dateiformaten vor, dabei können die Audioinformationen verschiedene Synchronfassungen beinhalten.
Ein Konzept für die Speicherung von digitalem Film liegt darin, die separierten Bildsequenzen und Audiodateien in einem Paket zu definieren. Zum einen, um den Transport zu gewährleisten, zum anderen auch für die Distribution, Präsentation und Archivierung. Standardisierungen von Paketen für digitalen Film werden durch die Digital Cinema Initiatives (DCI), einem Dachverband, der sich aus Akteuren der US-amerikanischen Filmindustrie zusammensetzt, bereitgestellt. Die gleichnamige Spezifikation DCI beinhaltet zwei definierte Pakete: das Digital Cinema Package (DCP) und das Digital Cinema Distribution Master (DCDM). Das Hauptziel des DCI-Dachverbandes liegt in der Standardisierung digitaler AV-Objekte für die Distribution in den digitalen Kinos. Wesentliche technische Merkmale der Spezifizierung des DCI-Workflows sind die Komprimierung von Bilddateien durch den JPEG 2000-Codec und die Verwendung eines MXF-Containers.

Wenngleich diese Standardisierungen erfolgreich sind und DCPs als Standard für die Projektion von digitalem Film gewissermaßen vollständig etabliert sind, so ist die Frage, wie sich DCI-Pakete für die Archivierung eignen, umstritten. Zum einen ist bei DCPs nicht auszuschließen, dass eine Verschlüsselung vorliegt, zum anderen verwenden DCPs auch eine verlustbehaftete Komprimierung der Bildinformationen. Das DCDM erfüllt per Definition zwar eine verlustfreie Komprimierung, dient jedoch lediglich zur Erstellung eines DCPs innerhalb des DCI-Distribution-Workflows. Keinesfalls kann also das DCDM als Masterformat eines abgeschlossenen Postproduktionsprozesses angesehen werden. D.h. die Pakete DCP und DCDM eignen sich nicht zwingend für die Herstellung von anderen Formaten jenseits des DCI-Workflows.

Vergleicht man nun DCP und DCDM mit den Anforderungen, die seitens des OAIS-Modells an ein AIP gestellt werden, so lassen sich die beiden Konzepte von Paketen schlichtweg nicht vergleichen. Weder Metadaten noch Erschließungsinformationen werden im DCI-Workflow OAIS-konform bereitgestellt. Dieser Umstand ist auch nicht verwunderlich, für eine OAIS-konforme Übernahme wurde der DCI-Workflow nicht konzipiert. Die für Archive zunächst verführerische Möglichkeit, diese Pakete als Archivformate zu etablieren, sollte deshalb kritisch hinterfragt werden. In der Deutschen Kinemathek werden derzeit beide Formate des DCI-Workflows übernommen und als Archivformate akzeptiert. Dem widerspricht gegenwärtig auch nicht die LoC, die den DCI-Workflow als ein „middle-state format for achiving“ beschreibt.

Eine andere Initiative, ein dezidiertes Archivformat für digitalen Film zu etablieren, wurde durch das Enhanced-Digital-Cinema-Projekt (EDCINE) unternommen. Das in den Jahren 2006 bis 2009 mit 16 Millionen Euro großzügig ausgestattete Projekt entwickelte für die Archivbereiche die beiden Pakete Master Archive Package (MAP) und Intermediate Access Package (IAP). Beide Pakete beinhalten Spezifikationen des DCI-Distribution-Workflows. Auch hier finden die JPEG2000-Kodierung und MXF-Container Anwendung. Neben der Entwicklung von MAP und IAP ist der zweite Meilenstein des Projekts die Bereitstellung einer Softwarelösung, welche in der Lage ist, die Pakete zu erstellen und beinhaltete Objekte darzustellen. Die Software Curator Archive Suite wird federführend vom Fraunhofer-Institut für Integrierte Schaltungen (IIS) entwickelt und vertrieben. Es lässt sich fünf Jahre nach Projektende feststellen, dass sowohl Archivpakete als auch Softwarelösungen nicht breit etabliert sind.

In der Deutschen Kinemathek konnte die Software durch das Projekt EFG 1914 getestet werden, als Nachteile erwiesen sich in der Anwendung die zeitaufwändigen Kompressions- und Dekompressionsmethoden, die mangelnde Standardisierung der Pakete, die Abhängigkeit vom Entwickler und dem Fraunhofer-IIS sowie die vergleichsweise hohen Anschaffungskosten. Zudem stellt die Software keine ausreichende Hardwarebeschleunigung seitens geeigneter Videokarten bereit. Als entscheidendes Defizit dient der Umstand, dass weder MAP noch IAP konform mit der OAIS-Definition von AIPs sind. Über die Weiterentwicklung stellt weder EDCINE noch das Fraunhofer-IIS Informationen bereit, die Projektwebseite ist derzeit offline.
Letztlich wird v.a. seit 2014 ein dritter Standard für die Definition von Archivformaten für digitalen Film immer stärker diskutiert. Dabei handelt es sich um ein Paket, das sich wiederum in die Reihe von Akronymen von Paketen einreiht: das sogenannte Interoperable Master Format (IMF). Der Standard wurde erstmalig 2012 durch die Society of Motion Picture & Television Engineers (SMPTE) publiziert und wird seitdem kontinuierlich weiterentwickelt. Genauso wie bei den anderen Standards durch DCI und EDCINE ist auch hier die Industrie beteiligt. Neben der SMTPE arbeiten wiederum die führenden Major US-Studios sowie v.a. die Firma DVS an der Entwicklung des Standards. Dieser Umstand ist mit einer gewissen Skepsis zu sehen, da seitens der Industrie stets wirtschaftliche Gründe eine Rolle spielen. Die wirtschaftliche Abhängigkeit, sei es von Hardware oder Software oder auch Lizenzmodellen, ist für die dLZA stets zu hinterfragen, da eine Nachhaltigkeit nicht gewährleistet werden kann.

Auch der Kostenfaktor ist natürlich immanent. Dies erklärt, dass das IMF zunächst als Business-to-Business-Format konzipiert ist und damit v.a. Unabhängigkeit von Dienstleistern im Postproduction-Workflow von digitalem Film gewährleisten soll. So ist denkbar, dass ein Dienstleister den Schnitt eines Films verantwortet und daraufhin Special Effects (VFX) oder auch Lichtbestimmung (Grading) von anderen Dienstleistern übernommen werden. Im Gegensatz zum EDCINE-Projekt wird hier jedoch eine komplette Standardisierung seitens SMPTE vorausgesetzt, dabei orientiert sich IMF auch an DCI-Standards.

Zusammenfassend lässt sich für digitalen Film darstellen, dass derzeit kein etabliertes Archivformat vorhanden ist. Anhand der einleitend vorgestellten Kriterien treten bei den vorgestellten Archivformaten Schwächen auf, entweder sind die Formate nicht weitreichend verbreitet oder es kommen Schutzmechanismen zum Tragen, darüber hinaus werden die Formate und Pakete v.a. durch einzelne Hersteller oder Gruppen der Industrie bestimmt. Auch wenn Bestrebungen für die Etablierung eines archivwürdigen Standards deutlich werden, lässt sich derzeitig eine Empfehlung unter Berücksichtigung einer verantwortungsvollen dLZA nicht aussprechen.

Vergleicht man die dLZA von digitalem Film mit der von Textdokumenten, wird offensichtlich, dass ein PDF/A-Dokument für digitalen Film derzeit nicht existiert. Die PDF/A-Entwicklung kämpft zwar noch mit Problemen der Validierung, die Etablierung eines einheitlichen Dateiformats ist aber gewährleistet. Ein „Archival Digital Cinema Package“, welches gleichzeitig OAIS-konform ist und zudem funktionale Anforderungen für digitalen Film besitzt, ist demnach noch ein Desiderat.

Eine Alternative zu den dargestellten Ansätzen, digitalen Film in standardisierten Paketen zu archivieren, bietet derzeit lediglich die Speicherung auf nativen, unkomprimierten Formatdefinitionen für Bildsequenzen wie Digital Picture Exchange (DPX) oder Tagged Image File Format (TIFF). Archive, die den o.g. Paketen gegenüber skeptisch eingestellt sind, orientieren sich deshalb an diesen Formaten. Die Nachteile dabei liegen in den vergleichsweise hohen Datenmengen sowie in den fehlenden Möglichkeiten für eine spezifische Referenzierung der unterschiedlichen Objekttypen der intellektuellen Einheit. Untertitel, Tonspuren und andere Objekttypen des Films können demnach nur separiert gespeichert werden, ohne dass der Bezug zueinander eindeutig definiert ist.

Digitales Video

Als zweite Kategorie neben dem digitalen Film lassen sich wie vorgeschlagen AV-Materialien als digitales Video definieren. Digitales Video zeichnet sich zunächst dadurch aus, dass es nicht primär für die Projektion im D-Cinema-Bereich konzipiert ist, dagegen findet es in TV-Produktionen, in der Medienkunst und natürlich im Bereich von privaten Aufzeichnungen Verwendung. I.d.R. liegt digitales Video in einem singulären Dateiformat vor, welches Video- und Audioinformation zusammen speichert; ein dafür weitverbreiteter, etablierter Begriff ist das Containerformat.
Kennzeichen für digitales Video sind niedrigere Auflösungen, einfachere Kopierschutzmechanismen sowie kostengünstigere Workflows verglichen mit den Anforderungen des digitalen Films. Außerdem lässt sich eine große Vielfalt von unterschiedlichen Dateiformaten und Kompressionsstandards nachweisen: der sogenannte Format-Zoo. Gewissermaßen kehren sich bei digitalem Video im Vergleich zu digitalem Film die Gegebenheiten um. Das Problem liegt nicht darin, dass sich nur wenige Initiativen für die Etablierung eines hinreichend vertrauenswürdigen Archivformates aufzeigen lassen, sondern in der Herausforderung, innerhalb der vorhandenen Masse der unterschiedlichen Formate das geeignete Format für die vertrauensvolle dLZA zu bestimmen.

Der Ansatz, ein Archivformat für digitales Video zu definieren, ist im Gegensatz zu digitalem Film jedoch nicht vorwiegend durch die Industrie und einzelne Firmen bestimmt. Gleichwohl werden auch bei digitalem Video Dateiformate von der Industrie durch Microsoft Corporation, Apple Inc. oder Avid Technology Inc. bereitgestellt. Verschiedene Initiativen seitens der Informationswissenschaft, die dem Open-Source-Gedanken folgen, haben dazu beigetragen, Dateiformate und Codecs zu entwickeln, die den Kerngedanken der dLZA folgen. Außerdem werden Technologien und Algorithmen erarbeitet, um jene Dateiformate und Codecs durch eine Transkodierung und Formatwandlung zu migrieren. Zu nennen ist die in diesem Zusammenhang sicherlich bedeutendste Entwickler-Community, FFmpeg.

An diesem eigenständigen FFmpeg-Projekt haben dabei auch andere Open-Source-Entwickler, das Netzwerk nestor und einzelne Gedächtnisinstitutionen Anteil, indem sie diesen Entwicklungsprozess fördern und in Teilen auch finanziell unterstützen. SLUB und die Deutsche Kinemathek planen die Entwicklung von FFV1 mitzutragen (vgl. nestor Media AG, Beschluss vom 12. Juni 2015).

Für digitales Video können die Kriterien für eine vertrauenswürdige dLZA, die einleitend formuliert wurden, hinreichend in Betracht gezogen werden, um den Format-Zoo zu beurteilen. So sind Kriterien wie Robustheit, Offenheit, Schutzmechanismen, Komplexität, Verbreitung und Standardisierung zu bewerten und zu differenzieren. In der derzeitigen Praxis von Filmarchiven lassen sich dabei grundsätzlich zwei unterschiedliche Ansätze unterscheiden:

Zum einen existiert in Archiven, die mit der Digitalisierung und Archivierung des audiovisuellen Erbes betraut sind, der Anspruch, den größtmöglichen Informationsgehalt durch möglichst native Objekte zu erhalten. Dieser Umstand könnte auf die Tradition von analogen (Kopier-)Verfahren in einem Archiv zurückzuführen sein, welche gleichwohl immer mit einem Informationsverlust verbunden sind. Eine Veränderung von Informationsobjekten durch technologische Prozesse ist dem entgegengesetzt. Infolgedessen werden seitens der Filmarchive Technologien, die auf der Migration durch Transkodierung von Objekten beruhen, sehr skeptisch beurteilt. Es werden Verfahren der Transkodierung vermieden und bevorzugt nicht-komprimierte bzw. native Dateien für die Archivierung verwendet. Vorzugsweise wird deshalb digitales Video bspw. in Codecs wie v210 oder YUY digitalisiert und archiviert. Dabei müssen auch Nachteile in Kauf genommen werden: Einerseits wird das Kriterium der Offenheit vernachlässigt, so kommt z.B. auch deshalb die Gruppe von proprietären Formaten (d.h. Formate, die durch Hersteller lizenziert und nicht veröffentlicht bzw. quelloffen sind) in verschiedenen Institutionen zum Einsatz. Auch die Deutsche Kinemathek akzeptiert derzeit proprietäre Formate, wenn sie nativ erstellt sind. Andererseits zieht dieses Konzept der nativen Formate eine große Bandbreite von unterschiedlichen Dateiformaten und Dateikodierungen nach sich, die archiviert werden müssen.

Im zweiten Ansatz für die Behandlung von digitalem Video existieren Konzepte, welche die o.g. Maximen bei der Formatwahl stärker berücksichtigen und dabei bestrebt sind, spezifische Dateiformate zu bestimmen und davon abweichende Formate zu migrieren. Vergleichbar sind der Einsatz von TIFF- und JPEG-Formaten bei der dLZA von Bildern und das PDF/A-Format im Bereich der Textdokumente.

Im Wesentlichen stehen derzeit zwei zu beachtende Dateiformate zur Diskussion: Das erste Konzept geht auf die im Abschnitt zum digitalen Film erwähnte DCI- bzw. EDCINE-Konzeption zurück. Infolgedessen wird vorgeschlagen, digitales Video ebenso in einem MXF-Containerformat durch eine JPEG-2000-Kodierung abzuspeichern. Filmarchive, die diesem Konzept folgen, sind u.a. EYE Film Institute Netherlands, La Cinémathèque Royale de Belgique oder auch Danish Film Institute/Det Danske Filminstitut. Sowohl für das Containerformat MXF als auch den Codec JPEG 2000 können die Kriterien, die für ein Dateiformat der dLZA definiert sind, zunächst als ausreichend beschrieben werden. Dateiformat und Codec sind offene, robuste Standards, verbreitet und unabhängig von Kopierschutzmechanismen. Der Codec ist zudem lossless, d.h. verlustfrei spezifiziert. Als Problem von JPEG 2000 ist jedoch die Implementierung in Software kennzeichnend. Der Umgang mit diesem Format setzt – genauso wie bei digitalem Film – spezifische Softwarelösungen voraus. Wie bei digitalem Film kommt darüber hinaus auch das Problem der Performance der JPEG-2000-Kodierung durch spezifische Hard- und Software zum Tragen.

Neben diesem Konzept für ein digitales Video-Archivformat, welches als JPEG 2000 codiert in einem MXF-Dateiformat vorliegt, lässt sich derzeit ein zweiter Ansatz nachweisen, der aktuell immer größere Beachtung und Unterstützung findet. Die österreichische Mediathek verfolgt das Konzept des Codecs FFV1 bereits seit 2013 und hat dabei den Entscheidungsprozess, Implementierung sowie Vor-und Nachteile dokumentiert, vgl. Bubestinger 2015. Darüber hinaus findet aktuell eine Debatte durch die nestor Media AG statt, die plant, FFV1 und MKV als zukünftiges Archivformat für digitales Video zu etablieren. Das Konzept sieht vor, digitale Video- und Audiodateien in einem Matroska-Containerformat (MKV) zu speichern und durch den Videocodec FFV1 zu codieren. Der verwendete Codec FFV1 geht auf den Entwickler Michael Niedermayer zurück, der Codec ist seit 2003 Teil der freien Codec-Sammlung des FFmpeg-Projekts (libavcodec). FFV1 und MKV zeichnen sich primär durch den Open-Source-Gedanken von offenen Spezifikationen aus; Nachhaltigkeit und Weiterentwicklung sind deshalb unabhängig von Lizenzierungen oder einem einzelnen Entwickler gegeben. Die Softwareunterstützung wird durch die Software des FFmpeg-Projekts gewährleistet und bietet dadurch die Möglichkeit zur Implementierung. Vorteile gegenüber dem Codec JPEG 2000 liegen in der besseren Performance, die durch effizientere Algorithmen gewährleistet ist und die eine verlustfreie Komprimierung ermöglicht. Darüber hinaus ist ein Alleinstellungsmerkmal des FFV1, dass durch Checksummenbildung von einzelnen Bildern der Videodatei die Überprüfung der Dateiintegrität ermöglicht wird. Die Nachteile sind dagegen die fehlende Standardisierung von FFV1, die geringe Verbreitung und derzeit eingeschränkte Implementierung in verschiedene Videoapplikationen sowie eine Fehleranfälligkeit in der Transkodierung.

Zusammenfassend zeigt sich, dass für die dLZA von digitalem Video zwar verschiedene Ansätze für Archivformate vorhanden sind, ein hinreichendes Konzept, welches für eine Empfehlung notwendig ist, jedoch nicht ausgemacht werden kann. Auf der einen Seite stehen die Archive mit einer abwartenden, zögerlichen Haltung, ein Format zu bestimmen. Die Konsequenz davon sind multiple, dabei jedoch auch native Formate.
Auf der anderen Seite steht der Ansatz, multiple Formate zu vermeiden und konsequent in ein bestimmtes Format zu migrieren. Es ist festzustellen, dass zwischen dem Konzept JPEG 2000 und FFV1 die Vorteile des FFV1-Formates überwiegen. Vielversprechend beim FFV1-Konzept sind die vergleichbar höhere Performance und die Möglichkeit für eine bildgenaue Dateiintegrität von digitalen AV-Objekten. Einen weiteren Vorteil bietet die Unterstützung seitens des nestor-Netzwerkes und einzelner Gedächtnisinstitutionen, die sich derzeit diesem Format verschrieben haben. FFV1 ist demnach ein vielversprechender Ansatz, der sich als Archivformat jedoch zukünftig erst beweisen muss.


Weitere Literatur
Europäisches Parlament und Rat. 2005. „EMPFEHLUNG DES EUROPÄISCHEN PARLAMENTS UND DES RATES vom 16. November 2005 zum Filmerbe und zur Wettbewerbsfähigkeit der einschlägigen Industriezweige.“ Amtsblatt der Europäischen Union (L 323/57). http://eur-lex.europa.eu/legal-content/DE/TXT/PDF/?uri=CELEX:32005H0865&from=DE. Zugriff: 9. April 2015.

Korb, Nikola und Andreas Roth. 2008. „Persistent Identifier: …eindeutige Bezeichner für digitale Inhalte…“ Zugriff: 25. Juli 2015. http://www.persistent-identifier.de/.

Lange, Andreas. 2013. „Die Gaming-Community als Pionier der digitalen Bewahrung.“ In: Klimpel, Paul ud Keiper, Jürgen, Was bleibt? Nachhaltigkeit der Kultur in der digitalen Welt. Berlin: iRights Media

———. 2015b. „Metadata Object Description Schema: MODS (Library of Congress).“ Zugriff: 11. Mai 2015. http://www.loc.gov/standards/mods/.
nestor-Arbeitsgruppe OAIS-Übersetzung / Terminologie. 2012. „Referenzmodell für ein Offenes Archiv-Informations-System: Deutsche Übersetzung.“
Prestocentre. 2014. „Webinar: Creation of Master Archive Package (MAP).“ Zugriff: 5. Juli 2015. https://www.youtube.com/watch?v=5oMUhw-1GZM#t=1842.

 

  • Keine Stichwörter