Sie zeigen eine alte Version dieser Seite an. Zeigen Sie die aktuelle Version an.

Unterschiede anzeigen Seitenhistorie anzeigen

« Vorherige Version anzeigen Version 2 Aktuelle »

Auswahl des zu archivierenden Materials

Selektionskriterien bilden die Entscheidungsgrundlage für die Frage, ob ein Objekt langfristig gesichert werden soll. Hierbei spielen neben rechtlichen auch inhaltliche Kriterien eine Rolle. Besondere Bedeutung kommt der Frage nach den Ressourcen zu.

Empfehlung

Kleine Einrichungen sind aufgrund ihrer beschränkten Mittel häufig gezwungen, stark zu selektieren. Dabei sollte die Frage berücksichtigt werden, ob Objekte auch anderen Institutionen überlassen/angeboten werden können, um die eigene Belastung zu reduzieren.

Selektionskriterien können wie folgt priorisiert werden:

  • Gibt es andere Institutionen, die die digitale Langzeitarchivierung des Objekts besser / sicherer gewährleisten können? Ist das Objekt archivwürdig?
  • Entspricht das Objekt dem Sammlungsprofil bzw. dem Archivauftrag?
  • Liegen alle benötigten Rechte vor (Langzeitarchivierung, Veränderung, Verbreitung)?
  • Sind ausreichend Ressourcen vorhanden, um die digitale Langzeitarchivierung gewährleisten zu können?

Beschreibung der vorgesehenen Nutzungsszenarien

Die vorgesehenen Zielgruppen sind die aktuellen und künftigen Nutzergruppen, die mit dem digitalen Langzeitarchiv oder daran angeschlossenen Nutzungsplattformen interagieren. Unter Nutzerzielgruppen sind an dieser Stelle nicht nur die klassischen Nutzer zu verstehen. Vorgesehene Nutzerzielgruppen sind auch externe Nutzer wie Produzenten, die Objekte abliefern, und interne Nutzer wie die Mitarbeiter der Institution. Die vorgesehenen Nutzerzielgruppen entsprechen den klassischen, bekannten Zielgruppen der Institution und können unterschiedliche Anforderungen haben, die gelegentlich bereits analysiert worden sind.
Zusätzlich kommen als vorgesehene Nutzerzielgruppen hinzu:

  • die Datenproduzenten
  • die mit der digitalen Langzeitarchivierung befassten Mitarbeiter


Die verschiedenen vorgesehenen Nutzerzielgruppen haben bestimmte Anforderungen. Daraus ergeben sich Nutzungsszenarien und signifikante Eigenschaften, die Einfluss auf Erhaltungsmaßnahmen haben.

Empfehlung

Die Nutzerzielgruppen sollten der Institution bekannt sein. Sofern die personellen Ressourcen ausreichen, sollte eine Analyse der Nutzerzielgruppen durchgeführt werden, die neben den klassischen Zielgruppen der Institution auch die Datenproduzenten und die Mitarbeiter berücksichtigt.

Die Analyse der Nutzerzielgruppen sollte folgende Punkte beinhalten:

  • die Beschreibung und Abgrenzung der verschiedenen Nutzerzielgruppen
  • die Beschreibung der Anforderungen der Nutzerzielgruppen
  • in den Nutzerzielgruppen verbreitete Nutzerformate

Qualitätsmanagement

Qualitätsmanagement bezeichnet Verfahren und Prozesse, die die Qualität der Objekte sowie der Prozesse im digitalen Langzeitarchiv sicherstellen sollen.
Darunter fallen z.B.:

  • Übernahmevereinbarung (ein Dokument, das organisatorische, rechtliche und technische Punkte bei der Übernahme berücksichtigt)
  • Eingangskontrolle der Objekte (Überprüfung der Objekte beim Eingang in das digitale Langzeitarchiv)
  • Prüfung auf Lesbarkeit und inhaltliche Vollständigkeit
  • Prüfung auf inhaltliche Übereinstimmung mit den deskriptiven Metadaten
  • technische Fehlerfreiheit
  • Standardkonformität
  • Dokumentation von Prozessen (Genaue Beschreibung von Prozessen im digitalen Langzeitarchiv: Was wird wann warum wie gemacht? Z.B. schriftlich oder in einer Notation für Prozessdokumentation wie BPMN 2.0.)
  • Evaluierung von Prozessen (Dokumentierte Prozesse können nach Kriterien wie Praxistauglichkeit, Zeitaufwand, Ressourcenaufwand, Überschneidungen mit anderen Prozessen usw. untersucht werden. Die Analyse ist Voraussetzung für die Optimierung der Prozesse.)
  • Kontrollverfahren (technische und organisatorische Verfahren für die Kontrolle von definierten Regeln und Strukturen oder zur Evaluierung von Ergebnissen nach Änderungen an Objekten)
  • Regelkonformität von Transfer- und Archivpaketen
  • Qualitätsprüfung nach Formatmigrationen
  • Lesbarkeit und Vollständigkeit nach Änderungen am Objekt
  • Nutzung von Standards
  • Beachtung der Kriterien für die vertrauenswürdige Langzeitarchivierung (nestor-Siegel nach DIN 31644, auch Data Seal of Approval)

Empfehlung

Kleine Institutionen sollten im Rahmen ihrer personellen und finanziellen Ressourcen Maßnahmen für das Qualitätsmanagement implementieren.
Es wird empfohlen, eine Eingangskontrolle durchzuführen und Kontrollverfahren einzurichten. Darüber hinaus sollten Standards genutzt werden.
Die Eingangskontrolle sollte eine (stichprobenartige) Sichtprüfung des Materials und die Prüfung der Übereinstimmung mit den deskriptiven Metadaten beinhalten. Zusätzlich sollten die Objekte identifiziert werden (siehe Tabelle mit Tools, S. 110 ff).
Die Kontrollverfahren können teilautomatisiert werden. Die Prüfung auf Lesbarkeit und Vollständigkeit nach Formatmigrationen sollte (stichprobenartig) manuell erfolgen. Die Prüfung auf Regelkonformität von Transferpaketen z.B. kann automatisiert erfolgen, indem ein entsprechendes Prüfverfahren bei der Übernahme implementiert wird.
Die Nutzung von Standards bezieht sich auf das Standard-Referenzmodell OAIS, auf Metadatenstandards (z.B. PREMIS, Dublin Core, METS) sowie auf Dateiformatstandards. Darüber hinaus können auch standardisierte Prozesse und einheitliche Paketstrukturen darunter verstanden werden. Einheitlich strukturierte Daten und definierte Prozesse erleichtern nicht nur die digitale Langzeitarchivierung, sondern jegliche Art von Datenverwaltung.

Erhaltungsstrategien

Erhaltungsstrategien stellen sicher, dass das Objekt als Datenstrom erhalten und nutzbar bleibt. Dabei sichern Verfahren für die Bitstream-Preservation den Datenstrom und Verfahren für die Content-Preservation die Les- und Interpretierbarkeit des Objekts.

Bitstream-Preservation

Digitale Datenträger sind nur von begrenzter Haltbarkeit. Sie sind nicht nur von Verschleiß betroffen, auch Hardwareobsoleszenz ist problematisch. Aus diesem Grund ist ein Speicherkonzept essenziell für die Erhaltung des Bitstroms der digitalen Objekte.
Grundlegende Anforderungen an das Speicherkonzept sind:

  • redundante, geografisch verteilte Speicherlösung
  • Integritätschecks, z.B. mit Prüfsummen
  • Viruscheck
  • Datenschutzkonzept
  • regelmäßiger Austausch von Datenträgern
  • Monitoring
  • Skalierbarkeit


Die Sicherung des Bitstreams eines Objekts ist ein stetig wiederkehrender Prozess und Basis jeder Erhaltungsstrategie.

Empfehlung

Die Institution sollte prüfen, ob die Möglichkeit besteht, allein oder im Verbund mit einem Rechenzentrum zu kooperieren, das die professionelle Bitstream-Preservation übernimmt. Ein Service-Level-Agreement sollte abgeschlossen werden.
Besteht diese Möglichkeit nicht oder ist die Nutzung eines Dienstleisters nicht finanzierbar, so muss die Institution die Bitstream-Preservation selbst übernehmen.

Die institutionsinterne Bitstream-Preservation sollte mindestens die folgenden Anforderungen erfüllen:

  • redundante Speicherung
  • Integritätschecks
  • Viruschecks
  • Datenschutzkonzept
  • regelmäßiger Austausch von Datenträgern
  • Monitoring

Dafür kommt der Einsatz eines RAID-Systems mit einer Speicherverwaltungssoftware in Betracht. Das RAID-System sollte nach Möglichkeit regelmäßig gespiegelt werden.

Content-Preservation

Content-Preservation soll sicherstellen, dass der Inhalt eines Objekts auch nach Jahren wiedergegeben und interpretiert werden kann.
Dafür ist es erforderlich:

  • das Dateiformat, die -version und den Codec zu identifizieren und zu validieren. Bei AV-Medien wird diese Erkenntnis durch den Codec erschwert, der in dem Containerformat enthalten ist.
  • technische Metadaten zu extrahieren (siehe Tabelle mit Tools, S. 110 ff.)
  • Informationen über geeignete Wiedergabesoftware zu sammeln
  • Risikofaktoren zu identifizieren
  • signifikante Eigenschaften festzulegen
  • Kontextinformationen bereitzustellen, die die Wiedergabe des Objekts und die Interpretation des Inhalts ermöglichen


Auf Basis dieser Informationen können Bestandserhaltungsmaßnahmen konzipiert und durchgeführt werden. Dafür gibt es zwei Verfahren: Formatmigration und Emulation.

Empfehlung

Kleine Institutionen können eine umfassende Content-Preservation kaum leisten. Aus diesem Grund sollen hier nur minimale Anforderungen aufgeführt werden.
Es wird die Formatmigration empfohlen, da es für die meisten audiovisuellen Objekte nicht erforderlich ist, die ursprüngliche Nutzungsumgebung zu erhalten. Eine Ausnahme stellt Videokunst dar, die im Wissenschaftlichen Film aber nicht als solche, sondern höchstens als Repräsentation vorkommt. Dafür stehen eine Reihe von Open-Source- Tools und kommerzielle Software zur Verfügung.
Das Dateiformat sollte identifiziert und validiert werden. Es genügt nicht, ein Objekt über die Dateiendung zu identifizieren, da diese auch irreführend sein kann. Außerdem sollten technische Metadaten extrahiert werden. Das Dateiformat und der Codec eines Objekts müssen bekannt sein, da alle Erhaltungsmaßnahmen hierauf basieren.


Signifikante Eigenschaften sollten in geringem Umfang festgelegt werden. Der Fokus sollte auf den für die Institution und deren Nutzer wichtigen Eigenschaften eines Objektes liegen. Diese können sein:

  • das Seitenverhältnis
  • der Farbraum
  • die Auflösung
  • bestimmte Zusatzfunktionen wie Untertitel, Mehrsprachigkeit usw.


Diese Anforderungen sollten nach einer Bestandserhaltungsmaßnahme überprüft werden.
Grundlegende Risikofaktoren sollten definiert werden, z.B.:

  • das Format oder der Codec ist von Obsoleszenz bedroht
  • das Objekt liegt in einem proprietären oder kaum verbreiteten Format oder Codec vor


Tritt einer der Risikofaktoren auf, sollten alle Objekte im betroffenen Format in ein neues Zielformat migriert werden.

Authentizität

Die Sicherung der Authentizität bedeutet, nachweisen zu können, dass ein Objekt ist, was es zu sein vorgibt. Da Bestandserhaltungsmaßnahmen wie Formatmigrationen zwangsläufig eine Veränderung eines Objekts verursachen, ist die Sicherung der Authentizität nicht ganz unproblematisch. Folgende Maßnahmen sind zur Sicherung der Authentizität etabliert:
die Aufbewahrung des Originals und aller Bearbeitungen des Objekts (Versionierung)
der Nachweis von Veränderungen am Objekt in den Metadaten

Empfehlung

Aufgrund der begrenzten Ressourcen kann es für kleinere Institutionen schwierig sein, alle Versionen eines Objekts aufzubewahren und somit die vollständige Nachweiskette zu erhalten, denn die Speicherkapazität spielt bei audiovisuellen Objekten nach wie vor eine Rolle. Reichen die Ressourcen nicht aus, sollte wenigstens das Original und die jeweils aktuelle Version des Archivformats aufbewahrt werden.

Der vollständige Nachweis über Veränderungen am Objekt muss in den Metadaten erfolgen. Die Protokollierung von Änderungen muss technisch und organisatorisch sichergestellt sein.
Diese beinhaltet z.B.:

  • Art und Zeitpunkt der Änderung
  • Name des Benutzers, der die Änderung veranlasst hat
  • Name des Benutzers oder des Programms, der/das die Änderung durchgeführt hat
  • Grund der Änderung

 

Metadaten

Metadaten beschreiben ein Objekt. Es wird zwischen folgenden Metadatenkategorien unterschieden:
deskriptive Metadaten: Es handelt sich um klassische Erschließungsmetadaten.Diese beschreiben ein Objekt und gewährleisten, dass es wiederauffindbar ist. Erschließungsmetadaten unterteilen sich in formale Metadaten wie Titel, Urheber, Erscheinungsjahr usw. und inhaltsbeschreibende Metadaten wie Schlagworte, ein Abstract, ein Transkript, Sequenzbeschreibungen usw.
administrative Metadaten: Administrative Metadaten sind für die Verwaltung der Objekte im Langzeitarchiv und den Betrieb des Systems erforderlich, z.B. systeminterne Identifier, Nutzerdaten, Rollen- und Rechtevergabe.
rechtliche Metadaten: Rechtliche Metadaten beschreiben den Nutzerzugriff auf die Objekte. Sie legen auch fest, ob die Objekte bearbeitet und wie sie bereitgestellt werden dürfen.
technische Metadaten: Technische Metadaten beschreiben z.B. Dateiformat und -version, den Codec, Laufzeit, Dateigröße, Bitrate usw. Technische Metadaten können aus der Datei extrahiert werden.
strukturelle Metadaten: Strukturelle Metadaten beschreiben die Zusammensetzung eines Objekts und Zusammenhänge mit anderen, z.B. wenn ein Objekt aus mehreren Dateien in einer festgelegten Reihenfolge besteht oder wenn Objekte Teil einer Serie sind.
Provenienzmetadaten: Diese Metadaten beschreiben die Objektgeschichte, um zu dokumentieren, welcher Nutzer wann mit welchen Tools welche Bearbeitung vorgenommen hat. Diese Metadaten sind von großer Wichtigkeit für den Nachweis der Authentizität.

Empfehlung

Auch kleinere Institutionen sollten nach Möglichkeit Metadaten aller Kategorien erfassen.
Die Erschließung der Objekte wird für gewöhnlich in einem Nachweissystem erfolgen. Dort können neben deskriptiven Metadaten abhängig vom System auch technische, rechtliche und strukturelle Metadaten erfasst werden. Diese Metadaten sollten vollständig oder in Auswahl in das Langzeitarchivierungssystem überführt werden, das in der Lage ist, administrative und Provenienzmetadaten zu erzeugen und zu verwalten.
Ist das nicht möglich, sollten mindestens deskriptive, rechtliche und technische Metadaten erfasst werden.

Erschließung

Neben den formalen Metadaten sollten auch inhaltsbeschreibende Schlagworte verwendet werden. Die Erschließungstiefe ist abhängig von den Vorgaben der Institution und den Anforderungen der Nutzer.
Wenn das Nachweissystem der Institution für die Erschließung und Verwaltung von Multimediaelementen geeignet ist, können die audiovisuellen Objekte mit dem Nachweissystem verwaltet und beschrieben werden. Ist das vorhandene Nachweissystem nicht geeignet, sollte frei verfügbare Datenbanksoftware verwendet werden, die für Multimediaobjekte geeignet ist.
Nachweissysteme sind i.d.R. nicht für die Langzeitarchivierung geeignet.
Es kommt auch ein Digital Asset Management System (DAM)/Media Asset Management System (MAM) in Betracht. Ein DAM/MAM ist allerdings i.d.R. nicht für die Langzeitarchivierung geeignet. Ob das System für die Langzeitarchivierung geeignet ist, muss im Einzelfall untersucht werden.
Für den Nachweis der Objekte und die Erfassung von deskriptiven und strukturellen Metadaten sind Nachweissysteme oder DAM/MAM-Systeme jedoch gut geeignet. Ob rechtliche und technische Metadaten erfasst werden können, muss im Einzelfall geprüft werden.

Provenienz- und Erhaltungsmetadaten

Für die Erfassung von Provenienzmetadaten kann überlegt werden, ob die Provenienzmetadaten separat zu erfassen sind und eine Verknüpfung mit dem bestehenden Nachweissystem erfolgen kann. Empfehlenswert ist eine METS/MODS-Datei, die die relevanten Metadaten enthält. Besser wäre jedoch der Einsatz eines OAIS-konformen Langzeitarchivierungssystems, das die Protokollierung LZA-relevanter Metadaten automatisiert gewährleistet, oder die Abgabe der Objekte an eine Institution, die die Langzeitarchivierung leisten kann.

Präsentation/Zugriff

Das Format der Nutzungskopien sollte die Anforderungen der vorgesehenen Nutzerzielgruppen berücksichtigen.
Weitverbreitete, offene Formate sollten bevorzugt werden; proprietäre Formate sind häufig an eine spezielle Wiedergabesoftware gebunden, binden an einen Hersteller und begrenzen die Nutzung. Im Idealfall soll die Nutzungskopie ohne die Installation zusätzlicher Software lesbar sein. Für verschiedene Nutzungsszenarien können verschiedene Nutzungsformate erforderlich sein.

Empfehlung

In kleineren Institutionen ist das Nutzungsformat oft identisch mit dem Archivmaster. In diesem Fall muss das Archivformat für die Nutzung geeignet sein. Alternativ müssen Nutzungskopien in einem geeigneten Format erzeugt werden.
Reichen die technischen Ressourcen nicht aus, um Nutzungskopien vorzuhalten, können sie auch auf Nachfrage erzeugt werden, wenn die Nachfrage gering ist. Stark nachgefragte Objekte sollten in einer Nutzungskopie vorgehalten werden. Das Nutzungsformat sollte den Bedürfnissen des Nutzers entsprechen.

In kleinen Institutionen können alle Nutzungsszenarien vorkommen, wenn die Ressourcen für eine Webpräsentation zur Verfügung stehen:

  • lokale Nutzung
  • der Versand von Datenträgern
  • Onlinezugriff

 

Dateiformate und Codecs

Für den Archivmaster sind offene, standardisierte und weitverbreitete Formate zu bevorzugen, die nicht oder verlustfrei komprimieren, um einem späteren Qualitätsverlust vorzubeugen. Proprietäre Dateiformate sind oft an eine spezifische Software eines Herstellers gebunden und stellen eine potenzielle Gefahr für die langfristige Verfügbarkeit dar, da der Code nicht öffentlich zugänglich ist und Formatmigrationen so erschwert oder sogar unmöglich werden. Zu beachten ist bei der Wahl des Archivmasters auch die Kompatibilität eines Formats und Codecs. Eine Zusammenstellung empfohlener Formate und Codecs finden Sie unter AG Media.
Darüber hinaus muss basierend auf den Anforderungen der vorgesehenen Nutzerzielgruppen auch eine Entscheidung über die Formate für Nutzungskopien getroffen werden.

Empfehlung

Die große Vielfalt potenzieller Ablieferungsformate stellt die Institutionen vor eine große Herausforderung. Je höher die Anzahl der Dateiformate, desto größer ist der Aufwand für die Bestandserhaltung (Preservation Planning, Preservation Watch, Preservation Actions, Risikomanagement usw.). Es ist deshalb für kleine Institutionen sinnvoll, die Anzahl der Dateiformate im digitalen Langzeitarchiv auf eine Auswahl zu beschränken. Das kann durch folgende Verfahren geschehen:

  • die Veröffentlichung einer Liste bevorzugter Dateiformate
  • durch Normalisierung im digitalen Langzeitarchiv
  • oder durch eine Kombination beider Verfahren


Die Rahmenbedingungen und das Vorgehen bei der Normalisierung sollten in einer öffentlich verfügbaren Policy dokumentiert werden, um den Prozess für Produzenten und Nutzer transparent zu machen.
Diesem pragmatischen Ansatz steht die Anforderung der Gewährleistung der Authentizität gegenüber. Auch ein kleines digitales Langzeitarchiv muss nachweisen können, dass ein Objekt ist, was es auch zu sein scheint. Diese Anforderung wird u.a. durch den Erhalt des Originals und die Dokumentation von Veränderungen in den Metadaten gewährleistet. Kleinere Institutionen verfügen meist nicht über die Kapazitäten, um eine große Anzahl von Dateiformaten zu verwalten. Die Normalisierung eingehender Objekte reduziert die Arbeitsbelastung erheblich.

Formatempfehlung

Matroska (*.mkv), ffv1-codiert, Audio: Wave Linear PCM 48 kHz

Die empfohlene Kombination aus Dateiformat und Codec kann mit FFmpeg erzeugt werden. Weitere Dateiformate werden unter
https://wiki.dnb.de/display/NESTOR/AG+Media behandelt.

Wenn möglich, sollten ein oder wenige Formate für die Archivmaster festgelegt werden, die sich im Idealfall auch als Nutzungskopien eignen. Für die Konvertierung stehen verschiedene Konvertierungsprogramme als proprietäre oder Open-Source-Software zur Verfügung.
Gleichzeitig sollten kleinere Institutionen versuchen, die Anzahl verschiedener Formate bereits bei der Anlieferung zu begrenzen, z.B. durch die Veröffentlichung einer Liste bevorzugter Dateiformate.
Soll für die Nutzung auf den Archivmaster zugegriffen werden, ist unbedingt zu beachten, dass die Wiedergabesoftware den Archivmaster nicht (versehentlich) manipulieren kann. Dies lässt sich z.B. durch read-only-Zugriff auf den Archivmaster erreichen.

 

  • Keine Stichwörter