Sie zeigen eine alte Version dieser Seite an. Zeigen Sie die aktuelle Version an.

Unterschiede anzeigen Seitenhistorie anzeigen

« Vorherige Version anzeigen Version 5 Aktuelle »

Auswahl des zu archivierenden Materials

Selektionskriterien bilden die Entscheidungsgrundlage für die Frage, ob ein Objekt langfristig gesichert werden soll. Hierbei spielen neben rechtlichen auch inhaltliche Kriterien eine Rolle. Besondere Bedeutung kommt der Frage nach den Ressourcen zu.

Empfehlung

Mittlere Institutionen sollten anhand ihres Sammlungsprofils und ihres Mandats selektieren:

  • Ist das Objekt archivwürdig?
  • Entspricht das Objekt dem Sammlungsprofil bzw. dem Archivauftrag?
  • Liegen alle benötigten Rechte vor (Langzeitarchivierung, Veränderung, Verbreitung)?


Es kann auch überlegt werden, ob die Objekte an eine Institution abgegeben werden, die die Langzeitarchivierung als Dienstleistung gewährleisten kann.


Beschreibung der vorgesehenen Nutzungsszenarien

Die vorgesehenen Nutzerzielgruppen sind die aktuellen und künftigen Nutzergruppen, die mit dem digitalen Langzeitarchiv oder daran angeschlossenen Nutzungsplattformen interagieren. Unter Nutzerzielgruppen sind an dieser Stelle nicht nur die klassischen Nutzer zu verstehen. Vorgesehene Nutzerzielgruppen sind auch externe Nutzer wie Produzenten, die Objekte abliefern, und interne Nutzer wie die Mitarbeiter der Institution.
Verschiedene vorgesehene Nutzerzielgruppen können unterschiedliche Anforderungen haben. Die vorgesehenen Nutzerzielgruppen entsprechen den klassischen Zielgruppen der Institution. Diese sind bekannt und deren Anforderungen sind bereits analysiert worden. Zusätzlich kommen als vorgesehene Nutzerzielgruppen hinzu:

  • die Datenproduzenten
  • die mit der digitalen Langzeitarchivierung befassten Mitarbeiter


Die verschiedenen vorgesehenen Nutzerzielgruppen haben bestimmte Anforderungen. Daraus ergeben sich Nutzungsszenarien und signifikante Eigenschaften, die Einfluss auf die Erhaltungsmaßnahmen nehmen.

Empfehlung

Eine Analyse der Nutzerzielgruppen sollte durchgeführt werden, die neben den klassischen Zielgruppen der Institution auch die Datenproduzenten und die Mitarbeiter berücksichtigt.
Die Analyse der Nutzerzielgruppen sollte folgende Punkte beinhalten:

  • die Beschreibung und Abgrenzung der verschiedenen Nutzerzielgruppen
  • die Beschreibung der Anforderungen der Nutzerzielgruppen
  • in den Nutzerzielgruppen verbreitete Dateiformate


Die Nutzerzielgruppen sollten in wiederkehrenden Abständen erneut analysiert werden, da sich die Anforderungen im Lauf der Zeit ändern können.

Qualitätsmanagement

Qualitätsmanagement bezeichnet Verfahren und Prozesse, die die Qualität der Objekte sowie der Prozesse im digitalen Langzeitarchiv sicherstellen sollen. Darunter fallen z.B.:

  • Übernahmevereinbarung (ein Dokument, das organisatorische, rechtliche und technische Punkte bei der Übernahme berücksichtigt)
  • Eingangskontrolle der Objekte (Überprüfung der Objekte beim Eingang in das digitale Langzeitarchiv)
    • Prüfung auf Lesbarkeit und inhaltliche Vollständigkeit
    • Prüfung auf inhaltliche Übereinstimmung mit den deskriptiven Metadaten
    • technische Fehlerfreiheit
    • Standardkonformität
  • Dokumentation von Prozessen (Genaue Beschreibung von Prozessen im digitalen Langzeitarchiv: Was wird wann warum wie gemacht? Z.B. schriftlich oder in einer Notation für Prozessdokumentation wie BPMN 2.0.)
  • Evaluierung von Prozessen (Dokumentierte Prozesse können nach Kriterien wie Praxistauglichkeit, Zeitaufwand, Ressourcenaufwand, Überschneidungen mit  anderen Prozessen usw. untersucht werden. Die Analyse ist Voraussetzung für die Optimierung der Prozesse.)
  • Kontrollverfahren (technische und organisatorische Verfahren für die Kontrolle von definierten Regeln und Strukturen oder zur Evaluierung von Ergebnissen nach Änderungen an Objekten)
  • Regelkonformität von Transfer- und Archivpaketen
  • Qualitätsprüfung nach Formatmigrationen
  • Lesbarkeit und Vollständigkeit nach Änderungen am Objekt
  • Nutzung von Standards
  • Beachtung der Kriterien für die vertrauenswürdige Langzeitarchivierung (nestor-Siegel nach DIN 31644, auch Data Seal of Approval)


Empfehlung

Maßnahmen für das Qualitätsmanagement müssen implementiert werden.
Es wird empfohlen, eine Eingangskontrolle durchzuführen und Kontrollverfahren einzurichten. Darüber hinaus sollten Standards genutzt und die Kriterien für die vertrauenswürdige Langzeitarchivierung beachtet werden. Prozesse sollten mindestens grundlegend dokumentiert werden.
Die Eingangskontrolle sollte eine (stichprobenartige) Sichtprüfung des Materials und die Prüfung der Übereinstimmung mit den deskriptiven Metadaten beinhalten. Zusätzlich sollten die Objekte identifiziert werden.  
Wenn möglich, sollten die Produzenten die Objekte mit einer Prüfsumme an das Archiv abgeben. Diese Prüfsumme muss nach der Annahme im Archiv geprüft werden. Stimmen die Prüfsummen nicht überein, muss das Objekt abgewiesen und vom Produzenten erneut abgegeben werden, bis ein erfolgreicher Transfer mit übereinstimmenden Prüfsummen erfolgt ist.
Die Kontrollverfahren können teilautomatisiert werden. Die Prüfung auf Lesbarkeit und Vollständigkeit nach Formatmigrationen sollte (stichprobenartig) manuell erfolgen. Darüber hinaus muss nach einer Bestandserhaltungsmaßnahme geprüft werden, ob die signifikanten Eigenschaften erhalten geblieben sind.
Die Prüfung auf Regelkonformität von Transferpaketen kann automatisiert erfolgen, indem ein entsprechendes Prüfverfahren bei der Übernahme implementiert wird.
Die Nutzung von Standards bezieht sich auf das Standard-Referenzmodell OAIS, auf Metadatenstandards (z.B. PREMIS, Dublin Core, METS) sowie Dateiformatstandards. Darüber hinaus können darunter auch standardisierte Prozesse und einheitliche Paketstrukturen verstanden werden. Das Langzeitarchivierungssystem muss in der Lage sein, regelkonforme Archivpakete zu erstellen.
Einheitlich strukturierte Daten und definierte Prozesse erleichtern nicht nur die digitale Langzeitarchivierung, sondern jegliche Art von Datenverwaltung.
Darüber hinaus sollte die Institution sich an den Kriterien für die vertrauenswürdige Langzeitarchivierung orientieren. Selbst wenn keine Zertifizierung angestrebt wird, sind die dort beschriebenen Kriterien hilfreich, um die Qualität der digitalen Langzeitarchivierung sicherzustellen.

Erhaltungsstrategien

Erhaltungsstrategien stellen sicher, dass das Objekt als Datenstrom erhalten und nutzbar bleibt. Dabei sichern Verfahren für die Bitstream-Preservation den Datenstrom und Verfahren für die Content-Preservation die Les- und Interpretierbarkeit des Objekts.

Bitstream-Preservation

Digitale Datenträger sind nur von begrenzter Haltbarkeit. Sie sind nicht nur von Verschleiß betroffen, auch Hardwareobsoleszenz ist problematisch. Aus diesem Grund ist ein Speicherkonzept essenziell für die Erhaltung des Bitstroms der digitalen Objekte.
Grundlegende Anforderungen an das Speicherkonzept sind:

  • redundante, geografisch verteilte Speicherlösung
  • Integritätschecks, z.B. mit Prüfsummen
  • Viruscheck
  • Datenschutzkonzept
  • regelmäßiger Austausch von Datenträgern
  • Monitoring
  • Skalierbarkeit


Die Sicherung des Bitstroms eines Objekts ist ein stetig wiederkehrender Prozess und Basis jeder Erhaltungsstrategie.

Empfehlung

Mittlere Institutionen können ein eigenes Speichersystem betreiben, wenn die technischen Ressourcen vorhanden sind. Es kann aber auch sinnvoll sein, im Verbund mit anderen Institutionen ein Rechenzentrum zu betreiben oder einen Dienstleister mit der Bitstream-Preservation zu beauftragen. Diese Entscheidung muss im Einzelfall getroffen werden.

Die institutionsinterne Bitstream-Preservation sollte die folgenden Anforderungen erfüllen:

  • redundante, räumlich getrennte Speicherung auf verschiedenen Speichermedien
  • Integritätschecks
  • Viruschecks
  • Datenschutzkonzept
  • regelmäßiger Austausch von Datenträgern
  • Monitoring
  • Skalierbarkeit


Es sollte eine professionelle Speicherlösung gewählt werden. Es wird zu einer Kombination aus Festplatten- und Bandspeicher geraten. Darüber hinaus müssen Sicherheitsbestimmungen beachtet werden. Darunter fallen:

  • physischer Zugang
  • Zugriffsberechtigungen
  • Einbruchmeldeanlage
  • digitale Zugriffsberechtigungen
  • Brandschutz
  • Desaster Recovery


Mit einem Dienstleister sollte ein Service-Level-Agreement (SLA) vereinbart werden. Der Umfang der Dienstleistung muss genau evaluiert werden, um sicherzustellen, dass alle Anforderungen an die Bitstream-Preservation erfüllt werden.

Content-Preservation

Content-Preservation soll sicherstellen, dass der Inhalt eines Objekts auch nach Jahren wiedergegeben und interpretiert werden kann.
Dafür ist es erforderlich:

  • das Dateiformat, die -version und den Codec zu identifizieren und zu validieren. Bei AV-Medien wird diese Erkenntnis durch den Codec erschwert, der in dem Containerformat enthalten ist
  • technische Metadaten zu extrahieren
  • Informationen über geeignete Wiedergabesoftware zu sammeln
  • Risikofaktoren zu identifizieren
  • signifikante Eigenschaften festzulegen
  • Kontextinformationen bereitzustellen, die die Wiedergabe des Objekts und die Interpretation des Inhalts ermöglichen


Auf Basis dieser Informationen können Bestandserhaltungsmaßnahmen konzipiert und durchgeführt werden. Dafür gibt es zwei Verfahren: Formatmigration und Emulation.

Empfehlung

Mittlere Institutionen sollten eine Erhaltungsstrategie ausarbeiten.
Die Erhaltungsstrategie sollte folgende Punkte abdecken:

  • Formatidentifikation und -validierung. Daraus folgend das Bilden von homogenen Bestandsgruppen.
  • Risikofaktoren identifizieren
  • Turnus für die Überprüfung der Risikofaktoren festlegen
  • Erhaltungsmaßnahmen für Bestandsgruppen festlegen
  • geeignete Tools für die Erhaltungsmaßnahmen definieren


Es wird die Formatmigration empfohlen, da es für die meisten audiovisuellen Objekte nicht erforderlich ist, die ursprüngliche Nutzungsumgebung zu erhalten. Eine Ausnahme stellt Videokunst dar, die im Wissenschaftlichen Film aber nicht als solche, sondern höchstens als Repräsentation vorkommt.
In Abhängigkeit von den personellen Ressourcen sollte die Anzahl der Archivformate im Archiv nach Möglichkeit auf ein bis einige wenige ausgewählte Dateiformate begrenzt werden. Es wird empfohlen, Objekte, die in anderen Dateiformaten vorliegen, nach dem Eingang der Originaldatei zu kopieren und in eines der ausgewählten Dateiformate umzuwandeln. Dafür stehen eine Reihe von Open-Source- und kommerzieller Software zur Verfügung.
Die Originaldatei sollte unverändert aufbewahrt werden.
Das Dateiformat sollte identifiziert und validiert werden. Es genügt nicht, ein Objekt über die Dateiendung zu identifizieren, da diese auch irreführend sein kann. Außerdem sollten technische Metadaten extrahiert werden. Das Dateiformat und der Codec eines Objekts müssen bekannt sein, da alle Erhaltungsmaßnahmen hierauf basieren.
Signifikante Eigenschaften sollten definiert werden. Der Fokus sollte auf den für die Institution und deren Nutzer wichtigen Eigenschaften eines Objektes liegen.


Signifikante Eigenschaften hängen u.a. auch davon ab, welchen Zweck die Aufnahme hat. Ist der Zweck der Aufnahme z.B. die Dokumentation eines Ereignisses, eines Experiments usw., so ergibt sich daraus, was besonders erhaltenswert ist. Davon wiederum hängen ggf. weitere technische signifikante Eigenschaften ab.
Diese Anforderungen sollten nach einer Bestandserhaltungsmaßnahme überprüft werden.

Beispiele für technische signifikante Eigenschaften:    

Eigenschaft Komponente Definition der Eigenschaft
VideokanälevideoAnzahl der unterschiedlichen Videokanäle im digitalen Objekt
AudiokanäleaudioAnzahl der unterschiedlichen Audiokanäle im digitalen Objekt
LängevideoAnzahl der Frames in der Aufnahme
BreiteframeBreite des Einzelbildes
HöheframeHöhe des Einzelbildes
BittiefepixelAnzahl der Farbinformationen pro Pixel
Farbmodellpixelverwendetes Farbmodell bei der Aufnahme
Farbraumpixelverwendeter Farbraum bei der Aufnahme
SeitenverhältnispixelSeitenverhältnis der Pixel
BildratevideoAnzahl der Frames in einem definierten Zeitintervall
Interlaceframefalls es sich um interlaced video handelt
Metadaten zum Objekt gehörende Metadaten

(Quelle: Archivematica Wiki)

Grundlegende Risikofaktoren sollten definiert werden, z.B.:

  • das Format oder der Codec ist von Obsoleszenz bedroht
  • das Objekt liegt in einem proprietären oder kaum verbreiteten Format vor


Tritt einer der Risikofaktoren auf, sollten alle Objekte im betroffenen Format in ein neues Zielformat migriert werden.


Authentizität

Die Sicherung der Authentizität bedeutet, nachweisen zu können, dass ein Objekt ist, was es zu sein vorgibt. Da Bestandserhaltungsmaßnahmen wie Formatmigrationen zwangsläufig eine Veränderung eines Objekts verursachen, ist die Sicherung der Authentizität nicht ganz unproblematisch. Folgende Maßnahmen sind zur Sicherung der Authentizität etabliert:

  • die Aufbewahrung des Originals und aller Bearbeitungen des Objekts (Versionierung)
  • der Nachweis von Veränderungen am Objekt in den Metadaten


Empfehlung

Mittlere Institutionen sollten das Originalobjekt sowie alle Versionen des Originalobjekts aufbewahren und Änderungen in den Metadaten dokumentieren. Die Protokollierung von Änderungen muss technisch und organisatorisch sichergestellt sein. Diese beinhaltet z.B.:

  • Art und Zeitpunkt der Änderung
  • Name des Benutzers, der die Änderung veranlasst hat
  • Name des Benutzers oder des Programms, der/das die Änderung durchgeführt  hat
  • Grund der Änderung


Metadaten

Metadaten beschreiben ein Objekt. Es wird zwischen folgenden Metadatenkategorien unterschieden:
deskriptive Metadaten: Es handelt sich um klassische Erschließungsmetadaten. Diese beschreiben ein Objekt und gewährleisten, dass es wiederauffindbar ist. Erschließungsmetadaten unterteilen sich in formale Metadaten wie Titel, Urheber, Erscheinungsjahr usw. und inhaltsbeschreibende Metadaten wie Schlagworte, ein Abstract, ein Transkript, Sequenzbeschreibungen usw.
administrative Metadaten: Administrative Metadaten sind für die Verwaltung der Objekte im Langzeitarchiv und den Betrieb des Systems erforderlich, z.B. systeminterne Identifier, Nutzerdaten, Rollen- und Rechtevergabe.
rechtliche Metadaten: Rechtliche Metadaten beschreiben den Nutzerzugriff auf die Objekte. Sie legen auch fest, ob die Objekte bearbeitet und wie sie bereitgestellt werden dürfen.
technische Metadaten: Technische Metadaten beschreiben z.B. Dateiformat und -version, den Codec, Laufzeit, Dateigröße, Bitrate usw. Technische Metadaten können aus der Datei extrahiert werden.
strukturelle Metadaten: Strukturelle Metadaten beschreiben die Zusammensetzung eines Objekts und Zusammenhänge mit anderen, z.B. wenn ein Objekt aus mehreren ateien in einer festgelegten Reihenfolge besteht oder wenn Objekte Teil einer Serie sind.
Provenienzmetadaten: Diese Metadaten beschreiben die Objektgeschichte, um zu dokumentieren, welcher Nutzer wann mit welchen Tools welche Bearbeitung vorgenommen  hat. Diese Metadaten sind von großer Wichtigkeit für den Nachweis der Authentizität.


Empfehlung

Mittlere Institutionen sollten Metadaten aller Kategorien erfassen.
Die Erschließung der Objekte wird für gewöhnlich in einem Nachweissystem erfolgen. Dort können neben deskriptiven Metadaten abhängig vom System auch technische, rechtliche und strukturelle Metadaten erfasst werden. Diese Metadaten sollten vollständig oder in Auswahl in das Langzeitarchivierungssystem überführt werden, das in der Lage ist, administrative und Provenienzmetadaten zu erzeugen und zu verwalten.

Erschließung

Neben den formalen Metadaten sollten auch inhaltsbeschreibende Schlagworte verwendet werden. Die Erschließungstiefe ist abhängig von den Vorgaben der Institution und den Anforderungen der Nutzer.
Wenn das Nachweissystem der Institution für die Erschließung und Verwaltung von Multimediaelementen geeignet ist, können die audiovisuellen Objekte mit dem Nachweissystem verwaltet und beschrieben werden. Ist das vorhandene Nachweissystem nicht geeignet, sollte frei verfügbare Datenbanksoftware verwendet werden, die für Multimediaobjekte geeignet ist. Nachweissysteme sind i.d.R. nicht für die Langzeitarchivierung geeignet.
Es kommt auch ein Digital Asset Management System (DAM)/Media Asset Management System (MAM) in Betracht. Ein DAM/MAM ist allerdings i.d.R. nicht für die Langzeitarchivierung geeignet. Ob das System für die Langzeitarchivierung geeignet ist, muss im Einzelfall untersucht werden.
Für den Nachweis der Objekte und die Erfassung von deskriptiven und strukturellen Metadaten sind Nachweissysteme oder DAM/MAM-Systeme jedoch gut geeignet. Ob rechtliche und technische Metadaten erfasst werden können, muss im Einzelfall geprüft werden.


Provenienz- und Erhaltungsmetadaten

Für die Erfassung von Provenienzmetadaten muss ein OAIS-konformes Langzeitarchivierungssystem eingesetzt werden. Alternativ sollte in Betracht gezogen werden, die Objekte an eine Institution abzugeben, die die Langzeitarchivierung leisten kann. Bereits vorhandene Metadaten, z.B. deskriptive und rechtliche Metadaten, können aus dem bestehenden Nachweissystem vollständig oder in Auswahl in das digitale Langzeitarchivierungssystem über eine Schnittstelle importiert werden. Im Langzeitarchivierungssystem sollten alle relevanten Metadaten in einer METS/MODS-Datei gespeichert werden, um eine schnellere Verarbeitung in Fällen der Formatmigration oder Metadaten-Updates zu gewährleisten.


Präsentation/Zugriff

Das Format der Nutzungskopien sollte die Anforderungen der vorgesehenen Nutzerzielgruppen berücksichtigen. Weitverbreitete, offene Formate sollten bevorzugt werden; proprietäre Formate sind häufig an eine spezielle Wiedergabesoftware gebunden, binden an einen Hersteller und begrenzen die Nutzung. Im Idealfall soll die Nutzungskopie ohne die Installation zusätzlicher Software lesbar sein.
Für verschiedene Nutzungsszenarien können verschiedene Nutzungsformate erforderlich sein.

Empfehlung

Mittlere Institutionen sollten Nutzungskopien erzeugen und für die Nutzung vorhalten. Das Format der Nutzungskopie sollte den Anforderungen der Nutzerzielgruppen entsprechen.
Es muss beachtet werden, wie die Objekte für die Nutzung zur Verfügung gestellt werden dürfen. Folgende Nutzungsszenarien sind denkbar:

  • lokale Nutzung
  • der Versand von Datenträgern
  • Onlinezugriff mit und ohne Registrierung


Dateiformate und Codecs

Für den Archivmaster sind offene, standardisierte und weitverbreitete Formate zu bevorzugen, die nicht oder verlustfrei komprimieren, um einem späteren Qualitätsverlust vorzubeugen. Proprietäre Dateiformate sind oft an eine spezifische Software eines Herstellers gebunden und stellen eine potenzielle Gefahr für die langfristige Verfügbarkeit dar, da der Code nicht öffentlich zugänglich ist und Formatmigrationen so erschwert oder sogar unmöglich werden. Zu beachten ist bei der Wahl des Archivmasters auch die Kompatibilität eines Formats und Codecs. Eine Zusammenstellung empfohlener Formate und Codecs finden Sie unter https://wiki.dnb.de/display/NESTOR/AG+Media.
Darüber hinaus muss basierend auf den Anforderungen der vorgesehenen Nutzerzielgruppen auch eine Entscheidung über die Formate für Nutzungskopien getroffen werden.

Empfehlung

Die große Vielfalt potenzieller Ablieferungsformate stellt die Institutionen vor eine große Herausforderung. Je höher die Anzahl der Dateiformate, desto größer ist der Aufwand für die Bestandserhaltung (Preservation Planning, Preservation Watch, Preservation Actions, Risikomanagement usw.).
Es ist deshalb sinnvoll, die Anzahl der Dateiformate im digitalen Langzeitarchiv möglichst gering zu halten, sofern die Institution Einfluss darauf nehmen kann. Dies kann durch folgende Verfahren geschehen:

  • die Veröffentlichung einer Liste bevorzugter Dateiformate
  • das Erzeugen einer neuen Version durch Formatmigration nach Eingang der Objekte. Die Originaldateien müssen dabei unverändert aufbewahrt werden.
  • eine Kombination beider Verfahren


Die Vorgehensweise sollte in einer öffentlich verfügbaren Policy dokumentiert werden, um den Prozess für Produzenten und Nutzer transparent zu machen.
Als Format empfiehlt sich Matroska (.mkv) PUID: fmt/569, ffv1-codiert, Audio: Wave Linear PCM 48 kHz. Die empfohlene Kombination aus Dateiformat und Codec kann mit FFmpeg erzeugt werden. Weitere Dateiformate sind in der Übersicht über „Dateiformate, Codecs und Bildformate“, unter https://wiki.dnb.de/display/NESTOR/AG+Media aufgeführt.

 

  • Keine Stichwörter