Versionen im Vergleich

Schlüssel

  • Diese Zeile wurde hinzugefügt.
  • Diese Zeile wurde entfernt.
  • Formatierung wurde geändert.

-> English version

Ein Forschungsprojekt zur Archivierung von AV Materialien. Federführung Stiftung Deutsche Kinemathek (SDK) und Zuse Institut Berlin (ZIB).

Problemstellung:
Bei der Digitalisierung von Filmmaterial fallen diverse Bild-und Tondigitalisate zeitversetzt an. Es ist nicht immer möglich, diese Items oder data objects gleichzeitig zu einem Archival Information Packet  (OAIS AIP1) zusammenzufassen. Die Items werden in Datenpaketen strukturiert und mit Metadaten angereichert. Trotzdem sollen die zeitlich verteilt eintreffenden Datenkonvolute kontinuierlich in die Langzeitarchivierung (LZA) überführt werden.

...

Persistente Identifikatoren (PID) sollen für alle Archivpakte auf den Erfassungsebenen Werk und Item , Fassung (im Archivkontext version) und item (oder data object) eingesetzt werden, und aufeinander referenzieren. So werden eindeutige Beziehungen der Datenpakete zueinander und zu einem Ganzen möglich. Das heißt, in jedem AIP sind die Metadaten (nach FIAF D7) Manifestation/Item Physical Description sowie die Kernmetadaten zur Identifikation des Werkes in Form des Minimum-Sets EN 15744 hinterlegt. Über eine Rechercheoberfläche sind diese Metadaten durchsuchbar.

Als Teil der Langzeit-Archivierungsstrategie des SDK -ZIB Projekts werden die Metadaten künftig automatisch aus der SDK internen Adlib-Datenbank extrahiert und in eine Metadatendatei im METS Format geschrieben, welches welche das Datenpaket umfassend beschreibt. METS ist der etablierte Standard in der Langzeitarchivierung, um Strukturen und deskriptive Informationen zu erfassen.

Das oben genannte METS-Format dient als Container, in dem die eigentlichen Metadaten , die dem Archivpaket beigegeben werden sollen und die ggf. in unterschiedlichen Formaten vorliegen, zusammengestellt werden können. Zur optimalen Integration der genannen Daten in das METS sollen diese jeweils als Serialisierung im XML-Format vorliegen., erfasst werden.

Jeder METS-Container in jedem Datenpaket enthält perspektivisch:

  • die bei Datenübernahme erhobenen Checksummen auf Dateiebene

  • den Minimum-Set Standard EN 15744 zur Identifikation des filmografischen Werks und

  • die Metadaten Manifestation/Item Physical Description (nach FIAF D7) zum jeweiligen Datenpaket und

  • Persistente Identifikatoren aus dem PID System

...

  1. Persistente Identifikatoren ermöglichen es, einzelne Teile eines Restaurierungsevents bspw. einer Restaurierung zeitlich versetzt in die Langzeitarchivierung zu überführen, ohne die Beziehungen der einzelnen Teile zueinander und zu einem übergeordneten Ganzen zu verlieren. Das PID-System wird nicht in einem proprietären System in der Institution betrieben, sondern außerhalb des Archivs im Web. Die Verwendung etablierter Standards und eine Offenheit für andere Identifikatorensysteme befördert eine breite Akzeptanz in der Community. Durch ein das Identifikatorensystem werden die Werks-, Versions- und Manifestation/Item Physical DescriptionObjekt-Metadaten auch nach außen sichtbar.

  2. Über eine Oberfläche kann auf allen erfassten Ebenen in den Metadaten recherchiert werden. Ein PID-System mit darin erfassten standardisierten Kernmetadaten ist prädestiniert dafür, kann ohne Probleme zu einer Art Verbundkatalog der AV-Materialien sammelnden Institutionen zu werden. Die Recherche auf der Oberfläche des PID-Systems führt dann beispielsweise auf die wesentlich umfangreicheren Metadaten der SDK-Datenbank auf deren Website. Die Zuordnungen der Metadaten im PID-System zu den Datenpaketen im Langzeitarchiv und zu der SDK-Datenbank bleiben durch die Identifikatoren erhalten. Über diese Referenz wird es zukünftig möglich sein, einzelne Teile einer Manifestation Fassung aus dem digitalen Langzeitarchiv anzufordern.


Aufgaben:

Teilaufgabe 1:

Analyse Identifikatoren (PIDs) für Film.

(EIDR, ISAN, Wikidata, Handle, DOI, ...)

Nach der Recherche bei Film-Institutionen und direkten Preisanfragen bei Anbietern erfolgt eine Analyse der Vor- und Nachteile unter Einbeziehung von (inter) nationaler Handhabung und Praxis. Es werden die Anforderungen an ein PID-System definiert und eine Entscheidungsmatrix erstellt.

Teilaufgabe 2:

Kostenkalkulation PID-System.

Einige der zu bewertenden PID-Systeme verursachen nicht unerhebliche Kosten. Zur Abschätzung der entstehenden Kosten erfolgt eine Hochrechnung auf Basis der Anzahl der Objekte der Projektpartner.

Teilaufgabe 3:

Metadaten des Identifikatoren-Systems.

...

EBUCore ist ein verbreiteter, aktiver und akzeptierter internationaler Standard für MediendatenMedien-metadaten, dabei liegt der Fokus von EBUCore bisher auf der Beschreibung der physischen (technischen) Charakteristika der Mediendaten. Es ist daher als Zielformat für diesen Teil der zu den Archivpaketen abzulegenden Metadaten sehr gut geeignet. Da es sich aber bei den filmografischen Daten aus EN 15744 um ein recht übersichtliches Minimum-Set handelt, ist dieses auch ebenfalls gut in EBUCore darstellbar. Dabei wird EN 15744 streng nach den Vorgaben in EBUCore implementiert und nicht verändert. Zusätzlich, auf gleicher Ebene, werden die Manifestation/Item Physical Vorgaben der FIAF angegeben, wobei eine grundsätzliche hierarchische Kapselung eben solcher Elemente erfolgt, die das Format des im Datenpaket archivierten Items betreffen. Der Metadatensatz wird um ein zusätzliches Publikationsevent eine zusätzliche Ebene "Version" ergänzt, das aus den in der Kinemathek erfassten Manifestationsfeldern extrahiert wird. Durch das Publikationsevent lassen sich Items einer Manifestation zuordnen. Das Werk, die Version und das data object mit dem Item erhalten jeweils einen PID.

Teilaufgabe 42:

Bereitstellung eines Testsystems zur Recherche.

Basierend auf dem gewählten PID-handle System wird ein Testdatensatz mit den unter Teilaufgabe 3 definierten Metadatenfeldern entwickelt. Kosten und Aufwand hierfür variieren je nach gewähltem PID-System werden im Laufe des Projekts in Teilaufgabe 2 ermittelt.

Teilaufgabe 5Teilaufgabe 3:

Schnittstelle PID-System und Adlib Datenbank:

...