Versionen im Vergleich

Schlüssel

  • Diese Zeile wurde hinzugefügt.
  • Diese Zeile wurde entfernt.
  • Formatierung wurde geändert.

Ein Archivierungsprojekt der Stiftung Deutsche Kinemathek und des Zuse Instituts Berlin.

Problemstellung:
Bei der Digitalisierung von Filmmaterial fallen diverse Bild-und Tondigitalisate zeitversetzt an. Es ist nicht immer möglich, diese Items gleichzeitig zu einem AIP1 zusammenzufassen. Die Items werden in Datenpaketen strukturiert und mit Metadaten angereichert. Trotzdem sollen die zeitlich verteilt eintreffenden Datenkonvolute kontinuierlich in die Langzeitarchivierung (LZA) überführt werden.

Ein Lösungsansatz besteht darin, persistente Identifikatoren (PID) für die Erfassungsebenen Werk und Item einzusetzen, die aufeinander referenzieren. So werden bis hinunter auf die Item-Ebene eindeutige Beziehungen der Teile Datenpakete zueinander und zu einem Ganzen möglich. Das heißt, in jedem AIP sind alle für das Item relevanten Metadaten sowie eine Referenz auf das Werk und auf ein Publikationsevent hinterlegt.2 die Metadaten (nach FIAF D7) Manifestation/Item Physical Description sowie die Kernmetadaten zur Identifikation des Werkes in Form des Minimum-Sets EN 15744 hinterlegt. Über eine Rechercheoberfläche sind diese Metadaten durchsuchbar.

Als Teil der Langzeit-Archivierungsstrategie des ZIB-SDK Projekts werden die Metadaten künftig automatisch aus der SDK internen Adlib-Datenbank extrahiert und in ein METS geschrieben, welches das Datenpaket umfassend beschreibt. METS ist der etablierte Standard in der Langzeitarchivierung, um Strukturen und deskriptive Informationen zu erfassen.

Jeder METS-Container in jedem Datenpaket enthält somit:

  • die bei Datenübernahme erhobenen Checksummen auf Dateiebene

  • den Minimum-Set Standard EN 15744 zur Identifikation des filmografischen Werks und

  • die Metadaten Manifestation/Item Physical Description (nach FIAF D7) zum jeweiligen Datenpaket und

  • Persistente Identifikatoren

Mit diesem Vorgehen werden zwei Ziele erreicht:

  1. Persistente Identifikatoren ermöglichen es, einzelne Teile eines Restaurierungsevents zeitlich versetzt in die Langzeitarchivierung zu überführen, ohne die Beziehungen der einzelnen Teile zueinander zu verlieren. Das PID-System wird nicht in einem proprietären System in der Institution betrieben, sondern außerhalb des Archivs im Web. Die Verwendung etablierter Standards und eine Offenheit für andere Identifikatorensysteme befördert eine breite Akzeptanz in der Community. Durch ein Identifikatorensystem werden die Werks- und Manifestation/Item (Manifestation) -metadaten Physical Description-Metadaten auch nach außen sichtbar, während die technischen Metadaten im AIP verbleiben können.

  2. Über eine Rechercheoberfläche Oberfläche kann auf Werks- Fassungs oder Publikationsevent- und Item-Ebene allen erfassten Ebenen in den Metadaten recherchiert werden. Ein PID-System mit seinen standardisierten Kernmetadaten ist prädestiniert dafür, zu einer Art Verbundkatalog der AV-Materialien sammelnden Institutionen werden zu können. Die Recherche auf der Oberfläche des PID-Systems führt dann beispielsweise auf die wesentlich umfangreicheren Metadaten der SDK-Datenbank auf der SDK-deren Website. Die Zuordnungen der Metadaten im PID-System zu den Datenpaketen im Langzeitarchiv und zu der SDK-Datenbank bleiben durch die Identifikatoren erhalten. Über diese Referenz wird es zukünftig möglich sein, einzelne Teile einer Manifestation aus dem digitalen Langzeitarchiv anzufordern.


Aufgaben:

Teilaufgabe 1:

Analyse Identifikatoren (PIDs) für Film.

...

Der EN 15744-Standard dient der Basis-Identifikation von audiovisuellen Werken auf der Werksebene und ist auf Englisch, Französisch und Deutsch von allen europäischen nationalen Standardisierungsinstitutionen erhältlich (max. 15 Felder). Die Werksidentifikation wird ergänzt durch die Ebene des Publikationsevents mit 6 Elementen des Standards EN 15907. Auf diese Felder werden die SDK-Daten der Werks- und Manifestationsebene gemappt. Eine Teilmenge der technischen Metadaten wird in einem abgestimmten Standard auf Item-Ebene dargestellt. Ziel ist hier einen bereits etablierten Metadatenstandard wie beispielsweise EBUCore zu verwenden.. Es liegt bisher keine standardisierte XML-Umsetzung des EN 15744 vor. Das Minimum-Set definiert die Datenelemente, die die Interoperabilität zwischen multilingualen kinematografischen Katalogen ermöglichen. Bisher entwickeln Institutionen eigene XML-Schemata für EN 15744 oder nutzen Elemente des EN 15907 in eigenen Austauschschemata.

Ziel ist es, den Metadatensatz EN 15744 in ein standardisiertes XML-Schema zu übertragen, um ihn in ein METS einbetten zu können. Dazu wird EN 15744 in EBUCore implementiert und durch das EBUCore-XML-Schema umgesetzt.

Teilaufgabe 4:

Bereitstellung eines Testsystems zur Recherche.

...

Beim Anlegen von Werken und Items in der SDK-Datenbank werden über eine Schnittstelle zum PID-System automatisiert Identifikatoren erzeugt und in Adlib übernommen. Die dazugehörigen deskriptiven Metadaten werden automatisch aus Adlib extrahiert und im PID-System mit den Identifikatoren verknüpft.32


...

1 Archival Information Package, Ein Archivpaket aus Inhalt und Metadaten in der LZA. Der Inhalt kann beispielsweise ein Bild sein, während die Metadaten weitere Informationen zum Objekt liefern.

2 Im Filmkontext befinden sich in den Metadaten der Tonspur dann alle technischen Informationen der Tonspur, sowie ein Identifikator (PID), in dem festgehalten ist, dass diese Tonspur zu einer Manifestation gehört („is part of“). Im Datenset der Manifestation wiederum befindet sich ein Identifikator, der auf die verschiedenen Items verweist („has part“).3 Sowohl Adlib, als auch alle gängigen PID-Systeme besitzen gut dokumentierte Schnittstellen, die es ermöglichen, Metadaten automatisiert auszutauschen. Die im Projekt „Datenübernahme im Filmarchiv“ entwickelte Schnittstelle, mit der Metadaten in Adlib geschrieben werden, kann weitestgehend nachgenutzt werden.