Versionen im Vergleich

Schlüssel

  • Diese Zeile wurde hinzugefügt.
  • Diese Zeile wurde entfernt.
  • Formatierung wurde geändert.

...

  • Stefanie Rühle, Francesca Schulze

Grundsätzliches

Anforderungen/Empfehlungen aus dem DINI-Zertifikat 2013

Überlegungen zu einer On-Top-Systematik für den Kulturbereich

Entwurf: Anforderungen/Empfehlungen zur Verwendung von kontrollierten Vokabularen (7.12.2015)

Kontrollierte Vokabulare dienen dazu die Beschreibung von Kultur- und Wissensobjekten zu vereinheitlichen. Sie ermöglichen den Datennehmern die Metadaten zu den digitalen Sammlungen für verschiedene Anwendungsfälle sinnvoll auszuwerten. Im Kontext von digitalen Sammlungen haben sie vor allem folgende Funktionen:

  • Unterstützung der Suche und Wiederauffindbarkeit der Kultur- und Wissensobjekte (und ihrer digitalen Repräsentationen)
  • Einheitliche Präsentation der Beschreibungen zu den Kultur- und Wissensobjekten (und ihrer digitalen Repräsentationen)
  • Hierarchische Vernetzung der Kultur- und Wissensobjekte (und ihrer digitalen Repräsentationen)
  • Darstellung von Verwandtschaftsbeziehungen zwischen Kultur- und Wissensobjekten auf der horizontalen Ebene
  • Verknüpfung der Kultur- und Wissensobjekten mit Entitäten wie Personen, Orten, Körperschaften, Ereignissen oder Konzeptbegriffen
  • Unterstützung eines strukturierten Abrufs von Datensets durch Datennehmer anhand unterschiedlicher formaler Gruppierungskriterien

In den Kultur- und Wissenseinrichtungen werden unterschiedliche Verfahren für die Erschließung von Kultur- und Wissensobjekten angewandt. Die Auswahl der Vokabulare ist abhängig von der Sparte, dem Fachbereich und der Art der Kultur- und Wissensobjekte sowie dem für die Erschließung zu Grunde liegenden Regelwerk und Erfassungssystem.

Aus formalen Gesichtspunkten können kontrollierte Vokabulare wie folgt gruppiert werden:

  • Einfache Term- bzw. Wertelisten
  • Normdaten für die einheitliche Beschreibung von Personen, Körperschaften, Orten, Ereignissen oder abstrakten Begriffen
  • Strukturierte Vokabulare, in denen Begriffe miteinander in Beziehung gesetzt sind, z.B. Klassifikationen oder Thesauri 

Darüber hinaus werden kontrollierte Vokabulare für die Vereinheitlichung der Struktur von Metadaten innerhalb eines Austauschformats oder Anwendungsprofils verwendet. Dazu zählen vor allem sogenannte Type-Attribute, die die Art eines Elementinhalts genauer spezifizieren.

Das DINI-Zertifikat gibt ausdrücklich die Empfehlung, Vokabulare zu verwenden, die innerhalb einer Sparte und bestenfalls darüberhinaus anerkannt und verbreitet sind. Jedes verwendete Vokabular muss standardkonform aufgebaut und von einer Institution veröffentlicht und gepflegt werden, die die langfristige Nachnutzbarkeit gewährleistet. Darüber hinaus muss das Vokabular zumindest folgende Qualitätskriterien erfüllen: 

  • Begriffe sind eindeutig identifiziert und definiert
  • Synonyme sind möglichst vollständig erfasst
  • Homonyme sind eindeutig geklärt

Um eine möglichst breite Nachnutzbarkeit der Metadaten zu gewährleisten sollen Vokabulare verwendet werden, die im Sinne von Linked Open Data in maschinenlesbarer Form frei zur Verfügung stehen. Für Vokabulare, die dieses Qualitätskriterium nicht erfüllen, wird ein semantisches Mapping zur GND oder zum AAT unter Berücksichtigung der Standards ISO 25964 und SKOS empfohlen.

Darüber hinaus wird empfohlen einschlägige Regelwerke bei der Verwendung von Begriffen aus Vokabularen zu beachten (z.B. RDA, RSWK, CDWACCO). Dies dient im Endeffekt der Wiederauffindbarkeit von Kultur- und Wissensobjekten innerhalb der digitalen Sammlungen. 

Für alle Dokumente wird zusätzlich zu den Sachgruppen der Deutschen Nationalbibliografie eine verbale Sacherschließung durch frei vergebene Schlagwörter oder eine klassifikatorische Erschließung (fachübergreifend oder fachspezifisch) vorgenommen.

  • Dazu zählen beispielsweise SWD[1], LoC Subject Headings[2], CCS[3], MSC[4] und PACS[5].
  • Die Schlagwörter können auch unmittelbar durch die Autor/‑innen vergeben werden.
  • Wording: "kategorisiert" statt "klassifiziert"
  • DDC nach Möglichkeit verwenden
  • aber: ist für den nicht-bibliothekarischen Bereich vielfach nicht passend
  • Alternativen für die unterschiedlichen Sparten anbieten(TODO: noch recherchierchen!) - AV, 20150520: 
  • Ein (oder vielleicht der) wichtiger Aspekt ist meines Erachtens eine Repository-übergreifende Themazuordnung, die insbesondere auch die Strukturierung (Set-Abruf) unterstützt. Von daher ist die fachspezifische Zuordnung via Fachklassifikation (s. unten) und Nutzung von dc:subject unabhängig davon zu sehen. Deswegen ist 'kategorisiert' viel besser! (FSu)
  • UM: Mir ist noch nicht klar, wie/ob eine Trennung zwischen inhaltlichen (à la DDC) und objekttypbezogenen Kategorien aufrecht erhalten werden kann bzw. sinnvoll ist. Das war im DINI-Z jedenfalls die Aufteilung zwischen M.6-3 und M.6-4.
    --> gehört die AAT-Objektfacette nicht eher zur M.6-4?
  • FS: Durch eine Klassifizierung stellt man eine Beziehung zwischen Objekten mit ähnlichen Merkmalen (wie Material, Form, Funktion, Region oder Ursprung, kultureller Kontext, Stilepoche) her (vgl. http://www.getty.edu/research/publications/electronic_publications/cdwa/2classification.html). Von daher stimme ich dem zu, dass hier auch inhaltliche Merkmale eine Rolle spielen. Trotzdem braucht man beides - die Objektklassifikation und den Objekttyp / Objektbezeichnung:
    • Klassifikation: ist für den Sucheinstieg gedacht. Von daher sollte die Klasse möglichst generisch sein.  
    • Objekttyp / -Bezeichnung: sollte so spezifisch wie möglich angegeben werden.
  • FS: Im AAT  
  • UM: Wäre denn eine mögliche Formulierung hier: "Alle Ressourcen werden nach zumindest einem der folgendenden Systeme kategorisiert:
    (1) DDC gemäß Sachgruppen der Deutschen Nationalbibliografie [Anmerkung FS: Die (24?) DNB-Sachgruppen unterscheiden sich aber von den DDC-Klassen. Sowohl die DDC-Notation als auch die der DNB-Systematik sind im GND-Datensatz ausgewiesen]
    (2) Objektbezeichnung des AAT
    ..."
  • FS: Ich bin nicht dafür Klassifikationssysteme verpflichtend vorzugeben, sondern solche, die anerkannt / weit verbreitet sind und Qualitätskriterien (standardkonform, für LD nachnutzbar) entsprechen, wie die oben aufgelisteten, zu empfehlen. In der Praxis ist es so, dass unterschiedliche Verfahren zur Klassifizierung verwendet werden, die sich je nach Sparte und Fachbereich stark unterscheiden. Bei Sachgebieten wie Biologie oder Musikinstrumente würden wir ggfs. fachspezifische Begriffe verlieren. Von daher geht es m.E. eher in die Richtung, die AV vorschlägt, in solchen Fällen ein Begriffsmapping (Konkordanz) zu den empfohlenen Klassifikationen herzustellen.
  • FS: Sollte IconClass auch aufgenommen werden?

    Autor/‑innennamen werden mit Normdaten verknüpft.

    • Z. B. sollte eine Verknüpfung zur Gemeinsamen Normdatei[1] (GND) und zu ORCID[2] angeboten werden, um die Autor/‑innenidentifikation zu erleichtern.
    [1] Siehe dnbde/gnd 
    Nr. M/EKriteriumQuelle/Herkunft Erläuterung
      Verwendung von kontrollierten Werten in den Metadaten  
      Folgende administrative Angabe zum Metadatensatz erfordert die Verwendung eines kontrollierten Vokabulars: 
     
    • Die strukturelle Ebene der Beschreibung, die auf einem Kultur- und Wissensobjekt basiert und in einem Metadatensatz repräsentiert ist, wird durch einen kontrollierten Wert spezifiziert (->Strukturtyp).
     

    Die Angabe des Strukturtyps kann je nach Kultur- und Wissenseinrichtung und der Spezifikation im Anwendungsprofil unterschiedlich granular erfolgen. Anhand des kontrollierten Werts sollte zumindest erkennbar sein, ob es sich um die Beschreibung eines einzelnen Objekts, einer Gruppe von Objekten oder eines Bestandteils eines Objekts handelt. Für die Beschreibung digitalisierter Drucke ist die Anwendung der Werte aus dem DFG-Viewer Strukturdatenset verpflichtend.

      Die Beschreibung der Kultur- und Wissensobjekte erfordert in den folgenden Bereichen die Verwendung kontrollierter Werte:   
     M
    • Die Art des Kultur- und Wissensobjekts wird durch kontrollierte Werte spezifiziert (->Objekttyp).
     

     

     
    • Der Wert für die Spezifizierung des Kultur- und Wissensobjekts muss einem kontrollierten Vokabular entstammen, das den 5-star Open Data Prinzipien von Tim Berners-Lee entspricht.
     

    Der Wert muss einem kontrollierten Vokabular entnommen werden, das den 5-Star Open Data Prinzipien von Timm Berners Lee entspricht:

    • Das Vokabular ist unter einer freien Lizenz im Web publiziert
    • Das Vokabular ist strukturiert
    • Das Vokabular ist in einem nicht-proprietären Format publiziert
    • Jeder Begriff im Vokabular ist durch einen URI global eindeutig identifiziert
    • Es existieren Links zu Begriffen aus anderen Vokabularen oder/und zu Quellen

    Welches Vokabular zu Grunde gelegt wird, ist je nach Sparte und Spezifikation im Anwendungsprofil unterschiedlich. Für Objekte aus der Kunst- und Kulturdomäne wird bspw. der AAT empfohlen.

     M
    • Ortsangaben werden durch kontrollierte Werte identifiziert
     z. B.: TGN, Geonames, GND
     
    • die Art der Ereignisse im Lebenszyklus einer Ressource wird durch kontrollierte Werte spezifiziert
     z. B.: LIDO-Eventtype  
     
    • die Sprache des Inhalts eines Kultur- und Wissensobjekts wird durch kontrollierte Werte spezifiziert  
     z.B.: ISO 639-2
      Für die Erhöhung der Datenqualität und des Vernetzungsgrades der Kultur- und Wissensobjekte innerhalb von digitalen Sammlungen gelten folgende Empfehlungen für kontrollierte Vokabulare:  
     
    • Die Art der Objekte wird durch einen Gruppierungsterm aus der Objektfacette des Art & Architecture Thesaurus spezifiziert (-> Klassifikation <Art des Objekts>).
     

     

       
     E
    • Themen, die im Rahmen eines Kultur- und Wissensobjekts behandelt werden, werden aus kontrollierten Vokabularen übernommen
     z. B.: GND, Iconclass, CONA 
     E
    • Zeiträume, Epochen, Kulturen, die für die Beschreibung einer Ressource relevant sind, werden aus kontrollierten Vokabularen übernommen
     z. B.: GND, eHRAF 
     E
    • Personen und Institutionen, die in einer Beziehung zu der Ressource stehen (z. B. als Ersteller, Sammler oder Bearbeiter) werden durch Normdaten identifiziert
     z. B.: GND, ULAN, ISIL 
     E
    • Sammlungen werden durch Normdaten identifiziert
     z. B.: ISCI 
      Dokumentation der verwendeten kontrollierten Vokabulare  
     MDie in den Metadaten berücksichtigten kontrollierten Vokabulare und Normdateien werden im Anwendungsprofil genannt  
     MDie in den Metadaten berücksichtigten kontrollierten Vokabulare werden in den Metadatendaten identifiziert  
      
    • Der in den Metadaten verwendete Term wird in den Metadaten durch einen URI eindeutig identifiziert
     

    z. B. http://d-nb.info/gnd/131724126

    z. B

     Text DINI-Zertifikat 2013Bemerkungen 
    E.1-1AV, 20150608:

    Es gibt nicht nur Dokumente :-)

    UM, 20150622:
    Ja, der Begriff stammt aus dem DINI-Zertifikat (auch dort wurde er der Einfachheit halber so verwendet, soll aber auf andere Objektarten übertragen werden); wir brauchen hier sicherlich einen generischeren Begriff.

    zusätzlich: AAT (Info: http://en.wikipedia.org/wiki/Art_%26_Architecture_Thesaurus)

    Museen verwenden größtenteils eigene Vokabulare. Diese sollten immer auf die GND oder den AAT gemappt werden.

     M.6-3  Alle Dokumente werden nach der → Dewey-Dezimalklassifikation (DDC) zumindest gemäß den → Sachgruppen der Deutschen Nationalbibliografie klassifiziert.  M.6-4 
    Allen Dokumenten sind Dokument- bzw. Publikationstypen aus dem Vokabular der DINI-Empfehlungen Gemeinsames Vokabular für Publikations- und Dokumenttypen zugeordnet.
  • Strukturdatenset des DFG-Viewers nachnutzen?
  • unterschiedliche Aspekte:
    1. formaler Medientyp: z.B. Text, Bild, Audio, Video
    2. qualifizierter Objekttyp: z.B. Zeitschrift, Monografie, Handschrift, Karten, Noten, ...
    3. Strukturtyp (zumeist abhängig vom Objekttyp): z.B. Artikel, Band, Ausgabe, Kapitel,
      offene Frage: gibt es immer eine eindeutige Zuordnung von Strukturtyp zum Objekttyp?
  • TODO: Aufstellung der unterschiedlichen Vokabulare 
  • für 1. DCMI Type Vocabulary, (ggfs. auch CIDOC-CRM)
  • für 2. AAT (Bsp

    . http://vocab.getty.edu/aat/300041365

      oder  
      
    • Das Vokabular / die Normdatei, zu der ein Term gehört, wird durch einen URI eindeutig identifiziert
     z. B) , GND (Bsp. http://d-nb.info/gnd/4048166-9) 
  • für 3. Strukturdatenset des DFG-Viewers
  • im Kontext der LIDO-Terminologie wird gerade ein Vokabular entwickelt, was eher in Richtung Strukturtyp gehen wird (aber noch nicht abschließend geklärt)
  •  
      oder  
      
    • Das Vokabular / die Normdatei, zu der ein Term gehört, wird durch eine Namen identifiziert
     z. B. GND
     MDas Vokabular / die Normdatei, aus der Terme verwendet werden, ist in menschenlesbarer Form im Web frei zugänglich E.6-7z. B. http://www.getty.

    AV, 20150608:
    warum nur Autor/-innen?

    UM, 20150622:
    Auch hier: Die Formulierung stammt aus dem DINI-Zertifikat.
    --> Sinnvoll für digitale Sammlungen sicherlich: Personen in jedweder Rolle zum beschriebenen Objekt (Beteiligte, Thematisierte)
    --> sowie auch andere Entititätentypen (Einrichtungen, Orte, Werke ...)
    --> die Frage ist hier sicher u.a., was man verpflichtend machen möchte und was nur empfehlend ...

    weitere Möglichkeiten: ULAN, VIAF, ...

    edu/research/tools/vocabularies/ 
     M

    Jeder Term in dem kontrollierten Vokabular / der Normdatei wird durch einen eindeutigen Identifier identifiziert

     z. B. http://d-nb.info/gnd/131724126, oder 131724126
     

    Das Vokabular / die Normdatei, aus der Terme verwendet werden, ist in maschinenlesbarer Form im Web frei zugänglich

     z. B. http://vocab.getty.edu/queries