Blog-Eintrag

Bericht von dem zweiten Treffen des projektübergreifenden Arbeitskreises der nicht-bibliothekarischen Agenturen

Faschingsdienstag in Frankfurt, während viele Menschen Richtung zum "Klaa Paris - Helau" Umzug in den Frankfurter Nordwesten strebten, bahnte sich eine kleine Gruppe Unentwegter ihren Weg an die Deutsche Nationalbibliothek. Sie folgten einer Einladung der Arbeitsstelle für Standardisierung. Insgesamt präsentierten sich ein Dutzend neuer Gruppierungen und Initiativen, denen allen gemeinsam ist, dass sie die Gemeinsame Normdatei bunter, reicher, vielfältiger, offener bei hoher Qualität machen wollen. Sie nutzen dafür die Infrastrukturangebote, wie GND-Agenturen, Fachredaktionen, Interessengruppen und Arbeitsgruppen des Standardisierungsausschusses, die die GND-Kooperative oft initiiert durch das DFG-Projekt GND4C in den letzten Jahren entwickelt hat. Manche der Initiativen sind noch in der Findung, andere in der Gründung oder im Pilotbetrieb. Bisher ergänzt nur die GND-Agentur LEO-BW-Regional im Dauerbetrieb für Kulturgut bewahrende Einrichtungen in Baden-Württemberg das Angebot der schon lange in den Verbundzentralen tätigen Agenturen für Bibliotheken.

Markieren wir die existenten Initiativen, die bei dem zweiten Treffen der Agenturen vor Ort dabei waren, mit einem (Haken):

Sie stellten sich mit einem Poster auf dem Treffen vor. Die Galerie wurde ergänzt durch Poster zu unterschiedlichen Services, wie entityXML oder die GND4C Toolbox, und Infografiken der GND-Zentrale zu Themen wie Datenimport, Organisationsstruktur und GND-Dokumentation. Alle Poster sind in der untenstehenden Galerie aufgenommen. Durch Klicken auf eine Abbildung kann man deren Ansicht vergrößern.

Nach einer Begrüßung durch den Generaldirektor der Deutschen Nationalbibliothek, Frank Scholze, und den "dienstältesten" der so genannten "neuen" Agenturen, Patrick Leiske vom Landesarchiv Baden-Württemberg, hatten die Teilnehmenden Zeit, sich auf das folgende Speeddating vorzubereiten. Die ausgestellten Poster entlang der Fensterfront boten viel Information zu den anwesenden Partnern und damit Anknüpfungspunkte für Ideen zur Zusammenarbeit, Entdeckung gemeinsamer Anliegen und Lücken. Ein Ziel der Veranstaltung war die Stärkung des Netzwerkes der Einrichtungen, aber vor allem der Menschen untereinander.

Wir sind an Ihrem Feedback zu den Postern interessiert. Schreiben Sie uns Ihre Gedanken oder Fragen.

Das Poster führt aus, was mit den unterschiedlichen Phasen auf dem Weg einer GND-Agentur in den Dauerbetrieb gemeint ist.
Credit: Chantal Köppl (DNB), CC BY-SA 4.0 Jan 2024

Gut vernetzt! Ein Klebebild der Relationen.
Credit: Stefan Buddenbohm (SUB), CC BY-SA 4.0 Feb 2024
Die Poster zum Projektübergreifenden Agenturentreffen #2

Die Poster sind lizenziert unter einer Creative Commons Lizenz CC BY SA.

Nach zwei turbulenten Speedating-Runden, die allen Gelegenheit boten, sich intensiv miteinander auszutauschen, etlichen Kannen Kaffee und zum Ende des Nachmittags, kam die Zeit der Ernte. Was hat das Treffen gebracht? Was wurde neben den bilateral geknüpften Beziehungen für die Gruppe als Ganzes erreicht? Welche Themen wollen wir in den kommenden Treffen des Arbeitskreises vertiefen? Und auf welche Lücken der Betrachtung sind wir gestoßen? Antworten wurden auf den unten abgebildeten Metaplanwänden gesammelt.

Die wichtigsten Ergebnisse waren:

  • die im Projekt GND4C entstandene Gesprächsrunde "A-Team" öffnet sich konsequent für alle neuen Agentur- und Redaktionsinitiativen. Bestimmt erinnern sich noch viele an die gleichlautende Fernsehserie aus den Achtzigern. Wie Patrick Leiske es in seiner Begrüßung erklärte, so verdankte sich der Erfolg des A-Teams im Fernsehen dem Zusammenspiel der im Team verankerten unterschiedlichen Talente. Das Prinzip passt wunderbar, bei aller Diversität der Perspektiven, auch auf die Gesprächsrunde der Agenturen. Eine entsprechende Seite für die Terminfindung und Themensetzung wird im Wiki eingestellt.
  • Da viele Einrichtungen, die über die neuen Agenturen Daten in die GND einbringen wollen, das Datenschema LIDO verwenden, ist es sehr zu begrüßen, dass Julia Rössel (DDK) und Uwe Sikora (SUB) die Anwendung entityXML für LIDO ausbauen wollen.
  • Wo immer es möglich ist, möchte man entsprechende Schulungsangebote zur GND-Anwendung für Dritte aus dem Kreis öffnen. Kursangebote und freie Plätze können künftig im Wiki bekannt gemacht werden.
  • Die Optionen für eine aktuelle und nachhaltige Beacon-Registry, die die Verknüpfungen von Daten einzelner Sammlungen mit der GND ausweist, sollen geprüft werden.

Für die kommenden Treffen haben wir drei zentrale Themen identifiziert, die wir gemeinsam intensiver diskutieren wollen:

  • das Verhältnis von Agentur und Redaktion als Organisationseinheiten. Welche Form eignet sich wofür?
  • das Thema Schulung einserseits aus der Perspektive der Didaktik betrachtet (Erfahrungsaustausch) und andererseits thematisch zur GND-Dokumentation und Nutzung der Services wie entityXML oder der GND4C Toolbox
  • Mengengerüst für den Bedarf an neuen GND-Datensätzen, ein Erfahrungsaustausch zu Nachfrage, Qualität und Umsetzung

Irgendetwas fehlt immer! In der Öffnung der GND ist noch vieles offen:

  • Die Satzarten "Personen" und "Geografika" gehen schon ganz gut, aber andere Satzarten wie "Werke" und "Sachbegriffe" sind noch kaum eingeübt. Hier ist auch die STA-Community gefragt. Eine Möglichkeit für den integrativen Umgang mit Sachbegriffen könnte die Einrichtung einer AG Terminologie sein.
  • Aufbau eines Netzwerks innerhalb der GND-Kooperative für Schulungen und Wissensvermittlung gemeinsam mit den etablierten Agenturen in den Verbundzentralen.
  • Bislang beschränken sich die Initiativen auf Deutschland. Was tut sich in Österreich und der Schweiz hinsichtlich der Öffnung der GND? Das sollten wir eruieren.

Welche der genannten Themen würden Sie als Leser*in gern vertiefen?

Wie geht es weiter? Impulse aus den Speeddating Runden auf der Leinwand.
Credit: Chantal Köppl (DNB), CC BY-SA 4.0 Feb 2024
Ergebnisse, Themen und Bedarfe gesammelt auf dem Projektübergreifenden Agenturentreffen #2

Die Poster sind lizenziert unter einer Creative Commons Lizenz CC BY SA.

Insgesamt ein voller Tag in guter Atmosphäre, der Lust auf mehr macht. Im Herbst soll das dritte Treffen des projektübergreifenden Arbeitskreises der nicht-bibliothekarischen Agenturen stattfinden. Vielleicht auch eine gute Gelegenheit sich einen griffigeren Namen zu geben. Wenn Sie mit dabei sein wollen, dann schreiben Sie uns eine Email an gnd-info (at) dnb.de.

Impressionen vom Projektübergreifenden Agenturentreffen #2

Die Poster sind lizenziert unter einer Creative Commons Lizenz CC BY SA.

Vom Suchen und Finden

Literatur und Daten mit kontrolliertem Vokabular finden

Wir wissen nicht, welche Vorschläge Ihnen die Künstliche Intelligenz (KI) Ihres Vertrauens unterbreitet, wenn Sie Hilfestellung bei der Lösung einer Forschungsaufgabe brauchen. Vielleicht lassen Sie sich gleich einen entsprechenden Text schreiben, mit oder ohne Literaturangaben. Letztere sind womöglich einfach nur plausibel klingend, ohne tatsächlich zutreffend zu sein. Vielleicht googeln Sie und bedienen sich unter den ersten zehn Suchergebnissen. Vielleicht gehen Sie auch in die nächstgelegene Bibliothek oder besuchen deren Online-Kataloge im Netz. Wir möchten Sie heute auf eine kurze Anleitung zur Daten- und Literaturrecherche mit kontrolliertem Vokabular hinweisen, die von echten Bibliotheksmenschen geschrieben wurde, und allen ab sofort kostenfrei zu Verfügung steht. 

Der Text erklärt, wie man mittels der Verwendung von Normdaten seine Suchergebnisse nach Literatur und Daten verbessern kann. Dazu wird detailliert erläutert, was Normdaten sind und welche Funktion sie bei der Beschreibung von Objekten wie Publikationen, Forschungsdaten oder Sammlungsgut haben. Im Fokus stehen dabei die Normdaten der Gemeinsamen Normdatei (GND), das zentrale kontrollierte Vokabular für Kultur und Forschung im deutschsprachigen Raum. Im Text werden dann verschiedene Anwendungen vorgestellt, mit denen man in der GND passende Suchbegriffe beispielsweise für die Suche nach geeigneter Literatur zum eigenen Thema findet. Zugleich erfährt man, wie man seine eigenen Texte und Daten durch die Verwendung von Normdaten für Dritte leichter auffindbar und damit sichtbarer machen kann.

Lassen Sie uns wissen, ob und wie sich Ihre Suchergebnisse mit der Gemeinsamen Normdatei verbessert haben. Und wer weiß, möglicherweise hilft kontrolliertes Vokabular ja auch beim Prompt Engineering.

Vom Suchen und Finden. Eine Einführung in die Recherche mit der Gemeinsamen Normdatei.

Vom Suchen und Finden im Netz

Credit: Digital Transformation by Dominic Smith via Flickr CC BY

Ein Blogpost von Susanne Al-Eryani, Chantal Köppl, Patrick Leiske, Jens Lill, Verena Mack, Michael Markert, Julia Rössel, Stefanie Rühle und Uwe Sikora.

GND-Agenturen unterstützen ihre Kund*innen dabei, Daten in die Gemeinsame Normdatei einzubringen.

Auf dem Weg dorthin werden die Daten transformiert, bereinigt, angereichert und in das notwendige Format gebracht. Dafür stehen den Datengebenden und Agenturen verschiedene Werkzeuge zur Verfügung. Abhängig von der Beschaffenheit und Qualität der gelieferten Daten und von der Arbeitsweise der jeweiligen Agentur, kommen ein oder mehrere Tools zum Einsatz.

Welche Funktionen die verschiedenen Tools haben und wie sie von den Agenturen zur Datenprozessierung genutzt werden, lesen Sie in diesem Blogpost

Dazu muss zunächst erwähnt werden, dass sich der nicht unerhebliche Aufwand für eine maschinelle Datenprozessierung erst ab einem gewissen Datenumfang lohnt und es ebenfalls einer gewissen Datenqualität bedarf. Im Vorfeld ist daher anhand einer ersten Datenanalyse zwischen Agentur und Datenlieferanten abzuklären, welche Datenfelder noch aufzubereiten oder um weitere Informationen zu ergänzen sind – auch um den Mindestanforderungen an identifizierenden Merkmalen zu entsprechen, die je nach Entität für einen möglichen GND-Import vorausgesetzt werden. Die Verantwortung für die Auftrennung von z.B. in Fließtexten enthaltenen biografischen Angaben zu Personen in entsprechende Datenfelder für Berufe, Geografika oder Datumsangaben sieht die Agentur auf Seiten der Datenlieferanten. Aus einer Datenlieferung muss auch klar hervorgehen, ob es sich bei einer Ortsangabe um den Geburts-, Sterbe- oder Wirkungsort einer Person handelt (Ähnliches gilt für Datumsangaben). Die GND-Agentur gibt in Form von Schulungen/Workshops Hilfestellung zur Datenaufbereitung und ­bereinigung – die Interpretation von Daten aufgrund nicht vorhandener Datenstrukturen obliegt ihr allerdings nicht. Dies liegt alleinig in der Verantwortung der Datenlieferanten.



Credit: Chantal Köppl (DNB), CC BY-SA 4.0 Jan 2024

Bereinigen, Abgleichen und Anreichern – das bieten die verschiedenen Tools


GND4C-Toolbox

Die GND4C-Toolbox ist ein Werkzeug zum differenzierten und zuverlässigen Matching von Datensätzen auf die GND im großen Stil. Im Hintergrund wird die GND-Schnittstelle von lobid.org eingesetzt, die auch die GND-Abgleiche in OpenRefine ermöglicht. In der Toolbox werden für Personen Abfragen mit verschiedenen Kombinationen von Namensbestandteilen durchgeführt, um das Trefferbild zu verbreitern. Anschließend werden bei der Bewertung der Suchergebnisse auch die von den Datengebenden mitgelieferten Informationen berücksichtigt. Während in OpenRefine eine GND-Suche im Regelfall die ersten 10 Treffer nach Namensähnlichkeit zurückgibt, bewertet die Toolbox bei Personen mit vielen Vor- und Nachnamen manchmal Hunderte von GND-Datensätzen und gewichtet sie unter Einbezug von Lebensdaten, Orten und Berufsangaben. Im Falle von Bauwerken werden auch OpenStreetMap und Wikidata befragt, um über Quervergleiche etwa anhand von Adressdaten oder Koordinaten zuverlässiger entscheiden zu können, ob etwa mit der "Stadtkirche Neustadt" in einem Datenset jene in Holstein oder in Brandenburg gemeint ist.
Gedacht ist die Toolbox als eine pythonbasierte Serveranwendung nicht für individuelle Recherchen etwa bei der Anlage von neuen Datensätzen in einem Erfassungssystem, sondern für Massenverarbeitungen von Daten – wenn es darum geht, Hunderte oder gar Tausende von Datensätzen auf einmal abzugleichen. Sie richtet sich entsprechend nicht an Anwender:innen in einzelnen GLAM-Einrichtungen, sondern an die neuen GND-Agenturen mit ihrem Bedarf für schnelle und zuverlässige Bewertungen von großen Datenmengen in Hinblick auf vorhandene GND-Identifier und Kandidaten für Neuanlagen in der GND.



Personen-Matching in der Toolbox. Es wurden Dubletten in der GND gefunden.
Credit: Michael Markert (ThULB), CC 0, Jan 2024

OpenRefine

OpenRefine, ehemals bekannt als Google Refine, ist eine Open-Source-Software zur Datenaufbereitung und -bereinigung. Es ermöglicht Benutzer:innen, große Mengen von unstrukturierten Daten in tabellarischer Form zu importieren, zu erkunden, zu transformieren und zu bereinigen. OpenRefine wurde entwickelt, um den Datenbereinigungsprozess zu vereinfachen und die Qualität von Datensätzen zu verbessern. OpenRefine kann auf verschiedenen Betriebssystemen ausgeführt werden, einschließlich Windows, macOS und Linux. Es wird über einen Webbrowser bedient, daher wird empfohlen, einen modernen und aktuellen Browser zu verwenden. Unterstützte Browser sind Chrome, Firefox und Safari. Die Bearbeitung der Daten erfolgt jedoch lokal, weshalb nicht zwingend eine Internetverbindung vorhanden sein muss. Für den Datenaustausch besonders relevante Funktionen sind etwa der Import von Daten aus verschiedenen Quellen wie CSV-Dateien, Excel-Tabellen oder JSON, Datenexploration um Muster, Fehler oder Inkonsistenzen in Quelldaten zu identifizieren und nicht zuletzt Transformation und Bereinigung: Mit einer Vielzahl von eingebauten Transformationen können Benutzer Daten manipulieren, kombinieren und bereinigen, um konsistente Datensätze zu erhalten. Zudem können die Daten in OpenRefine über Schnittstellen mit der GND und anderen Normdateien gematcht, abgeglichen und angereichert werden. Bereinigte und transformierte Daten können in verschiedenen Formaten, wie z.B. Marc21 exportiert werden, um sie in anderen Systemen zu verwenden.



GND-Abgleich für Personen in OpenRefine


entityXML

EntityXML ist ein XML-basiertes Datenformat zur Beschreibung von Entitäten. Voraussetzung für das Arbeiten mit entityXML ist eine oXygen-Umgebung. Der oXygen XML Editor bietet u.a. den Vorteil, dass Einträge auch in einem nutzerfreundlichen Author-Modus ediert werden können.
In dem auf der GND-Ontologie basierenden entityXML-Schema können Projekte Entitäten unter Berücksichtigung ihrer spezifischen Charakteristika in einer einheitlichen Struktur beschreiben, was der Agentur ein direktes Mapping auf die Datenstruktur der GND ermöglicht. Darüber hinaus können über individuelle Namensräume projektrelevante Elemente außerhalb des Schemas erschlossen werden, die nicht für den Datenimport in die GND gedacht sind. Eine Überprüfung der Datenqualität ist durch das in entityXML implementierte Validierungsschema Relax NG und dem darin enthaltenen Schematron für Projekt und Agentur gleichermaßen durchführbar. Weiterhin lassen sich mit Hilfe bereitgestellter generischer Transformationsszenarien in entityXML angelegte Daten in andere relevante Datenformate (z. B. JSON) übersetzen. Anhand einer Revisionsbeschreibung werden die einzelnen Schritte des Workflows dokumentiert, Anmerkungen zu den Daten können an direkter Stelle notiert werden, sodass sowohl Kommunikation zwischen Datenlieferant und Agentur als auch das Berichtswesen unterstützt werden. Eine Versionierung der Daten ist möglich.
Mit entityXML können zunächst Personen beschrieben werden, das Format wird aber sukzessive für die Beschreibung weiterer Entitäten ausgebaut.


Beispielset für die Auszeichnung einer Person in entityXML (im Text- und Autor-Modus).


Data Preparation Tool

Das Data Preparation Tool (DPT) ist ein Mappingwerkzeug zur Aufbereitung von (bislang vornehmlich) archivischen Metadaten für die Einspielung in die Portale DDB, Archivportal-D, Archivportal Europa und LEO-BW. Entwickelt wurde das Tool in der DDB-Fachstelle Archiv mit dem primären Ziel, die Erstellung granularer providerspezifischer Anpassungen zu ermöglichen, um einmal umgesetzte Anpassungen für weitere Datengeber nachnutzen zu können.

Es handelt sich beim DPT um eine Python-basierte Desktop-Anwendung, die es ermöglicht, Daten aus beliebigen Quellformaten mit einem Workflow aus aneinander gereihten Python-Modulen zu transformieren. Die Verwendung von Python ermöglicht es etwa, auch Quelldaten aus Excel-Dateien und anderen Datenquellen mit einzubeziehen, sowie Feldinhalte aus verschiedenen Quelldateien gleichzeitig anzureichern.

Kern der XML-Transformation ist die Python-Bibliothek lxml, welche eine fehlertolerante und äußerst performante Verarbeitung der Lieferdaten erlaubt und dabei nur geringe Anforderungen an das Host-System stellt. Neben dem erwähnten Providerskript-Workflow bietet das Tool einige "Maintenance-Funktionen", mit dem Ziel, aus möglicherweise fehlerhaften Lieferdaten möglichst schnell einen sauberen ersten Stand zu erhalten, auf dessen Basis dann der Workflow angewandt werden kann.

Im Rahmen des GND4C-Projekts wurde das DPT um eine MARC-XML-Konkordanz für Personen ergänzt, um Datenlieferungen an die DNB für einen GND-Import übergeben zu können. Diese Erweiterung beinhaltet auch die freie Konfiguration einzelner (GND-interner) Datenfelder, die für einen Import vorausgesetzt werden, in der Regel aber nicht in den Ausgangsdaten der Kultureinrichtungen enthalten sind. In der GND-Agentur LEO-BW-Regional ist das DPT fester Bestandteil der Datenprozessierung.

Die aktuellste, für das GND4C-MARC-XML-Mapping angepasste Version des DPT kann hier heruntergeladen werden:
https://github.com/Deutsche-Digitale-Bibliothek/ddblabs-datapreparationtool/releases/tag/v3.5.0-pre6 (letztes Update: 24.07.2023).

Das DPT wird derzeit zu einer webbasierten Anwendung weiterentwickelt, die die gemeinsame Arbeit an Datenlieferungen an zentraler Stelle ermöglicht. Eine erste Version mit Fokus auf die Anforderungen von archivischen Datenlieferungen wird voraussichtlich bis Ende 2024 in Betrieb genommen.


Einblick in das Data Preparation Tool (DPT)

GND-Webformular

Das GND-Webformular bietet sich für Forschungsprojekte und Kulturinstitutionen an, wie etwa für kleinere Bibliotheken, Archive und Museen. Es ermöglicht ihnen, Personen- und Körperschaftsdatensätze in der GND neu anzulegen sowie bestehende Datensätze zu korrigieren oder zu ergänzen. In den nächsten Monaten wird auch die Erfassung von Gebietskörperschaften über das Webformular möglich sein. Die Nutzung des Webformulars kann sinnvoll sein, wenn man eine kleinere Menge von Normdaten ansetzen oder bearbeiten will. Außerdem bietet es sich beispielsweise begleitend zu Projekten an, in denen laufend Daten erfasst werden und auch neue Normdaten-Kandidaten identifiziert werden. Im Gegensatz zu den Erfassungsclients, die in Bibliotheken zum Einsatz kommen, können Personen und Körperschaften über das Webformular nur mit einer begrenzten Auswahl von Eigenschaften erfasst werden.

Sind die Daten über das Webformular eingegeben, landen sie unmittelbar in der GND. Für die Anwender*innen des Webformulars besteht daher ein großer Vorteil des Tools darin, dass sie die generierte GND-ID direkt im eigenen System einfügen können.

Um das Webformular nutzen zu können, braucht man zum Einen eine Vereinbarung mit einer GND-Agentur, die die eingegebenen Daten prüft und langfristig ihre Qualität sicherstellt. Zum Anderen benötigt man einen ISIL. Der International Standard Identifier for Libraries and Related Organizations ist Bestandteil des QS-Systems der GND, mit dem die Herkunft eines Datensatzes deklariert und nachvollziehbar wird. Einrichtungen können ihn bei der ISIL-Sigelstelle an der Staatsbibliothek zu Berlin beantragen. Weitere Infos zum Webformular finden Sie unter https://www.dnb.de/gndwebformular.



Erfassungsmaske des GND-Webformulars zur Bearbeitung von Personennormdaten in der GND.

So kommen die Tools in den neuen GND-Agenturen zum Einsatz


Die Datenprozessierung der GND-Agentur LEO-BW-Regional. Credit: Jens M. Lill (BSZ), CC BY SA

GND-Agentur LEO-BW-Regional

Im Fokus der GND-Agentur LEO-BW-Regional steht der Ansatz, Kultureinrichtungen aus Baden-Württemberg eine einfache, niedrigschwellige Möglichkeit anzubieten, wie diese ihre benötigten Datensätze unkompliziert und ohne allzu großen Aufwand in die GND einbringen und auch unmittelbar nachnutzen können. Dreh- und Angelpunkt der Agenturservices stellen daher die GND-Webformulare der DNB dar, für die regelmäßig Schulungen angeboten werden. Als Agentur unterstützen wir die Kultureinrichtungen bei der Klärung der Zugangsvoraussetzungen und Kommunikation mit der GND-Zentrale und übernehmen die Redaktion und Qualitätssicherung der neu eingetragenen oder bearbeiteten Normdatensätze. Auch für OpenRefine werden Workshops und Selbstlernkurse angeboten, um Kultureinrichtungen in die Lage zu versetzen, ihre Bestands-/Sammlungsdaten selbst analysieren, bereinigen und verbessern zu können.

OpenRefine kommt auch eine besondere Stellung innerhalb der Agenturarbeit an größeren Datensets (bislang nur für Personen) zu, um diese für einen GND-Import aufzuarbeiten. In verschiedenen Arbeitsschritten werden die Personendaten analysiert und bereinigt (u.a. Vereinheitlichung von offensichtlichen Schreibfehlern, geschlechtsspezifische Anpassung von Berufsangaben, Bereinigung von Datumsangaben in ein einheitliches Format) sowie mit der GND abgeglichen und ggf. um weitere Angaben ergänzt (für einen späteren Import in die GND müssen v.a. für Berufs- und Ortsangaben die äquivalenten GND-Nummern nachgeladen werden). Nach diesem Pre-processing werden die Datensets mittels Python-Skripten in ein GND4C-internes Datenformat transformiert, um im Data Preparation Tool die Ergänzung von für einen GND-Import relevanten Datenfelder automatisiert vornehmen zu können. Abschließend erfolgt die Ausgabe des Datensets im MARC-XML-Format zur Übergabe an die GND-Zentrale.





Exemplarischer Datenfluss zwischen Datengebenden, GND-Agentur und GND-Zentrale. Credit: Chantal Köppl (DNB), CC BY SA

Deutsches Dokumentationszentrum – Bildarchiv Foto Marburg | Bauwerke-Redaktion

Institutionen wie Denkmalfachämter, bauhistorische Forschungs- bzw. Publikationsprojekte, wie etwa Dehio digital (DDK 2022) oder auch das Bildarchiv Foto Marburg selbst produzieren Daten zu Bauwerken in sehr unterschiedlichen Datenbank- bzw. Erfassungssystemen. Zudem ist die Standardisierung im Bereich der Bauwerke noch nicht so weit fortgeschritten, wie z.B. in Museen oder Bibliotheken. Zunächst muss intellektuell geprüft werden, welche der Informationen, die in den Quellsystemen bzw. lokalen Erfassungsdatenbanken erhoben werden, für die künftigen Normdatensätze übernommen werden sollen. Für den beiderseitigen Austausch nutzt die Pilot-Agentur – gewissermaßen als Übersetzungshilfe – das Anwendungsprofil Bauwerke. Bauwerke werden in der GND als Geographika (Entitätencode GIB) geführt. Hierzu gehören Ingenieurbauten, bauliche Ensembles, archäologische Stätten mit Baudenkmälern, aber auch Bauskulpturen oder freistehende Objekte wie Monumentalplastik, Denkmäler oder Brunnen. Bislang gibt es kein Webformular, sodass die Erfassung für die GND händisch oder über Masseneinspielung geschieht. Um Bauwerks-Daten in Normdaten umzuwandeln und in die GND einspeisen zu können, werden sie in der Pilot-Agentur Bauwerke mit OpenRefine vorverarbeitet. Hier werden der Standort in Form einer Ortsangabe und der Objekttyp in der GND als instantieller Oberbegriff definiert,  mit GND-IDs schon vorhandener Entitäten gemachted, sofern diese vorhanden sind. In OpenRefine wird auch geprüft, ob sich das Bauwerk bereits in der GND befindet. Es findet also einen Abgleich mit bereits vorhandenen Datensätzen in der GND und gleichzeitig eine Anreicherung der Quelldaten statt. Darüber hinaus können folgende Angaben ebenfalls in den Normdatensatz zu einem ortsfesten Werk übernommen werden, sofern diese vorhanden sind: Alternativbenennung, Datierung, Orts-/Stadtteil, Beziehungen zu übergeordneten Bauwerken, Beziehungen zu Personen oder die Denkmalart entsprechend der denkmalpflegerischen Zuordnung (z.B. Kulturdenkmal, Einzeldenkmal, Flächendenkmal etc.). Nach dem Preprocesseing werden die Daten über ein Template im Format MARC21 exportiert, welches das Lieferformat für die GND darstellt.

GND-Agentur data4kulthura

data4kulthura befindet sich in der Aufbauphase, weshalb es noch keine festen Workflows oder erfolgreichen Großprojekte gibt. OpenRefine ist aber auch bei data4kulthura der Schlüssel zu  Datenbereinigung, -anreicherung und -weitergabe. In der Museumsbetreuung werden seit vielen Jahren damit Importe von Daten in die in Thüringen meistgenutzte Erfassungssoftware digiCULT.web vorbereitet. Mit OpenRefine kann man sehr schnell herausfinden, ob in Tausenden Tabellenzellen irgendwo aus Versehen als Objekttyp "Gemläde" statt "Gemälde" angegeben wurde und das für die Anwendung kontrollierter Vokabulare wie der Objektbezeichnungsdatei (OBG) korrigieren. Im Agenturbetrieb wird die Software etwa eingesetzt, um sich schnell einen Überblick über ein neues Datenset zu verschaffen, da praktisch jedes Format verarbeitet und in leicht interpretierbare Tabellen umgewandelt werden kann. Leicht lassen sich komplexere Aufgaben über Python-Skripte direkt in der Programmoberfläche automatisieren. Über die Reconciliation-Schnittstelle in OpenRefine lassen sich nicht nur neue Identifier etwa zu Ortsangaben oder Sachbegriffen schnell erzeugen, sondern auch leicht Zusatzinformationen aus der GND oder Wikidata nachholen, wenn entsprechende Identifier vorliegen. So kann geprüft werden, ob Identifier überhaupt korrekt oder Angaben im Quelldatensatz fehlerhaft sind.
Leider sind die Exportmöglichkeiten aus OpenRefine heraus recht eingeschränkt und es lässt sich nicht so ohne Weiteres das Format wieder erzeugen, das hineingegeben wurde. Hier müssen aufwändige Transformationen für den jeweiligen Einzelfall erstellt oder nachträglich angewendet werden. Eine Exportfunktion, die zweifellos in Zukunft weiter an Bedeutung gewinnen wird, ist die Einspielung in Wikibase-Instanzen wie Wikidata oder Factgrid über die eingebaute und sehr komfortable Wikibase-Erweiterung. Damit lassen sich die ohnehin in der Agenturarbeit verbesserten und angereicherten Daten schnell und einfach als Linked Open Data der GLAM-Community zugänglich machen. Auf diesem Wege wurden etwa schon Berufsangaben in Factgrid um GND-Identifier ergänzt und Thüringer Baudenkmale in Wikidata mit dem entsprechenden Denkmalschutzstatus markiert.

GND-Agentur Text+

EntityXML wurde im Rahmen der sich im Aufbau befindenden GND-Agentur Text+ entwickelt, um grundlegende Arbeitsprozesse zu unterstützen. Das Format dient im Wesentlichen text- und sprachbasierten Forschungsprojekten und der Agentur als Austausch- und Speicherformat für Daten, die als Normdaten in die GND eingebracht werden sollen bzw. die aufgrund von Forschungsergebnissen bereits in der GND verzeichnete Einträge ergänzen oder korrigieren sollen. Ziel der Agentur ist es, einen Workflow zu entwickeln, der eine halbautomatisierte Anreicherung von Daten mit GND-URIs und die Einspielung von Daten in die GND ermöglicht. In diesem Kontext wird eine auf entityXML aufbauende technische Umgebung entwickelt.
EntityXML ist ein Erschließungs- und Redaktionsformat. Projektspezifische Daten werden von den Projekten angelegt, gepflegt und eventuell in eigenen Systemen direkt genutzt. Die vom Projekt als GND-relevant identifizierten Daten zu Entitäten (Personen, Werken, Orten etc.) werden als Lieferungen mit der Agentur ausgetauscht.
Die Datenlieferungen werden von der Agentur in einem ersten Schritt durch in entityXML enthaltene Validierungsroutinen hinsichtlich formaler Qualitätsrichtlinien überprüft. Lieferungen, die schwerwiegende Verstöße gegen diese Richtlinien aufweisen, werden mit Anweisungen zum notwendigen Datencleaning an die liefernde Institution zurückgesendet. Qualitätskonforme Daten werden von der Agentur übernommen. Je nach Absprache mit dem Datenlieferanten werden die Daten durch die Agentur nachträglich bereinigt und harmonisiert.
Anschließend werden die Daten über ein in entityXML implementiertes Transformationsszenario in das JSON-Format der Toolbox konvertiert und dort mit der GND abgeglichen. Datensätze, die bereits in der GND enthalten sind, können über eine Konversion mit Daten aus der GND angereichert werden. Hierfür wird die LOBID-API genutzt. Die mit dem entsprechenden GND-URI und ggf. weiteren Daten aus der GND angereicherten Daten werden an das Projekt zurückgeliefert. Derzeit wird ein Verfahren entwickelt, wie Datensätze, die keine Entsprechung in der GND haben, wieder zurück in das entityXML-Format gespielt werden können.
Entitäten, die neu in die GND eingebracht werden sollen, werden anhand des in entityXML enthaltenen Validierungsschemas hinsichtlich ihrer Eignung und Relevanz geprüft. Das Ergebnis der Überprüfung wird dem Projekt mitgeteilt, sodass das Projekt unzulängliche Datensätze ggf. nach den geltenden Kriterien nachbessern kann.
Das bereinigte entityXML-Datenset, in dem nun die potentiellen GND-Kandidaten enthalten sind, wird schließlich durch XSLT in das GND-Lieferformat MARCXML konvertiert. Der aus Leader und entsprechenden Kontroll- und Datenfelder bestehende vollständige MARCXML-Datensatz wird von der Agentur an die Redaktion der GND zur Prüfung und Einspielung ins Testsystem versendet. Abschließend wird die mit den URIs der neu erstellten GND-Einträge angereicherte entityXML-Datenlieferung zusammen mit einem Bearbeitungs- und Einspielungsbericht an das Projekt zurückgeschickt.

Dokumentation
Autor: Johannes Renz, Landesarchiv Baden-Württemberg, Mitglied der Interessengruppe Archiv
Auszug aus dem Bericht

Am 24. November 2023 fand das 3. GND-Forum Archiv erneut in virtueller Form statt. Mit insgesamt 68 teilnehmendem Personen waren es zwar knapp die Hälfte weniger als bei der letzten Veranstaltung, daraus ergab sich aber eine angenehme Workshop-Atmosphäre. Nachdem im 2. GND-Forum der intensive Austausch unter den Teilnehmenden in mehreren Breakout-Sessions im Vordergrund stand, wurde dieses Mal bewusst das Format einer Informationsveranstaltung mit Impulsvortrag, Updates zu Entwicklungen in der GND-Kooperative, Rück- und Ausblick über die Arbeit der IG Archiv und ihrer im März 2023 konstituierten Arbeitsgruppen gewählt. Die Organisation des Forums übernahmen erneut Kolleginnen und Kollegen von der Arbeitsstelle für Standardisierung an der DNB, dem Hessischen Landesarchiv, der Genereldirektion der Staatlichen Archive Bayerns, dem Geheimen Staatsarchiv Preußischer Kulturbesitz, dem Bundesarchiv sowie dem Landesarchiv Baden-Württemberg mit der dort angesiedelten GND-Agentur LEO-BW-Regional. ...

... bitte diesem Link im STA-Community Wiki folgen, um den kompletten Text der Dokumentation mit den Folien der Vorträge zu lesen: https://wiki.dnb.de/x/oomVEg


Das Forum ist die zentrale öffentliche Plattform für alle Interessierten, die unter dem organisatorischen Dach der "Interessengruppe Archiv" im GND-Netzwerk an der Entwicklung teilhaben möchten. Die Teilnahme steht Vertreter*innen aller Archivsparten - und stets auch neuen Teilnehmer*innen - offen. Wir freuen uns, wenn das Angebot wieder auf Ihren Zuspruch stößt!

Mehr Information zum Dialogformat der GND Foren finden Sie hier.


Ein Fenster wie eine Einladung – das Historische Archiv der Stadt Köln am Heumarkt. © Raimond Spekking / CC BY-SA 4.0 (via Wikimedia Commons)


Leseempfehlung wie lange Winterabende

In der Zeitschrift des Arbeitskreises der Kunst- und Musikbibliotheken ist in der jüngsten Ausgabe ein Beitrag von Anna Bohn und Margret Schild zur Funktion der GND in der Vernetzung im GLAM Bereich erschienen. Ein Vorabdruck ist hier verlinkt.

Dokumentation der Ergebnisse des Arbeitskreistreffens GND Community Empowerment vom 30.11.2023

Autor:innen: Stefan Buddenbohm (SUB Göttingen) und Barbara Fischer (DNB, AfS)

Ende November kamen gut 20 Mitarbeiter:innen aus unterschiedlichen Projekten mit GND-Bezug, wie NFDI-Konsortien, GND4C und GND-Redaktionen, im Arbeitskreis GND Community Empowerment zu ihrem dritten Treffen online zusammen. Die Ergebnisse dokumentiert dieser Beitrag.

Wie im letzten Treffen am 20. Juni 2023 verabredet, diskutierten wir die Themen „Haben wir die Community im Blick?“ und „Brauchen wir ein Curriculum?“  und informierten uns über den Stand der STA-Dokumentationsplattform und die Öffnung der GND insgesamt.

Über die Soziologie der Standardisierung

Doch zunächst vermittelte uns Judith Hartstein vom Deutschen Zentrum für Hochschul- und Wissenschaftsforschung (DZHW) einen frischen Blick der Soziologie auf Standardisierungsprozesse in den Wissenschaften. Dabei ging es ihr jedoch nicht um die Einführung von Normdaten, sondern vielmehr um notwendige Prozesse der Standardisierung in der wissenschaftlichen Praxis, um das gegenseitige Verstehen zu gewährleisten. Diese Prozesse beziehen sich auf das gesamte Wissenschaftssystem. Sei es auf die Ausdifferenzierung von Disziplinen, dem Aufbau von Fachvokabularen oder der Entwicklung von Curricula für definierte Studienabschlüsse. Diese Standardisierungsprozesse sind einerseits notwendige Bedingung für die effiziente Zusammenarbeit, aber auch exkludierend,beispielsweise durch Bias in Informationsverarbeitungssystemen oder die ernüchterne Erkenntnis, dass die Setzung von Standards immer auch als ein mit Macht einhergehender Prozess gelesen werden kann. Die Vortragsfolien von Judith Hartstein sind hier verfügbar.

Abbildung 1: Aus dem Vortrag von Judith Hartstein, screenshot

Haben wir die Community im Blick?

Der Singular in der Frage führt eventuell in die Irre. Denn die eine Community gibt es nicht. Die Teilnehmer:innen betonten in der Diskussion, wie divers die GND-Zielgruppen seien. Schon vertraut ist die Einteilung nach denjenigen, die nur bereits vorliegende GND-Identifikatoren nutzen, um ihre eigene Datenqualität zu heben, indem sie die GND-IDs mit ihren Daten verknüpfen. Zum anderen diejenigen, die die GND-Regeln anwenden, um neue GND-Datensätze anzulegen, zu korrigieren oder zu ergänzen. Der Ansatz, sich vornehmlich auf diese zwei Perspektiven – einmal die GND „passiv“ Nutzenden und zum anderen die GND „aktiv“ Anwendenden – zu beschränken, greift möglicherweise zu kurz. Neben dieser gewissermaßen horizontalen Unterteilung, ist mit Blick auf die Schulungs- und Informationsmaterialien auch eine vertikale Strukturierung nach Wissens- und Kompetenzstand wichtig. Entlang der vertikalen Achse kann man sich vorstellen, wie die Schulungmaterialien aufeinander aufbauen. Die Bedarfe sowohl der Nutzer:innen als auch der Anwender:innen differieren nach ihrem jeweiligen Wissensstand in Bezug auf die GND, nach ihrem Anwendungsbereich, wie Forschung oder Kulturgutsammlungen, zum Teil splitten sie sich zudem nach den Fachdisziplinen weiter auf. Im Treffen brachte es Chantal Köppl (DNB) auf den Punkt, indem sie die GND-Gemeinschaft als eine “fuzzy Community” beschrieb.

Die Teilnehmer:innen betonten die Notwendigkeit, das Informationsmaterial je nach Zielgruppe anzupassen und auszuzeichnen. Insbesondere gelte die Angebotsdiversifizierung für solche, die selbst neue GND-Datensätze anlegen oder ergänzen wollen. Hier empfahl Verena Mack von der Agentur LEO BW Regional diejenigen im Blick zu haben, die nur „gelegentlich“ einen neuen GND-Datensatz anlegen wollen. Denn vermutlich ist die Anzahl dieser „Gelegenheitseditor:innen“ deutlich größer als die Zahl derjenigen, zu deren täglicher Arbeit die Redaktion von GND-Datensätzen gehört. Es müsse unser aller Anliegen sein, so der Konsens in der Gruppe, Voraussetzungen zu schaffen, damit auch "Gelegenheitseditor:innen" trotz fehlender Praxis regelkonforme Datensätze anlegen können und dies bei generell bestehendem Zeitmangel. Auf der Hand liegt, dass die “Gelegenheitseditor:innen” das Potenzial für zukünftige “Powereditor:innen” hätten. Ein Ziel des Community Buildings sollte es sein, die Editor:innen zu diesem “Sprung” zu motivieren und zu befähigen. Je nach Kontext und Zielsetzung sind hierfür manche Vermittlungsformen besser geeignet als andere. Wichtig sei es, Gesprächsanlässe zu schaffen, in denen Beziehungen zueinander wachsen können, die im nächsten Schritt die Basis für die weitere Zusammenarbeit sind. Der neudeutsche Begriff Community Building veranschaulicht diese so wichtige Arbeit, die auch eine Gratwanderung zwischen zu viel und zu wenig ist.

Treffen wie die GND-Foren bieten Gelegenheiten der Begegnung, die idealerweise über den individuellen thematischen Anlass hinausgehen. Ziel des Community Buildings sollte es sein, die Beteiligten zu gegenseitiger Unterstützung, konstruktiver Kritik und dem Mittun zu motivieren.

Abbildung 2: Die Streuung der GND-Communities, © Stefan Buddenbohm (SUB Göttingen), CC BY SA

Die Plattform zur Dokumentation der Regelwerke im Gebrauch der Mitglieder des Standardisierungsausschusses - aka die STA-Plattform

Die im Aufbau befindliche STA-Dokumentationsplattform könnte gerade auch für die gelegentlich in der GND-Edition Wirkenden das richtige Angebot sein. Der Projektleiter für den Aufbau der Plattform, Mathias Manecke (DNB), stellte sie und die anstehende Integration der GND-Dokumentation dem Arbeitskreis live in der Anwendung vor.

Indem die Fließtexte sowohl des Regelwerks RDA DACH, dessen Definitionen auch viele der Erfassungshilfen der GND bestimmen, als auch künftig die letztgenannten selbst in strukturierte Daten umgewandelt, in einer Wikibase-Instanz abgelegt und redigiert werden, wird der Zugang zu den Regeln vereinfacht. Zum einen entfällt der Beitritt zum Konsortiallizenz-Verbund, zum anderen können Elemente konzise aktualisiert und die Änderungen in allen Anwendungsfällen zeitgleich umgesetzt werden. Die Ausformungen können per Klick in unterschiedlichen Dateiformaten angezeigt werden. Für die Benutzer:innen wird aber besonders attraktiv sein, dass man künftig  in der Ansicht der Elemente für die Erfassung einer Entität zwischen der Standard-Anzeige, der Anzeige von zusätzlichen Element-Optionen und den unterschiedlichen Anwendungskontexten wechseln sowie facettieren kann. Jede Community kann so bei Bedarf ihre Sicht auf die Normdaten der GND ausbilden. In der Dokumentation des RDA DACH Standards ist dies zum Teil schon umgesetzt.

Der „Gelegenheitseditor“ kann künftig mit einem Klick sehen, welche Aussagen er mindestens zu einer Entität machen muss, um diese zuverlässig von einer anderen Entität disambiguieren zu können. Die oft als umständlich empfundenen Querverweise zwischen unterschiedlichen PDFs, die unterschiedliche Sachverhalte betreffend für die regelkonforme Erfassung einer Entität zu berücksichtigen sind, werden abgelöst durch eine übergreifende Ansicht mit der Option zur bedarfsorientierten mit Hyperlinks verknüpften Vertiefung. D.h. Editor:innen können sich das Material, das vorher auf verschiedene PDFs verteilt war und bei dem sie Abhängigkeiten “manuell” nachvollziehen mussten, in der neuen STA-Dokumentationsplattform fallbezogen zusammenstellen. Eine deutliche Arbeitserleichterung und einhergehend mit dem Wissen, für den individuellen Fall “alles” (i.S.v. Regeln) berücksichtigt zu haben. Technisch ist die Plattform auf Basis einer Wikibase-Datenbank umgesetzt, deren Frontend aber für die Browseranwendung optimiert wurde.

Die Trainingsmaterialien zur Nutzung des Standards RDA Dach sind bereits online und können getestet werden. Im Sommer soll dann auch die GND Dokumentation entsprechend veröffentlicht sein. Die in die STA-Plattform integrierte GND-Dokumentation ist ein Baustein in der modernisierten GND. Der aktuelle Stand der Öffnung der GND insgesamt ist in den Folien 13 bis 23 kurz zusammengefasst.

Abbildung 3: Aus dem Vortrag von Mathias Manecke (DNB), screenshot

Abbildung 4: Die Menüführung zu den Anwendungsprofilen, denen man unter anderem die Standard-Anzeige von Elementen einer Entitätsbeschreibung entnehmen kann, aus dem Vortrag von Mathias Manecke (DNB), screenshot

Brauchen wir ein Curriculum?

In der intensiven Diskussion um die Sinnhaftigkeit oder gar Notwendigkeit eines Curriculums für die verschiedenen Zielgruppen schälte sich schließlich der Konsens heraus, dass weniger der als geschlossen empfundende Lehrplan, den man mit dem Beriff eines Curriculums vielleicht verbindet, gebraucht wird, als vielmehr ein pragmatisches Navigationssystem, eine “Info-Drehscheibe”, wie Chantal Köppel von der DNB anregte. In diesem Navigationssystem wären die einzelnen Module miteinander über ein Tagging verknüpft. Die Verschlagwortung orientiert die jeweiligen Zielgruppen, wo sie beginnen und wo sie gemäß ihrer akuten Bedarfe weiterführendes Material oder Angebote finden. Besonders wurde betont, Prozesse und Inhalte an möglichst konkreten Beispielen zu illustrieren.

Ergebnisse

Als Ergebnisse des Nachmittages möchten wir drei Punkte festhalten:

  1. Die gemeinschaftliche Diskussion über Methoden und Anspruch des Arbeitskreises GND Community Empowerment ist notwendig zur Verbesserung des Angebots
  2. Die bereits gesammelten Materialien und Schulungsangebote sollen durch geeignete Tags noch besser klassifiziert werden, um den Zielgruppen die Orientierung zu erleichtern. Der Arbeitskreis wird bis zum kommenden Meeting ein entsprechendes Vokabular erarbeiten.
  3. Die Differenzierung der User und Editoren nach der Intensität ihrer Interaktion mit der GND ist eine neue und wichtige Facette der anzusprechenden Zielgruppen.

Bei dem kommenden Treffen im nächsten Sommer sollen folgende Lehrmaterialien präsentiert werden:

  • NFDI4Memory möchte sein Register der Vokabulare und Thesauri mit entsprechenden Definitionen vorstellen
  • die IG Archiv wird den Stand des geplanten GND Leitfadens für Archive mit Tools, Hinweisen zur Nutzung der GND und ersten Ansätzen der Relevanzkriterien aus Archivsicht präsentieren und
  • die DNB stellt das E-Learningmodul für GND-Nutzende aus dem DFG Projekt PID Network Deutschland zur Diskussion

Wie in der oben zusammengefassten Diskussion zur Frage “Haben wir die Community im Blick?” in der Gruppe festgestellt wurde: Neben dem richtigen Handwerkszeug und den individuellen Inhalten/Themen sind es die Anlässe, die wichtig sind, um miteinander im Gespräch zu bleiben. In diesem Sinne kommt im Sommer die Einladung zum nächsten Treffen des AK GND Community Empowerment.

Der aktuelle Stand der Öffnung der GND ist in den  Folien 13 bis 23 kurz zusammengefasst.

Ungefähr ein Dutzend Software-Unternehmen und Vertreter aus den Sparten Museen und Archive waren der Einladung zum Workshop in Frankfurt am 12. Oktober 2023 gefolgt. Gastgeberin war die Arbeitsstelle für Standardisierung an der Deutschen Nationalbibliothek (DNB) in ihrer Funktion als Trägerin der technischen und organisatorischen Infrastruktur der Gemeinsamen Normdatei (GND). 

Es geht um eine verbesserte Datenqualität der Sammlungsdaten durch die Verknüpfung mit der Gemeinsamen Normdatei. Als dringender Wunsch auf dem GND Forum Museen und Sammlungen formuliert, im Leitfaden des Deutschen Museumsbundes, aber auch in anderen Communities bereits gespiegelt, wollten wir direkt mit Softwareanbietern ins Gespräch kommen, deren Produkte die Erschließungsarbeit in Museen, Sammlungen und Archiven unterstützen. Ziel des Treffens war es herauszufinden, wie man das Einbinden von GND-IDs in der alltäglichen Erfassungsarbeit leichter machen kann. Es soll einfacher werden, Aussagen zum Objekt, wie zum Beispiel zu Akteuren, zu Orten oder zu Sachbegriffen mit Entitäten der GND zu verknüpfen. In einem Datensatz zu einem Sammlungsgegenstand können theoretisch viele GND-IDs eingetragen werden, aber eben oft noch nicht in der Praxis. Der Workshop war daher ein Auftakt für eine möglichst intensive und fruchtbare Zusammenarbeit im Sinne einer verbesserten Datenqualität durch die vereinfachte und integrierte Nutzung der Gemeinsamen Normdatei in der Erschließung an Museen, Sammlungen und Archiven zwischen Software-Anbietenden und Software-Nutzenden. Zusammen wollen wir lernen, was wir verbessern können und vermitteln, wie breit der Bedarf an vernetzten Daten in der Forschung, in Museen und Archiven schon ist. Mit einem Carpe Diem für ein semantisches, maschinenlesbares Datennetz, dass allen Menschen einen schnellen und einfachen Zugang zum Kulturwissen eröffnet, begrüßte Frau Ute Schwens, stellvertretende Generaldirektorin der DNB, die Gäste im Raum 404.

Im ersten Drittel des Treffens wurde der Bedarf an einer vereinfachten Integration der GND aus der Perspektive der Museen, Archive und der Deutschen Digitalen Bibliothek geschildert. Abgerundet wurde dieser Part durch Kurzpräsentationen zur maschinell unterstützten Nachnutzung der GND über die lesende Schnittstelle, die von lobid zur Verfügung gestellt wird und die Visualisierungen der GND-Entitäten in unterschiedlichen Facetten im GND Explorer. Die Präsentationen sind nebenstehend einzeln aufgelistet. Im zweiten Drittel erarbeiteten die Teilnehmenden eine gemeinsame Übersichtskarte zum Status-quo. Das Potential der GND wird von den vertretenden Softwareprodukten klar erkannt und der aufgezeigte Bedarf zum Teil schon aufgegriffen. Fast alle Software-Produkte unterstützen nicht nur die Integration von GND-IDs zu Personen, sondern berücksichtigen alle Satzarten, wie die nachstehende Galerie der Landkarte zeigt.

Zum Anzeigen der Bilder in besserer Qualität bitte darauf klicken. Hinweis zu den Bildrechten: DNB, CC BY SA

Personen

Körperschaften


Geografika

Konferenzen

Werke

Allgemeinbegriffe

Präsentationen
Impulsvorträge

Domenic Städtler "Die Minimaldatensatz-Empfehlung für Museen und Sammlungen und die Einbindung von Normdaten-URIs" Folien

Johannes Haslauer und Fabian Näser "Erschließung in der Archivwelt - der lange Weg vom Papierregister zur normierten Erfassung" Folien
Adrian Pohl "lobid als lesende Schnittstelle zur GND" Folien
Jürgen Kett "GND Explorer. Das GND.network sichtbar machen" Folien

Sarah Hartmann

"...Und wenn es den GND-Datensatz noch nicht gibt?" Folien

und weiterführende Links:

GND Website: https://gnd.network/Webs/gnd/DE/Home/home_node.html

GND Explorer: https://explore.gnd.network/

Minimaldatensatz: www.minimaldatensatz.de

Dabei nutzen viele der Kunden der verschiedenen Softwareprodukte überwiegend die Option, innerhalb der eigenen Datenbank eigene lokale Normdatensätze, beispielsweise zu wiederkehrenden Akteuren in der Sammlung des Hauses, zu pflegen. Dort erfolgt dann auch konkret, falls die Entität vorhanden ist, die Verknüpfung mit der entsprechenden GND-Entität. Dies gilt insbesondere für Datensätze zu Personen und Körperschaften. Außerdem ist es in den meisten Softwareprodukten möglich, in einem Objektdatensatz zu einem externen Normdatensatz, wie der GND, zu verknüpfen oder gar die Nennung im Freitextfeld möglich. Wie der Vertreter der Firma Axiell mit Zustimmung aller betonte: "Der Kunde bekommt natürlich, was er will." Doch noch ist die differenzierte Ausweisung von Normdaten-IDs im eigentlichen Datensatz zum Objekt in eigenen Datenfeldern eher selten. Zwar beobachten insgesamt alle Anbietenden einen klaren Trend zur Standardisierung, der in den letzten Jahren auf jeden Fall an Momentum gewonnen hat, aber die Einsicht, dass die Vernetzung der eigenen Daten mit Normdaten einen Mehrwert für die Häuser darstellt, sei noch ausbaufähig.

Zum Ende des Arbeitstreffens einigten sich die Anwesenden, diesen Austausch im Interesse des Ausbaus der Datenvernetzung fortzusetzen. Konkret bedeutet dies, dass man gemeinsam an folgenden Aufgaben arbeiten möchte:

  • Die Reconciliation-API im lobid-Portfolio des hbz soll standardisiert werden.
  • Die Anerkennung des Nutzens von Mappings interner Vokabulare auf die GND soll stärker gefördert werden.
  • Die differenzierte Einbindung verschiedener Normdaten und Thesauri je nach Datenfeld soll leichter werden.
  • Die Möglichkeiten, um nicht-valide Metadaten in GND-Datensätzen (z. B. Zeitangaben) zu verringern bzw. als solche zu kennzeichnen, sollen weiter diskutiert werden. 
  • Die Möglichkeiten für einen Abgleich der Sammlungsdaten mit der GND und für den schreibenden Zugriff in der GND, um benötigte GND-IDs anzulegen, sollen bekannter werden.

Dazu soll ein digitaler Arbeitsraum für die verteilte Arbeit in unterschiedlichen Arbeitsgruppen, an denen sich die Anwesenden einbringen wollen, eingerichtet und der Informationsfluss durch die Einrichtung einer Mailingliste verbessert werden. Ungefähr in einem Jahr möchte man sich wieder treffen, um die erzielten Fortschritte zu bewerten. Das heißt, jetzt gilt es, das kommende Jahr zu nutzen, um sich gemeinsam und je nach Interesselage darauf zu verständigen wie und möglicherweise mit welchen weiteren Partnern man die oben nur skizzierten Aufgaben angehen will.

Wie erfolgt die Einbindung der GND?

Hinweis zu den Bildrechten: DNB, CC BY SA

Im Zuge des GND-Forum zum Datenraum Architektur, Bauwerke und Denkmale wurde deutlich, wie wichtig die Qualität der Daten für ihre Vernetzung mit der GND und anderen Systemen ist. Das Deutsche Dokumentationszentrum für Kunstgeschichte, Foto Marburg (DDK), lädt nun als Partner von GND4C alle Teilnehmenden des Forums ein, das Datenbearbeitungstool "OpenRefine" in einem Workshop kennenzulernen.

Nachstehend die Ankündigung und Einladung von Julia Rössel, Mitarbeiterin am DDK und in der DDB-Fachstelle Denkmalpflege.

OpenRefine ist eine Open-Source-Software, die auf vielfältige Weise für die Analyse, Anpassung und Anreicherung von Daten genutzt werden kann. Im Zuge des Austauschs von Kulturdaten wird sie bereits vielfach genutzt und eine breite User-Community stellt Informationen und Tutorials zur Verfügung.

Bei einem Hands-On Workshop am 25. und 26. Oktober möchten wir jeweils von 9.30-11.30 Uhr die Möglichkeiten des Einsatzes von OpenRefine speziell für Daten zu Bauwerken und die Erstellung von Normdaten für die GND erkunden. 

Wir erklären, welche grundsätzlichen Anforderungen an Daten bestehen, die als Normdaten zu Bauwerken in der GND publiziert werden sollen. 

Gemeinsam erkunden wir grundlegende Funktionen von OpenRefine und üben anhand von Testdatensets mit Bauwerksdaten folgende Funktionen:

  • Daten analysieren und sichten durch Facetten, Filter und Cluster
  • Spalten trennen und zusammenführen
  • Einfache GREL-Anweisungen über gesammelte Zellen je nach Filter, z.B. zur Auflösung von Abkürzungen
  • Datenanreicherung durch Abgleich mit GND oder Wikidata (Reconciliation)

Voraussetzungen für die Teilnahme am Workshop sind ein internetfähiger Computer mit Browser (Firefox oder Chrome),  Interesse an Prozessen der Datenanalyse und Verarbeitung und idealerweise die bereits installierte Software openRefine (v.3.7.4) sowie ein zweiter Bildschirm.

Veranstaltung wird durchgeführt vom Deutschen Dokumentationszentrum für Kunstgeschichte - Bildarchiv Foto Marburg. Im Vorfeld senden wir Ihnen Informationen zur Installation und weitere Unterlagen zu.

Die Teilnehmer*innenzahl ist auf 25 Personen begrenzt.

Warteliste

Wir sind leider schon ausgebucht! Gern nehmen wir Sie in unsere Warteliste auf. Melden Sie sich dazu über diesen Link bei uns.

Bitte geben Sie uns Bescheid, wenn Sie bereits registriert sind, aber nicht teilnehmen können.

Für Rückfragen wenden Sie sich gern an: gnd-bau@fotomarburg.de

Alle Informationen zum Workshop finden Sie auch hier.



Rothenburg o.T. der Fleischhausbrunnen damals und heute, credit Collage aus  links Fotomarburg und rechts Tuxyso CC BY-SA 3.0, via Wikimedia Commons von Julia Rössel (DDK) Gesamtwerk CC BY-SA 3.0

Selbst wenn Winston Churchil es nicht gesagt haben sollte, so ist der Hinweis "Glaube nie einer Statistik, die du nicht selbst gefälscht hast." in Zeiten von Fake News und Informationsflut sicherlich angebracht.

Wir geben uns natürlich redlich Mühe, wenn wir unsere Datenbank analysieren, um das Verhältnis der Entitätstypen zueinander zu bestimmen. Dennoch kann es je nach Herangehensweise und wie man den Zuschnitt wählt auch hier zu Unterschieden kommen. Doch die Proportionen stimmen auf jeden Fall.

Wer zudem noch mehr über die einzelnen Entitätstypen oder auch Satzarten erfahren möchte, dem legen wir die kurzweilige Lektüre folgender Beiträge aus dem DNB Blog der Kollegin Elke Jost-Zell ans Herz:



Elke Jost-Zell ist als Bibliothekarin, GND-Redakteurin und Autorin in der Abteilung Inhaltserschließung der Deutschen Nationalbibliothek tätig.

Wann können Daten zu Normdaten werden? – Tipps für die Entwicklung community-spezifischer Relevanzkriterien

Wann ist ein Datensatz für die Gemeinsame Normdatei relevant? Nach welchen Kriterien können geeignete Daten etwa in Vorbereitung eines Imports in die GND sinnvoll ausgewählt werden? Fragen wie diese werden immer wieder unter dem Stichwort der Relevanzkriterien diskutiert. Im Folgenden wird erläutert, was darunter zu verstehen ist, welche Rolle die GND-Eignungskriterien dabei spielen und welche Anhaltspunkte bei der Entwicklung von Relevanzkriterien für die eigene Community oder Anwendergemeinschaft helfen können.


Eine sichtbare und willkommene Folge der GND-Öffnung ist, dass sich die GND durch die hinzukommenden Partner auch als Datensammlung erweitert. Das liegt in der Natur der Sache: In der Vergangenheit ergab sich der Inhalt der GND aus dem Bedarf der Bibliotheken an einheitlichen Benennungen als Ankerpunkte für die formale und inhaltliche Erschließung im Rahmen der Katalogisierung ihrer Medien. Je häufiger und konsequenter weitere Communities nicht nur Buch- und andere Textmaterialien, sondern auch materielle sowie immaterielle Objekte, archivisches Schriftgut und andere Materialarten mithilfe der GND erfassen, umso größer wird der Bedarf an weiteren für die Erschließung benötigten Normdaten in der GND.


Diese Erläuterung will Datengebenden, Communities und GND-Agenturen zur Orientierung dienen. Die Leitfragen, die sie bei der Auswahl von "GND-relevanten" Daten unterstützen sollen, sind daher als Hilfestellung zu verstehen - sie ist weder vollständig noch abgeschlossen.

Sie haben Rückmeldungen dazu oder wollen sich über Ihre bisherigen Erfahrungen mit der Ermittlung von Relevanzkriterien austauschen? Melden Sie sich gerne, damit wir ins Gespräch kommen! gnd-info@dnb.de

Daten müssen den GND-Eignungskriterien entsprechen

Für das Einbringen neuer Daten in die GND gelten die GND-Eignungskriterien. Sie fassen zusammen, welche formalen und organisatorischen Rahmenbedingungen erfüllt sein und welche Eigenschaften auf die einzubringenden Daten zutreffen müssen. Wer Daten in die GND eingeben oder importieren will, muss daher in einem ersten Schritt prüfen, ob sie diesen Kriterien genügen.

  • Eignen sich die Daten für die GND, weil sie Ressourcen außerhalb und Entitäten innerhalb der GND miteinander vernetzen? 
  • Stehen die Daten unter freier Lizenz? 
  • Ist ihre Herkunft nachvollziehbar und stammen die Angaben aus verlässlichen Quellen? 
  • Entsprechen die Daten den geltenden Regeln zur Erfassung von Normdatensätzen in der GND?
  • Besteht eine Vereinbarung mit einer GND-Agentur oder Redaktion über die langfristige redaktionelle Betreuung der Daten in der GND? 
  • Fügen sich die Daten in die bestehenden Abläufe und technischen Systeme ein?

Während sich die meisten der Fragen recht schnell und eindeutig mit Ja oder Nein beantworten lassen, fordert das erste Eignungskriterium zu einer tiefergehenden Auseinandersetzung mit den Daten auf, die in die GND eingebracht werden sollen: “Es besteht ein berechtigter Bedarf und die Daten dienen dem Zweck der GND”. 

Wie lässt sich nun herausfinden, ob der Bedarf an Daten berechtigt ist, sie den Zweck der GND erfüllen und demnach in der GND gut aufgehoben sind? Antworten auf diese Fragen können community-spezifische Relevanzkriterien liefern. Sie ergänzen die Eignungskriterien und konkretisieren sie für den Gebrauch einer bestimmten Community. Im Zusammenspiel von Datengebenden und GND-Agenturen können die Relevanzkriterien etwa als Orientierungshilfe dienen, anhand derer leichter entschieden werden kann, welche Daten letztendlich in die GND eingegeben oder eingespielt werden sollen.



Gemeinfrei. Quelle

Ansätze für die Entwicklung von Relevanzkriterien

Der Zweck der GND ist es, Brücken und Anknüpfungspunkte im Wissensgraph von Kultur und Wissenschaft zu bilden, über die Zusammengehöriges zusammenfindet. Die GND ist ein zentrales Werkzeug, um Verbindungen zwischen den unendlich vielen Informationen im Web zu strukturieren und ausfindig zu machen. Die Normdaten führen heute sowohl zu publizierten Medien in Bibliotheken und verknüpfen ganz unterschiedliche Ressourcen wie  Museumsobjekte, Archivalien und Forschungsdaten.

Ob der Bedarf an einem Normdatensatz als berechtigt und dem Zweck der GND dienlich bewertet werden kann, hängt maßgeblich davon ab, wofür er benötigt wird und ob sein Vernetzungspotenzial hinlänglich groß ist. Es sollte daher im Vorfeld abgeschätzt werden, ob er nur dem eigenen, lokalen Bedarf nützt oder tatsächlich eine Brückenfunktion über Bestands-, Sparten- und Projektgrenzen hinweg im Datennetz von Kultur und Forschung entfalten wird. Daten, die ausschließlich der lokalen Datenhaltung und ihrer Strukturierung dienen, sind demnach meist nicht für die GND relevant. Es ist die breitflächige (Nach-)Nutzung von Daten innerhalb einer Community oder dem gesamten GND-Netzwerk, die sie für die Vernetzung interessant und als Normdatensatz brauchbar machen.

Im Bibliotheksbereich bestehen verschiedene Verabredungen, die mit der Funktion von Relevanzkriterien vergleichbar sind. Diese Konventionen sind Bestandteil der Regelwerke RDA und RSWK für die formale und die inhaltliche Erfassung von Medienwerken. Sie geben vor, welche Angaben Bibliothekar*innen bei der Erschließung von Medien mit Normdaten verknüpfen sollen. Zum Beispiel, wenn:

  • …eine Person als Autor*in oder Herausgeber*in einer Publikation in Erscheinung tritt. Die meisten Bibliotheken erfassen aus Ressourcengründen nur die ersten drei Autor*innen bzw. Herausgeber*innen einer Publikation.

  • …eine Körperschaft Herausgeberin oder Thema einer Publikation ist. Bibliografische Angaben zu Verlag und Ort der Publikation werden aus Ressourcengründen dagegen nicht mit einer Normdatenverknüpfung versehen.

  • …eine Publikation inhaltlich beschrieben werden soll. Hier werden Verknüpfungen zu Sachbegriffen, Orten, Personen, Körperschaften oder Werken hinterlegt, sofern sie Thema des Titels sind. Im Bereich der Sachbegriffe fungiert die GND auch als Thesaurus mit unterschiedlich granularen Begriffen. Um diese für das spätere Information Retrieval möglichst einheitlich zu vergeben, gilt die Anwendungsregel, dass der jeweils engste Begriff verknüpft werden soll.

  • … die Gattung von Medien erschlossen wird. Hier greifen die Bibliotheken auf eine limitierte Liste von “Formschlagwörtern”, d. h. GND-Sachbegriffen zurück.

Daraus ergibt sich auch der Bedarf der bibliothekarischen Community an neu anzulegenden Normdaten. Der Umfang und die Granularität (Erschließungstiefe) dieser Verknüpfungen und Ansetzungen ist davon beeinflusst, welchen gesetzlichen oder Träger-Auftrag die Bibliothek erfüllt, wie viele Objekte erschlossen werden sollen, welche Erschließungstiefe angestrebt wird, welche Personalressourcen dafür zur Verfügung stehen und welche Funktionalität die Anwendungen bieten sollen, die auf den Normdaten aufsetzen. So verfolgen Nationalbibliotheken, Landes- oder Regionalbibliotheken andere Erschließungsstrategien als Spezial- oder Fachbibliotheken. Dennoch haben sie sich auf einen “Mindeststandard” geeinigt, der für die kooperative bibliografische Erschließung mit Normdaten sowie den Datenaustausch erforderlich ist und sich daher in den heute geltenden Erfassungsregeln der GND niederschlägt.





Gemeinfrei. Quelle



Leitfragen für die Entwicklung von Relevanzkriterien für die eigene Community

Die Entwicklung von Relevanzkriterien bedeutet, eine gemeinsame Praxis oder einen gemeinsamen “Mindeststandard” für den Umgang mit Normdaten zu finden. Die Verabredungen zur Verknüpfung und daraus resultierenden Ansetzung von Normdaten sind letztlich mit dem Ziel verbunden, Daten innerhalb einer Community und darüber hinaus besser vernetzen und austauschen zu können. Dabei müssen auch die zur Verfügung stehenden Ressourcen (Personal, Zeit, Geld, Objektmengen) in die Waagschale geworfen werden. Beispielsweise wäre auszuhandeln, auf welcher Erfassungsebene Normdaten zum Einsatz kommen sollen, welche Aussagen oder Entitäten obligatorisch mit Normdaten verknüpft werden sollten und für welche dies lediglich empfohlen wird.

Es gilt also, die Erschließungskonventionen der eigenen Community oder Anwendergemeinschaft in den Blick zu nehmen, den sich daraus ergebenden Bedarf an Normdaten zu ermitteln und so seiner Berechtigung Rückhalt und Gewicht zu geben. Unter Umständen muss sich die Community über die vorhandenen Beteiligungswege dafür einsetzen, dass ihre Bedarfe in der GND umgesetzt und mit den Eignungskriterien vereinbart werden können. Bei der Konkretisierung des Bedarfs an Normdaten der GND können die abschließenden Leitfragen helfen:


Ist die GND tatsächlich der geeignete Ort für die Entitäten, die verknüpft werden sollen?

Wofür wird die Entität benötigt? Können andere Referenzsysteme den Bedarf besser bedienen? Welche Alternativen bieten sich zur GND-Nutzung?

    • Lokale Normdaten nutzen – Grundsätzlich empfiehlt es sich, alle für die Datenerfassung relevanten Entitäten wie beispielsweise Personen, Orte, Körperschaften oder thematische Schlagwörter im eigenen System einzeln zu modellieren, zu beschreiben und über interne Identifier referenzierbar zu machen. Diese können als lokale Normdaten fungieren. Entitäten und IDs, die für die lokale Erfassung, bestimmte Funktionen und Abläufe in der Datenabfrage (Facetten, Filter,...) benötigt werden, können hier beliebig ergänzt werden.

    • Fachthesauri nutzen – Thesauri dienen dazu, Entitäten oder Merkmale über viele Datenbestände hinweg einheitlich und eindeutig zu benennen. Sie enthalten die für ein bestimmtes Themen- oder Fachgebiet wichtigen Begriffe/Konzepte und definieren ihre Relationen. Dadurch bilden sie ein in sich konsistentes, kontrolliertes Vokabular, dessen Deskriptoren weitaus granularer und für die Beschreibung treffender sind als die eher allgemeinen Begriffe der GND. Die GND lässt sich dabei über Mappings einbinden, die die Begriffsbeziehungen zwischen Thesaurus und GND maschinenlesbar abbilden. Sie ermöglichen es z. B. zu den genutzten Deskriptoren des Fachvokabulars die IDs bedeutungsgleicher oder -naher GND-Normdaten in die eigenen Daten zu übernehmen.

    • Weitere Referenzsysteme nutzen – Je nachdem, welche Funktion eine Entität in der Datenhaltung erfüllen muss, kommen neben der GND viele weitere Identifier-Systeme wie z. B. GeoNames oder Wikidata in Frage. Wikidata eignet sich insbesondere für spezifische Referenzierungsbedarfe, die möglichst schnell, etwa in befristeten Projekten, umgesetzt werden sollen.

Der Zweck der GND ist nicht, dass in externen Quellen gepflegte und in der Regel detailreiche Daten schlicht in der Normdatei “gedoppelt” werden. Sie ist weder eine Enzyklopädie, noch eine Datei, in der Deskriptoren aus externen Thesauri, Einträge aus Fachdatenbanken, Orts- oder Personenverzeichnissen oder Objekte aus Sammlungsdatenbanken “gespiegelt” vorgehalten werden oder als Ersatz für sie dienen. Die Thesauri, Objekt-, Personen-, Orts-, Ereignis- und weitere Datenbanken müssen vielmehr selbst zu Bausteinen im Semantic Web werden und ihre Inhalte als Linked Data für Referenzierungen aus anderen Richtungen und Datendomänen zur Verfügung stehen.


Wie groß ist das Verknüpfungspotenzial der zu erfassenden Entität?

    • Sind weitere Ressourcen zur Person oder zum Thema bekannt oder zu erwarten, etwa weil die Person regelmäßig in dem Erfassungskontext in Erscheinung tritt? Das könnte dann der Fall sein, wenn sie publiziert (hat) oder ein Nachlass zu erschließen ist, in dem mehrere Objekte der Person zugeordnet werden können.

    • Ist z. B. aus einem Projektkontext heraus bekannt oder abzusehen, dass außer der eigenen Einrichtung noch weitere Einrichtungen Objekte zu der Person, dem Ort oder Thema vorhalten? Werden die Normdaten zur Vernetzung oder virtuellen Zusammenführung von verteilten Objekten und Informationen im Rahmen eines konkreten Projektes benötigt?

    • Werden die Entitäten benötigt, um eine bestimmte Funktion in der Datenpräsentation zu erfüllen, z. B. Recherche, Facettierung und/oder Zusammenführung von verteilten Objekten über mehrere Institutionen hinweg?




Gemeinfrei. Quelle

Ein Beitrag von Barbara Pfeifer

Barbara Pfeifer ist als Bibliothekarin, GND-Redakteurin und Referatsleiterin (Ref. BF6) in der Abteilung Formalerschließung der Deutschen Nationalbibliothek tätig.


Auf der STA-Plattform werden die Regeln der Erschließung von Ressourcen und die Erfassung von GND-Normdatensätzen dargestellt und sind ab sofort für den deutsch sprachigen Raum öffentlich zugänglich. Als erste Anwendungen sind der Standard RDA DACH („Resource Description and Access“ für Deutschland, Österreich und die Schweiz) und die Formatdokumentation der Gemeinsamen Normdatei (GND) auf der Plattform unter https://sta.dnb.de/doc zu finden.

Der Standard RDA DACH fasst die bestehende Regelwerksanwendung für den deutschsprachigen Raum zusammen und bietet die Grundlage für die Erschließung nach RDA. Er beinhaltet in der ersten Version "Allgemeines"-Texte, alle Elementbeschreibungen und Beschreibungen zu einigen Ressourcentypen. Der Bereich Anwendungsprofile wird sukzessive aktualisiert und ergänzt werden. Erarbeitet wurden die Texte im Projekt „3R für DACH-Bibliotheken“ von Mitgliedern der Fachgruppe Erschließung und Kolleg*innen aus Bibliotheken und Bibliotheksverbünden. Die Einführung in die Benutzung der STA-Plattform und die RDA-Regelwerksanpassungen werden ab September 2023 im Trainingsangebot „Praxis-Update RDA DACH“ vermittelt.

Als nächster Standard wird die GND-Dokumentation in die Plattform eingearbeitet. Es folgen die Regeln für die Inhaltserschließung. Ziel ist es, alle Regelungen und Dokumentationen zur Erschließung und die Arbeit mit der Normdatenbank GND unter einer Adresse komfortabel und maschinenlesbar zugänglich zu machen.

Welches IT-Prinzip steht hinter der STA-Plattform?

Für die STA-Plattform werden die Fließtexte zu den konventionellen Regeln mittels eines übergreifenden Datenmodells strukturiert und als einzelne Elemente in einer Datenbank qualifiziert abgelegt. Sie sind so maschinenlesbar. Um Menschen das Lesen zu erleichtern, werden die Elemente anschließend maschinell auf der Weboberfläche wieder korrekt zu Fließtexten zusammengefügt. Diese anfängliche Mehrarbeit reduziert auf Dauer den Pflegeaufwand und unterstützt die Anwendung automatisierter Verfahren. So können künftig Änderungen an einem Element automatisch an allen Textstellen mit diesem Element angepasst werden. Die Datenbank ist besser durchsuchbar als eine Volltextsuche der vormaligen Fließtexte. Die Elemente lassen sich in unterschiedlichen Datenformaten darstellen. Man kann bei der Suche besser filtern und die Elemente weiter kategorisieren, je nach Bedarf der Anwender*innen.

Abbildung: Structured Data

Autor: Seobility, Lizenz: CC BY-SA 4.0

Das neue DFG-Projekt PID Network Deutschland möchte die Verwendung von Persistenten Identifikatoren (PID) in der Forschung fördern.

In einem Projekt, das sich zum Ziel gesetzt hat, die Verwendung von Persistenten Identifikatoren (PID) in der Forschung zu fördern, darf die Deutsche Nationalbibliothek als Träger der Gemeinsamen Normdatei (GND) und des URN-Service für Online-Ressourcen nicht fehlen.

In einer zunehmend digitalen Wissenschaftslandschaft ist die dauerhafte und verlässliche Identifizierung der mit Forschungsprozessen verknüpften Ressourcen, ihrer Akteure und ihrer Forschungsprodukte mittels PIDs unerlässlich geworden.

Mit der wachsenden Bedeutung von PIDs im Forschungsalltag und zunehmend auch in kulturellen Kontexten erhöhen sich aber auch die Anforderungen an deren effiziente Nutzbarkeit. Gleichzeitig werden die Nutzenden mit einer großen Vielfalt sehr unterschiedlicher Angebote an PID-Systemen und ihrer Einsatzmöglichkeiten konfrontiert.

Aus diesem Grund verfolgt das von der Deutschen Forschungsgemeinschaft (DFG) geförderte Projekt PID Network Deutschland – Netzwerk für die Förderung von persistenten Identifikatoren in Wissenschaft und Kultur“ das Ziel, ein Netzwerk aus bereits bestehenden und sich aktuell formierenden Akteuren in Wissenschaft und Kultur zu etablieren, das die Anwendung, Implementierung, Standardisierung und internationale Anschlussfähigkeit von PID-Systemen auf lokaler, nationaler und internationaler Ebene fördert und konsolidiert.

Die Erkenntnisse aus dem Projekt werden in Empfehlungen einer nationalen PID-Roadmap für Deutschland münden.

Das Projektvorhaben bettet sich damit in Bestrebungen zur Förderung von persistenten Identifikatoren ein. Nationale und internationale Organisationen und Zusammenschlüsse wie DFG, Coalition S, EOSC, NFDI, und RDA sind dabei wichtige Akteure.

Die DNB verantwortet in dem Projekt insbesondere die Ansprache der Datenproduzent:innen im Kulturbereich. Hier werden wir im Laufe des Projektes Leitlinien und Schulungsmaterial entwickeln, die Mitarbeitenden in Kultureinrichtungen sowie Forschenden gerade der Geisteswissenschaften zur Verwendung von GND-IDs in der eigenen Datenbank, sowie zum regelkonformen Anlegen eventuell fehlender GND-Datensätze motivieren soll. Erste Ergebnisse stellen wir im kommenden Jahr vor.

Über das Projekt mit seinen Facetten zu zehn verschiedenen Schwerpunkten informiert die Website des Projektes.





Persistente Identifikatoren werden vielleicht nicht ganz so lange wie dieser kalifornische Mammutbaum existieren, aber wer weiß das heute schon.
credit: public domain
Es tut sich ‘was!
Zum 2.Treffen der AG “GND Community Empowerment”


Bisweilen hört man, unter anderem in den GND-Foren, die Gemeinsame Normdatei (GND) sei zwar prima, aber auch ganz schön sperrig im Gebrauch. Hierfür durch Wissensvermittlung und -anwendung Abhilfe zu schaffen, ist das Ziel der projektübergreifenden Arbeitsgruppe “GND Community Empowerment”. In dem halben Jahr seit dem ersten Treffen und Konstituierung der Arbeitsgruppe im Dezember 2022 hat sich einiges in dem Bereich getan. Das Organisationsteam aus den DFG geförderten Projekten Text+, dem NFDI Konsortium für text- und sprachbasierte Wissenschaften, und GND4C, das Forschungsprojekt zur Öffnung der GND für Kulturdaten, stellte daher den Fortschrittsbericht in den Fokus für das zweite Arbeitstreffen. Der Einladung folgten am 20. Juni 2023 gut zwei Dutzend Teilnehmende aus den etablierten und neuen GND-Agenturen sowie aus den geisteswissenschaftlich orientierten NFDI-Konsortien. Sie gaben Feedback zu den fünf vorgestellten Initiativen und vereinbarten in dem abschließenden Plenum das weitere Vorgehen.

Im Folgenden eine kursorische Darstellung der fünf Beiträge.

Fehler beim Ausführen des Makros 'widget'

com.atlassian.confluence.api.impl.sal.exception.IllegalURLException: The provided url is not included in the whitelist!



Eine Sammlung: Die GND-Community-Library voller Material und Medien

Den Anfang machte Marie Annisius (DNB). Sie stellte eine Tabelle vor, in der Teilnehmende der Arbeitsgruppe “GND Community Empowerment” in den zurückliegenden Monaten Materialien und Medien zur GND allgemein, ihrer Nachnutzung, der Anwendung für GND-Editor*innen sowie zur Organisationsstruktur zusammengetragen haben. Diese Sammlung soll weiter ausgebaut und aktualisiert werden. In der Tabelle sollen künftig noch besser Anpassungswünsche und Versionierungen abgebildet werden können. Viele der verzeichneten Medien sind bereits online auf der GND-Website, aber, so das Feedback aus der Gruppe, dort nicht immer leicht auffindbar. Andere Materialien werden durch Dritte angeboten und sind vielleicht einem größeren Kreis unbekannt. Daher wurde angeregt, dass die Tabelle mit leichten Anpassungen, wie dem Zusatz “user” bei Nutzende und “editor” bei Anwendende, für alle Teilnehmenden der AG editierbar gemacht wird und mittelfristig auch als Sammlung über die GND-Website der Allgemeinheit zur Verfügung stehen soll, sofern dies die jeweiligen Lizenzen zu den Materialien zulassen. 

Screenshot aus der Präsentation von Marie Annisius (DNB) zur "Community-Library"

Zum Vergrößern bitte auf die Abbildung klicken



Ein Film: Normdaten in vier Minuten erklärt

Vier Minuten Kino! Im NFDI Konsortium NFDI4Culture hat man sich der durchaus anspruchsvollen Aufgabe gestellt: Wie erkläre ich Laien, was Normdaten sind und welchen Mehrwert sie mit sich bringen? Unterstützt durch entsprechende Profis haben vornehmlich Desiree Mayer (SLUB) und Melanie Gruß (Universität Leipzig) ein kurzes und einprägsames Video erarbeitet und vorgestellt, das leichtfüßig in die Begriffswelt der Normdaten einführt. Der Fokus liegt dabei auf der GND, aber auch andere kontrollierte Vokabulare und Sammlungen strukturierter Daten wie GeoNames oder Wikidata werden erwähnt. Das Video kann sowohl über Youtube als auch auf dem TIB Portal für audiovisuelle Medien aufgerufen oder aufgrund seiner freien Lizenzierung leicht in die Webseiten Dritter eingebunden werden. Natürlich sehen Expert*innen immer Bedarf an mehr Tiefgang, so auch bei diesem Einführungsvideo. Aber zugleich mag dies ein Ansporn sein, entsprechend weitere Beiträge selbst zu erstellen. In summa wurde das Video als ein sehr schönes Beispiel für die Art von Produkten gelobt, die im Baukasten der AG „GND Community Empowerment“ bereitgestellt werden sollen.

Der Videoclip von NFDI4Culture erklärt den Sinn und Zweck von GND-Normdaten.



Ein Prototyp: Infokarten zu GND-Nutzenden 


Letztes Jahr gab es im Designworkshop der Arbeitsgruppe neben den Vereinbarungen für die künftige Zusammenarbeit an einem offenen und modularen “Baukasten” für Materialien und Medien zur Wissensvermittlung und -anwendung mit Bezug zur GND auch einen ganz konkreten Wunsch. Um leichter weitere Einrichtungen und auch Forschende zur Einbindung von GND Identifikatoren in ihre Datensammlungen zu motivieren und diese Daten dann nach Möglichkeit zu veröffentlichen, war der Wunsch nach einer  Darstellung von Best Practice Beispielen für die GND (Nach)nutzung möglichst in standardisierter Form geäußert worden. Die Arbeitsstelle für Standardisierung stellte, ausgehend von Überlegungen, welche Informationen für andere Einrichtungen und Forschende relevant sein könnten, ein Template zur Erfassung der Angaben im Treffen vor. Einige GND-Poweruser haben das Template bereits ausgefüllt. Alle vorliegenden “Infokarten” sind in den Folien enthalten. Gestalterisch ist das Template sicher noch optimierbar, aber es enthält bereits die wesentlichen Aussagen, entschied die Gruppe. Zwei Hinweise aus der Gruppe bezogen sich auf die Einbindung eines QR Codes, um die Leser*innen direkt auf die mit der GND verknüpfte Datensammlung mit der entsprechenden Kontaktadresse zu lenken. Auch für das Ausspielen der Best Practice Beispiele gab es erste Ideen, einerseits gedruckt für Veranstaltungen, andererseits online auf der GND Website. Außerdem wurde angeregt, das Template als Fragebogen einem größeren Kreis zur Verfügung zu stellen und die Ergebnisse entsprechend zu dokumentieren. Diese Anregungen wird das AfS Team in den Weiterentwicklungsprozess aufnehmen.

Screenshot aus der Präsentation von Barbara Fischer (DNB) zur "Infokarte GND-Nutzende"

Zum Vergrößern bitte auf die Abbildung klicken



In der Pipeline: E-Learning Angebote zur GND


Barbara Fischer (DNB) stellte den Planungsstand für zwei modulare Angebote für GND-Interessierte vor. Diese werden im Rahmen des DFG geförderten Projektes PID Network Deutschland mit Unterstützung durch eine auf E-Learnings spezialisierte Agentur erarbeitet. Mit dem Projekt wird der Einsatz persistenter Identifikatoren in Wissenschaft und Kultur gefördert. Die DNB beteiligt sich an dem Projekt mit der GND als PID-Angebot für Kulturdaten. 

Die beiden geplanten Produkteinheiten adressieren zwei Zielgruppen: Einerseits die “Nutzenden” (user) und zum anderen die “Anwendenden” (editor). Die E-Learning-Angebote sind als Einstieg in die Thematik zu verstehen. Man wird nach circa einer Stunde Lernzeit nicht erwarten können, in der Lage zu sein, maschinell die eigenen Daten mit der GND abzugleichen, um die benötigten GND-IDs importieren zu können. Auch können wir das Editieren der GND Datensätze nur simulieren, zu verschieden sind die Voraussetzungen innerhalb der Einrichtungen. Aber wir möchten ein solides Grundwissen vermitteln, das im Weiteren ausbaufähig ist. Für beide Einheiten erarbeitet das DNB-Team jeweils entsprechende Personas. Deren User Story, also was sie genau mit der GND machen wollen, auf welche Hindernisse und Herausforderungen sie stoßen, welches Wissen sie benötigen und wie sie am Ende ihrer “Geschichte” ihren Bedarf umsetzen können, bildet den “roten Faden” für das jeweilige Drehbuch der Lerneinheit. Ebenfalls werden beide Produkteinheiten einen Medienmix vorsehen und modular aufgebaut sein. Grundlage für den didaktischen Aufbau liefert die Lernzieltaxonomie nach Bloom. Durch die Definition der Lernziele wird festgehalten, was sicher an Wissen und Fähigkeiten vermittelt werden soll. Der Launch beider Produkteinheiten ist für das Frühjahr 2025 vorgesehen. Die lange Produktionszeit erlaubt umfassende Feedbackschleifen durch Expert*innen und Zielgruppen. Details sind den Folien zu entnehmen.

Screenshot aus der Präsentation von Barbara Fischer (DNB) zur "Persona GND-Nutzende"

Zum Vergrößern bitte auf die Abbildung klicken



Die NFDI-Sektion EduTrain und DALIA

Zum Ende des Treffens gewährte uns Canan Hastik (TU Darmstadt) einen Einblick in die Arbeit der Sektion EduTrain und der gerade gestarteten NFDI-weiten Infrastruktur-Plattform “DALIA” für die Bedarfe der Sektion (siehe für Details auch die beigefügten Folien). Deutlich wurde, dass die Überlegungen in der Sektion sich nicht wirklich von denen der Arbeitsgruppe unterscheiden. Auch die Sektion empfiehlt eine Offenheit für unterschiedliche Formate und Ansätze und möchte vor allem mit DALIA eine Plattform bieten, auf der Inhalte bereitgestellt werden können. Spannend war in diesem Kontext die Diskussion um zum Einsatz kommende Kategorien zur Beschreibung der Inhalte. Als Fundament sortiert DALIA zunächst die Inhalte mit den Labels “topic”, “journey” (im Sinne eines aufbauenden Curriculums) und “genre”. Die Plattform bevorzugt Inhalte im Sinne von Open Educational Resources, schließt aber proprietäre Inhalte nicht aus. Sie möchte offen für alle sein. Das Portal wird an der TIB Hannover gehostet werden und die Inhalte sollen in den NFDI-weiten geplanten Culture Knowledge Graph einfließen können. Spätestens hier werden in Zukunft dann auch Standards und Normdaten für die Beschreibung der Inhalte relevant. Ein Thema, das auch für die AG “GND Community Empowerment” von Bedeutung ist. Insgesamt freut man sich über die Möglichkeit des fortgesetzten Austauschs und lädt zur Mitwirkung in der Sektion EduTrain ein.

Screenshot aus der Präsentation von Canan Hastik (TU Darmstadt) zu DALIA

Zum Vergrößern bitte auf die Abbildung klicken



Resümee

Zum Abschluss diskutierten alle Teilnehmenden das weitere Vorgehen. Der Fortbestand der Arbeitsgruppe stand außer Zweifel. Zum einen erfährt man viel Neues und zum anderen kann man sich in diesem Kreis auch gut miteinander vernetzen, betonte Angela Kailus (DDK – Bildarchiv Foto Marburg) stellvertretend für die AG. Daher vereinbarte man sich alle sechs Monate zu treffen. Der Kreis könne noch erweitert werden, sollte aber dennoch den Charakter eines Arbeitstreffens beibehalten, also nicht mehr als 30 Personen umfassen. Für das kommende Treffen im Dezember oder Januar stehen vornehmlich zwei mögliche Themen im Raum:

  1. Kritische Frage: Haben wir die Communities gut im Blick?

  2. Welche Bedeutung hat der Gedanke eines Curriculums für unsere Arbeit? Hierbei sollte man bedenken, dass es einmal darum gehen kann, die Lehrpläne der Universitäten für GND-relevante Themen zu öffnen und zum anderen es aber auch Ziel ist, Weiterbildungsangebote für Mitarbeitende in den Einrichtungen zu machen. Auch die Frage von Zertifizierung spielt in dieses Thema mit hinein.


Das schon bewährte Organisationsteam aus Marie Annisius (DNB), Stefan Buddenbohm (SUB) und Barbara Fischer (DNB) wird für die AG einen Wikispace einrichten und dort auch das hier vorgestellte Material, so weit wie möglich zugänglich machen. Alle, die an dem Treffen teilgenommen haben, werden zu diesem Wikispace eingeladen. Interessierte melden sich bitte unter gnd-info@dnb.de. Vielleicht findet sich für das dritte Treffen auch ein griffiger Name für die Arbeitsgruppe. (Lächeln)

Präsentationen

Moderationsfolien und alle Vorträge außer zu EduTrain und Dalia

Folien von Canan Hastik

Bereits seit längerem stand der GND Explorer in verschiedenen prototypischen Versionen bereit und nun ist es endlich soweit: Wir freuen uns über die neue Version des GND Explorers mit einem weiteren Featurepaket!

Als größte Normdatensammlung für Kultur- und Forschungsdaten im deutschsprachigen Raum gewinnt die GND (Gemeinsame Normdatei) zunehmend über ihren ursprünglichen Zweck als Arbeitswerkzeug in Bibliotheken hinaus an Bedeutung, gerade auch im Kontext von Forschung und Wissenschaft. Um den verschiedenen – teilweise auch neu entstehenden – Anforderungen und Bedürfnissen gerecht zu werden, wird die GND permanent weiterentwickelt und an einem möglichst niedrigschwelligen Zugang gearbeitet. Um die GND besser sichtbar und durchsuchbar zu machen und verschiedene thematische Einstiege in das Wissensnetzwerk zu ermöglichen, entstand in Zusammenarbeit der DNB mit der Firma Outermedia der GND Explorer.

Die Featues des GND Explorers

Das zentralste Element und zumeist zugleich das erste, mit dem man im GND Explorer Erfahrungen macht, ist die Trefferliste in Kombination mit den Filterangeboten, die erscheinen, sobald eine Suchanfrage abgeschickt wurde. Was mittlerweile quasi als Standard erwartet wird und fast banal klingt, ist dagegen alles andere als trivial: Die GND umfasst mit ihrer Datenbank verschiedene „Entitätentypen“ wie bspw. Personen, Sachbegriffe oder auch Geografika, die trotz unterschiedlicher Inhalte und Erwartungen an deren Repräsentation in gleicher Weise durchsuch- und auffindbar sein sollen. Hier wurden verschiedenfarbige Symbole genutzt, um diese unterschiedlichen Typen direkt visuell unterscheiden zu können. Verschiedene Filter bilden unterschiedliche Eigenschaften gefundener Entitäten ab, die für eine weiterführende Suche ausgewählt oder ausgeschlossen werden können. Wer eine leere Suche abschickt, erhält dank der Facetten einen Einblick in die Vielfalt der GND – und einen ersten Ansatzpunkt zu deren Erkundung.

Orts- und Zeitvisualisierung

Eine Menüleiste am rechten Bildschirmrand ermöglicht ein Umschalten der Ansicht von der klassischen Trefferliste hin zu zwei Visualisierungen: Hier wird eine Ansicht der Treffer in einer Zeitleiste sowie einer Kartendarstellung (Ortsvisualisierung) angeboten. Der Zeitstrahl bildet die verschiedenen in den Daten vorhandenen Zeitbezüge nach jahresbezogenen Angaben ab und ermöglicht Auswahl und Ansicht von bspw. Fundjahr, Erstellungszeitraum oder Lebenszeitraum. Eine zeitliche Eingrenzung kann entweder durch Auswahl über einen Schieberegler, direkte Eingabe der Jahreszahlen in ein Eingabefeld oder Klick auf einen Balken im Diagramm erfolgen. Die Ortsvisualisierung zeigt die Orte in einer Karte an, zu denen gefundene Entitäten Bezüge aufweisen, je nach Suchanfrage erscheinen Cluster oder Einzelorte zur Auswahl. Auch hier kann die Anzeige den eigenen Interessen nach angepasst, zur Auswahl stehen bspw.  Wirkungsort, Aufbewahrungsort, Exil oder Sterbeort u. A. Durch Klick auf ein Cluster wird in den entsprechenden Bereich der Karte gezoomt und die weiteren Treffer direkt über Marker dargestellt oder weitere, kleinere Cluster angeboten. Cluster und Marker verfügen dabei jeweils über einen farbigen Kreis, der sie umgibt und welcher durch die farbigen Markierungen darstellt, welche Arten von Ortsbezügen an diesem Ort vorliegen.

Das Faktenblatt liefert alle Informationen

Wird in der Trefferliste eine Entität ausgewählt, wird das zugehörige Faktenblatt aufgerufen: Dieses ist dabei sozusagen das „Herzstück“ der Entität – es stellt alle Informationen aus unseren Datensätzen in einer übersichtlichen, tabellarischen Struktur dar. Sofern vorhanden, wird linkerhand zudem ein charakteristisches Bild eingeblendet sowie ein Zitierlink für den Datensatz im GND Explorer. Die relevantesten Informationen werden direkt sichtbar angezeigt, Abschnitte, die seltener nachgefragt sind, werden der Übersichtlichkeit halber zunächst zugeklappt angezeigt, können aber jederzeit aufgeklappt werden.

Relationen- und Hierarchievisualisierung

Das Navigationsmenü am rechten Bildschirmrand ermöglicht neben der Rückkehr zur ursprünglichen Trefferliste den Wechsel zur Relationenvisualisierung der aufgerufenen Entität, oder -  sofern vorhanden - zur Anzeige der Entität im Kontext von vorhandene Hierarchien. Hier kann zudem zwischen den Treffern durch einfaches Durchblättern gewechselt werden. Die Hierarchievisualisierung stellt den Begriff in seiner hierarchischen Einordnung dar, wenn diese vorliegt. Hier werden sowohl untergeordnete als auch übergeordnete Entitäten dargestellt sowie deren Relation. Über ein Menü am unteren Bildschirmrand lässt sich die Darstellung außerdem weiter personalisieren, und bestimmte Charakteristika können ein- oder ausgeblendet werden.

Die Relationenvisualisierung stellt den Treffer in seinem unmittelbaren Netzwerk aus Bezügen zu anderen Datensätzen dar. Hier wird die farbige Darstellung der verschiedenen Entitätentypen wieder aufgegriffen, zusätzlich wird die Art der Relation an den Verbindungen kenntlich gemacht. Der Verbindungstyp zwischen den Datensätzen wird durch die Richtung der Pfeile gekennzeichnet. Die Visualisierung kann verkleinert oder vergrößert und frei auf dem Bildschirm platziert werden. Auch kann die Darstellung auf Verbindungen zwischen den Datensätzen in zweiter und dritter Ebene erweitert werden. Ein Klick auf eine Entität oder Gruppierung von Entitäten blendet außerdem einige Basisinformationen zur ausgewählten Entität am linken Bildschirmrand ein.


Im Zuge der Entwicklung des GND Explorers wurden mehrere Tests zumeist aus einem kleinen Kreis der Community durchgeführt – kleinere Probleme sowie einige Unklarheiten oder Schwierigkeiten bei der Benutzung konnten so frühzeitig adressiert und bereits verbessert werden. Nichtsdestotrotz ist die Veröffentlichung der neuen Version des GND Explorers nur das Ende vom Anfang, denn die Entwicklung des Explorers geht weiter. In der Zwischenzeit freuen uns wir uns über Feedback, Verbesserungsvorschläge oder weitere Anregungen, die wir gerne unter gnd-info@dnb.de entgegennehmen.

Die Trefferliste des GND Explorers einer Suche nach "Deutsche Nationalbibliothek"



Anzeige der Ortsvisualsieriung zur Suche nach "Goethe"



Das Faktenblatt zu Johann Wolfgang von Goethe

Die Ansicht des Faktenblatts zu Johann Wolfgang von Goethe




Die Dokumentation der Auftaktveranstaltung des GND Forum Museen und Sammlungen ist online

Am 6. März 2023 lud ein breites Bündnis aus der Museumswelt und den wissenschaftlichen Sammlungen an Universitäten gemeinsam mit der Arbeitsstelle für Standardisierung der Deutschen Nationalbibliothek Forschende und Mitarbeitende aus Museen und Sammlungen zum GND-Forum Museen und Sammlungen ein. Ziel war der Austausch über den derzeitigen Einsatz kontrollierter Vokabulare und der Gemeinsamen Normdatei (GND) in den Museen und Sammlungen.  Diese dienen der Verbesserung der Interoperabilität der Daten aus Museen und Sammlungen. Das Interesse an diesem ersten GND-Forum Museen und Sammlungen war groß, die Teilnehmer*innenzahl lag weit über 350 und fast alle arbeiteten bis in den späten Nachmittag mit. Das nebenstehende digitale Whiteboard dokumentiert die rege Diskussion und Ergebnisorientierung der Teilnehmenden.

Ideen, wie es weiter gehen könnte:

  • ein Mapping der verwendeten Fachvokabulare und Thesauri wie zum Beispiel den AAT, Iconclass, Wikidata oder die OBG mit der GND durch die über das GNDmul-Projekt vorgestellten Arbeitsprozesse (siehe GND-Mappings zu externen Thesauri)
  • die Software-Anbieter für die Erschließung von Objekten in Museen und Sammlungen dazu motivieren, die Verknüpfung mit Normdaten unmittelbar zu integrieren, ggf. mit direkten Schnittstellen für die Abfrage von GND-IDs aus dem eigenen System heraus
  • in einem Folgetreffen vorstellen, was das Gründen einer Interessengruppe Museen und Sammlungen im GND-Netzwerk beinhaltet könnte

Die vollständige Dokumentation mit

  • allen Vorträgen
  • allen Mitschnitten
  • einer sorgsam kuratierten Linkliste
  • und Berichten zu den einzelnen Programmblöcken

hat das Organisationsteam zusammengestellt und auf der Website des Deutschen Museumsbundes veröffentlicht. Bitte klicken Sie auf

https://www.museumsbund.de/museumsforum/gnd-forum-dokumentation/


Abonnieren Sie diesen Blog, wenn Sie über weitere Veranstaltungen und Aktivitäten im GND-Forum Museen und Sammlungen informiert bleiben möchten.


Wenn man auf die Abbildung klickt, gelangt man auf das Board und kann sich in die Beiträge vertiefen. Das Board öffnet sich über den Gastzugang.


Was ist ein GND-Forum?

Lesen Sie hierzu GND-Forum. Ein Diskursraum für Communities

Bericht vom ersten projektübergreifenden Arbeitstreffen der GND-Agenturen mit Fokus auf Datenimport. Ein Beitrag von Stefan Buddenbohm (SUB) und Barbara Fischer (DNB)


Am 20. April 2023 trafen sich auf Einladung der Arbeitsstelle für Standardisierung an der Deutschen Nationalbibliothek und der Niedersächsischen Staats- und Universitätsbibliothek Göttingen für ein erstes Arbeitstreffen Mitarbeitende aus ganz unterschiedlichen Bereichen und Projekten. Ihnen allen ist daran gelegen, am Ausbau und an der Modernisierung der Gemeinsamen Normdatei (GND) aktiv mitzuwirken. Ein wesentliches Qualitätsmerkmal der GND ist ihre Zuverlässigkeit. Für deren hohe Datenqualität zeichnen vor allem die “zuliefernden” Agenturen mit ihrer Redaktionsarbeit und den erprobten Abläufen verantwortlich. Charakteristisch für die Arbeit der etablierten GND-Agenturen – bspw. in den bibliothekarischen Verbundzentralen – ist, dass sie beständig und regelmäßig in der GND arbeiten. Es besteht eine Kontinuität in Gestalt der beteiligten Anwender und Anwenderinnen, eine verlässliche Kommunikation mit der Community der Datengeber und anderen Anwendergruppen, sowie der sichere Gebrauch des Regelwerks.

Die neuen Agenturen holen auf.
Screenshot des im Treffen durchgeführten Mentimeters. Zum Vergrößern bitte auf das Bild klicken.

Neue und im Aufbau befindliche GND-Agenturen

Mit der Nationalen Forschungsdateninfrastruktur (NFDI) und auch in anderen Kontexten, wie die Fachinformationsdienste, Museen und Archive, entwickeln zunehmend neue Nutzendengruppen und Datengebende einen Bedarf an GND-Normdaten. Mit Blick auf die NFDI sind dies die Konsortien mit geistes-, sprach- und kulturwissenschaftlicher Ausrichtung, also NFDI4Culture, NFDI4Memory, NFDI4Objects sowie Text+. Für diese Community, aber auch für andere Datendomänen im Kulturbereich, befindet sich derzeit eine Reihe von neuen GND-Agenturen und Redaktionen im Aufbau, um deren spezifischen Bedarfe zu adressieren und so die Nutzung und Anreicherung der GND voranzutreiben. Diesen Prozess unterstützt maßgeblich das DFG geförderte Projekt GND4C mit seinen Partnern.

Die eingangs angesprochene und geteilte Expertise der etablierten GND-Agenturen ist für die in Planung bzw. im Aufbau befindlichen Agenturen von zentraler Bedeutung. Mit Fokus auf den Aspekt Lieferwege in die GND trafen sich daher Beteiligte aus der GND-Zentrale, GND-Redaktionen in den Verbundzentralen sowie aus verschiedenen GND-Agenturen im Aufbau. Die 29 Teilnehmerinnen und Teilnehmer deckten “agenturmäßig” so unterschiedliche Domänen wie Archive, Bauwerke, Darstellende Künste, Museen, Provenienzforschung, Sprach- und Textdaten ab.

Die GND-Agenturen als zentraler Partner für die Integration neuer Communities.
Credit: Chantal Köppl (DNB), CC BY-SA 4.0 Mai 2022 Zum Vergrößern bitte auf das Bild klicken.

Themen, die die GND-Agenturen bewegen

Die im Vorfeld durchgeführte Fragen- und Themensammlung ergab folgende Fragen:

  • Wie ist das Verhältnis einer Agentur zu einer Redaktion?

  • Welche Rolle können die Verbundzentralen einnehmen?

  • Was bedeutet Community-Arbeit aus Sicht einer Agentur?

  • Welche Anforderungen stellt eine Agentur an die Daten gebenden Einrichtungen in Bezug auf die Daten?

  • Welche Verfahren lassen sich für den Abgleich mit der GND nutzen (Entwicklungsstand)?

Für das erste Arbeitstreffen votierte die Mehrheit für die letzte Frage.

Beteiligungsmöglichkeiten in der GND

Neben stehend findet sich ein Überblick über die Beteiligungsmöglichkeiten innerhalb der GND. Eine ganz wesentliche Rolle für die Umsetzung der Bedarfe spielen die GND-Agenturen. Die neu im Aufbau befindlichen Agenturen sind die konkreten Ansprechpartner für neue Communities im GND-Netzwerk.  Über viele Jahre erstellten die in den bibliothekarischen Verbundzentralen etablierten Agenturen die Datensätze der GND kollaborativ vornehmlich nach den Bedarfen der Bibliotheken. Der laufende Öffnungsprozess möchte man die GND reichhaltiger, vielfältiger und integrativer für Beiträge aus dem ganzen Kultur- und Forschungsbereich machen, nicht zuletzt um auch die Normdaten-Arbeit auch auf mehr Schultern zu verteilen. Große Bedeutung für den Austausch der Agenturen und Redaktionen mit ihren jeweiligen Nutzendencommunities kommt den Foren zu.  Das GND-Forum ist ein mittlerweile etabliertes Dialog-Format für thematisch oder Datendomänen spezifische Communities, zu dessen Auftakt die Bedarfsermittlung und Interessenvermittlung zwischen GND und Anwendenden und Nutzenden steht. Sie sind der richtige Ort, um neu in ein Thema einzusteigen, Ideen vorzustellen oder Fragen zu erörtern. Die Foren sind ein wichtiger Resonanzraum für die GND-Agenturen. Bisher wurden GND-Foren zu fünf Schwerpunkten eingerichtet: Archive, Bauwerke, Darstellende Kunst, Museen und Sprach- sowie Textwissenschaften. Im Rahmen der GND-Foren finden immer wieder neue Veranstaltungsangebote stat, um gemeinsam zu lernen und sich als Community auszutauschen. Dieses Arbeitstreffen war jedoch keinem bestimmten Forum zugeordnet, sondern versteht sich bewußt als ein projekt- und Community übergreifendes Arbeitstreffen.


Zum thematischen Fokus des Arbeitstreffens 

Drei Vorträge dienten als Impuls für die Diskussion der Teilnehmenden am ersten Arbeitstreffen der GND-Agenturen rund um das Thema “Import neuer Datensätze" in die GND. Zwei Impulse kamen aus im Aufbau befindlichen GND-Agenturen ergänzt durch einen Beitrag der GND-Zentrale. Sie alle beleuchteten aus unterschiedlichen Perspektiven Fragen zum Datenimport: Datenharmonisierung, Datenabgleich und Datenintegration. Gerade für die Integration neuer Communities in das GND Netzwerk steht am Anfang oft der Bedarf nach einem Datenimport fehlender Entitäten, die aber für die Verknüpfung von Ressourcen dringend gebraucht werden.

Lieferungsworkflow in entityXML an die GND.
Credit: Uwe Sikora (All Rights Reserved), SUB Göttingen, April 2023. Zum Vergrößern bitte auf das Bild klicken.

entityXML

Stefanie Rühle (Gruppe Metadaten und Datenkonversion an der SUB Göttingen) stellte mit entityXML ein konkretes Arbeitsergebnis des GND-Tasks in Text+ vor. Der GND-Task, angesiedelt in der Task Area Infrastructure/Operations und gemeinsam verantwortet von SUB und DNB, richtet sich während der Projektlaufzeit von Text+ in erster Linie an die drei Datendomänen: Editionen, Sammlungen und lexikalische Ressourcen; darüber hinaus aber auch an weitere Forschende und Einrichtungen, die mit text- und sprachbasierten Forschungsdaten arbeiten. Ziel ist es, die Nutzung der GND zu verbessern, insbesondere auch bisher noch nicht mit der GND verknüpfte Forschungsdatenbestände mit Normdaten anzureichern und ggf neue Normdaten an die GND einzubringen. Die Importdaten beziehen sich derzeit hauptsächlich auf Personen und Werke und werden konkret an drei Vorhaben erprobt, die an der Universität Göttingen bzw. der Niedersächsischen Akademie der Wissenschaften verortet sind: der Klaus Mollenhauer-Gesamtausgabe, den Carl Schmitt-Tagebüchern sowie den Gelehrten Journalen und Zeitungen der Aufklärung. entityXML dient dabei nicht nur als Werkzeug zur Bearbeitung von Daten, sondern ist gleichzeitig auch ein Austauschformat. Die Dokumentation des derzeitigen Entwicklungsstandes ist frei verfügbar unter https://entities.pages.gwdg.de/entityxml/ sowie unter https://gitlab.gwdg.de/entities/entityxml verbunden mit der Einladung zur Kommentierung. Die Folien zum Vortrag sind unter GND-Agentur_Text+_v2.pptx.pdf vollständig nachzulesen.

Ein Blick in die webbasierte GND4C Toolbox.
credit: Erdal Ayan (ThULB Jena) , CC BY-SA 4.0 April 2023. Zum Vergrößern bitte auf das Bild klicken.

GND4C-Toolbox

Der zweite Impuls von Erdal Ayan und Michael Markert (beide Thüringer Universitäts- und Landesbibliothek (ThULB)) stellte die im Projekt GND4C in Entwicklung befindliche Toolbox vor, die ebenfalls dazu dienen soll, die GND anzureichern, sprich die Importdaten zu redigieren und validieren. Im Fokus stehen dabei Daten zu Personen, Bauwerken und Geografika. Aus diesem Grund bietet die Toolbox als Funktion ein Matching gegen verschiedene Dienste an, neben der GND, etwa Wikidata und OpenStreetMap. Eine Testinstanz des Dienstes, der 2024 in den Produktivbetrieb gehen soll, ist für Agenturpartner aus GND4C schon auf den Servern der ThULB zugänglich. Die Toolbox wird Open Source bereitgestellt und ist grundsätzlich für die Nutzung für andere Projekte und GND-Interessierte vorgesehen. Die Folien zum Vortrag sind unter ea_presentation_20_04_2023.pdf  vollständig nachzulesen.


Der Workflow für Batch-Importe aus der Sicht der Datengeber.
Mehr Information. credit: Sarah Hartmann (DNB), CC BY-SA 4.0 April 2023. Zum Vergrößern bitte auf das Bild klicken.

Batch-Importe in die GND

Der dritte Impuls wurde durch Sarah Hartmann (DNB) beigesteuert, die aus der Praxis größerer Paketeinspielungen in die GND berichtete. Erfüllt ein Datenbestand die Eignungskriterien der DNB, bietet er sich für den Import als Paket an. Im Alltag der GND-Agenturen der Verbundzentralen werden täglich circa 1000 neue GND-Datensätze manuell erfasst. Das Einspielen ganzer Pakete neuer Datensätze in die GND ist eher der Ausnahmefall. In projektorientierten Kontexten kann es aber erforderlich sein, größere Konvolute en bloque in die GND zu integrieren. Beispielsweise kann im Zuge eines Editions-Projektes die Integration von bisher nicht erfassten Akteurinnen und Akteuren, Orten oder Schlagworten notwendig werden, um Ressourcen aus dem Projekt für die gesamte Community verknüpfen zu können und damit sichtbarer zu machen. Dies würde bspw. dem Bedarf in Text+ durchaus entsprechen. Die Umfänge, über die gesprochen wird, reichen von wenigen hundert bis tausenden neuer Datensätze. Damit ist klar, wo die Herausforderungen liegen. Da eine manuelle Erfassung mit den projektüblichen personellen Ressourcen in den Projekten nicht skaliert, es jedoch keine Massen- oder Bulkimports ohne vorangegangene Qualitätsprüfung gibt, braucht es semi-automatische Verfahren, die den Bulk-Import unterstützen. An der DNB gibt es hierfür ein Approvalsystem mit einen angedockten Match & Merge Verfahren. Voraussetzung ist jedoch, dass die Daten auf das GND Datenmodell gemappt wurden und im Marc21 Format vorliegen. Für viele Datengebende sind daher die Anwendungen entityXML und die GND4C Toolbox wichtige Arbeitshilfeangebote, um ihre Daten für den GND Ingest vorzubereiten. Die Folien zum Vortrag von Sarah Hartmann sind unter GND_Import_20230420.pdf vollständig nachzulesen.


Der Batch-Import als Alternative oder als Einstieg in die Alltagsroutine der Erfassung von Normdaten

Ob Bulk-Upload, Batch-Import oder Masseneinspielung – auch wenn die Begrifflichkeit kontrovers diskutiert wurde, scheint klar: sowohl der von Sarah Hartmann vorgestellte Praxisbericht als auch die Tools aus Text+ und GND4C bieten für GND-Agenturen potenziell eine Arbeitserleichterung, wenn es um das projektorientierte Anreichern von Beständen bzw. deren Integration in die GND geht. Im Kontext der NFDI können Hilfsmittel wie entityXML oder die GND4C-Toolbox für die Anreicherung der GND mit Daten aus dem reichen Bestand der NFDI-Konsortien und anderen Communities sehr nützlich sein. Die vorgestellten Werkzeuge/Verfahren stellen den im Aufbau befindlichen GND-Agenturen in Aussicht, leichter neue Datenbestände für die GND aus projektorientierten Kontexten mittels semi-automatischer Verfahren erschließen zu können. Die mit dem Stichwort “projektorientierter Kontext” einhergehenden Beschränkungen, vor allem hinsichtlich zur Verfügung stehender Arbeitszeit und bibliothekarischer Expertise, dürfen nicht zu Lasten des Qualitätsanspruchs der GND gehen. Die genannten Werkzeuge/Workflows adressieren diesen Aspekt bspw. mittels iterativer Validierungsschleifen sowie einer obligatorischen redaktionellen Prüfung der Daten vor dem Import in die GND.

Der Batchimport in die GND geht mit Blick auf die bisher übliche, gängige Arbeitspraxis für Normdatenimporte in der GND also mit einem gewissen Kulturwandel einher: Parallel zur manuellen Erfassung von einzelner Normdatensätze im Zuge des Erschließungsalltags, haben die oben genannten Ansätze das Ziel, in kürzerer Zeit größere Bestände zu verarbeiten. Dies ist notwendig, weil die sich in projektorientierten Kontexten bietenden Zeitfenster üblicherweise überschaubar sind. Die Verfahren sollen sicherstellen, dass die Qualität der GND dabei nicht gefährdet wird. Über die im Aufbau befindlichen GND-Agenturen, bspw. Text+, bietet sich die Gelegenheit, die vorgestellten Verfahren zu erproben. 

Das G in GND – Etablierte und neue GND-Agenturen im Austausch 

Der oben skizzierte Unterschied zwischen der etablierten Praxis des manuellen Bearbeitens von einzelnen Datensätzen als Erfassungsroutine und  der Erprobung anderer Verfahren - wie dem Batchimport - spiegelt sich auch in den GND-Agenturen wieder. Der Bedarf für weiteren Austausch liegt also auf der Hand. Dementsprechend votierte die überwiegende Mehrheit der Teilnehmenden für eine Fortsetzung des Dialogs. Alle Interessierten können sich gern an die Veranstalter mit Vorschlägen für Themenschwerpunkte  wenden, oder sie direkt in das offene Notizbuch der Arbeitsgruppe eintragen.

Das nächste Treffen ist für Anfang 2024 geplant. Abonnieren Sie gern diesen Blog, um keine Veranstaltung zu verpassen.