Blog

 Über einen Dienst, der beim Abgleich der eigenen Datensammlung mit der Gemeinsamen Normdatei hilft.

Autoren:

Adrian Pohl und Fabian Steeg beide hbz


Mit der Nutzung von Identifikatoren der Gemeinsamen Normdatei (GND) in Datensets von Gedächtnisinstitutionen oder Forschungsprojekten werden die Daten Teil eines reich verlinkten Wissensgraphen. Unter reconcile.gnd.network wird ein Dienst angeboten, der den automatisierten Abgleich größerer Listen von Personen, Organisationen, Orten, Veranstaltungen etc. mit Einträgen in der Gemeinsamen Normdatei (GND) unterstützt und auf einer kollaborativ entwickelten, öffentlich dokumentierten und damit interoperablen Schnittstelle basiert.

Motivation


Immer wieder kommt es vor, dass Menschen Listen von Personen, Organisationen, Sachbegriffen oder andere Entitäten mit der GND abgleichen wollen, beispielsweise um Politiker*innen, Orte oder Bauwerke mit der GND zu verknüpfen. Ziel dieses Abgleichs, im Englischen Reconciliation genannt, ist die Verknüpfung der Einträge einer Datenquelle auf der Basis von Namen (einer Person, eines Ortes, eines Schlagworts etc.) und ggf. weiterer Angaben mit jeweils einem GND-Identifikator. Auf der Basis dieses Abgleichs können die lokalen Daten dann mit zusätzlichen Angaben aus der GND erweitert werden.

Entsprechende Anforderungen entstehen regelmäßig in verschiedenen Kontexten, zum Beispiel in Forschungsprojekten, in Migrationsprojekten bibliothekarischer Datenbanken oder im Kontext der Integration existierender lokaler Normdaten in die GND im Zuge der Öffnung der GND für Daten aus den Archiven, Museen und anderen Kulturgut bewahrenden Einrichtungen. Eine vielfach in diesem Kontext genutzte Software ist OpenRefine, das allgemein die Säuberung, Vereinheitlichung und Anreicherung von Daten innerhalb einer vertrauten tabellarisch organisierten Oberfläche unterstützt.

Das Hochschulbibliothekszentrum des Landes Nordrhein-Westfalen (hbz) bietet seit sieben Jahren eine Reconciliation-Schnittstelle an, die etwa bei der Arbeit mit OpenRefine für den Abgleich von Daten mit der GND angesprochen werden kann, siehe den Blogbeitrag “GND Reconciliation for OpenRefine”. Der Dienst stieß auf rege und stetig steigende Nachfrage, siehe etwa die Zugriffszahlen für 2024. Im Juni 2024 veröffentlichten die Deutsche Nationalbibliothek (DNB) und das hbz ein Memorandum of Understanding, in dem sich beide Partner u.a. darauf einigten, die Reconciliation-Schnittstelle offiziell unter reconcile.gnd.network anzubieten, um deutlich zu machen, dass es sich hier um einen durch Mitglieder der GND-Kooperative dauerhaft und verlässlich bereitgestellten Dienst handelt. Dieser Schritt ist nun umgesetzt.

Nutzung

Der Dienst zum Abgleich von Daten mit der GND kann z.B. in OpenRefine genutzt werden. Im entsprechenden Anwendungsdialog zur Auswahl eines Reconciliation-Dienstes wird dann lediglich https://reconcile.gnd.network/ eingegeben. (Die vorherige URL https://lobid.org/gnd/reconcile wird weiterhin unterstützt.)

Aber auch andere Clients können den Dienst nutzen, etwa die Alma Refine App zur Ergänzung entsprechender Funktionalitäten im Bibliotheksmanagementsystem Alma. (Eine Liste sonstiger Reconciliation Clients wird hier gepflegt.)

Fragen zur Nutzung des Dienstes werden gerne im metadaten.community-Forum beantwortet.

Weiterführende Informationen

Es existiert eine Vielzahl an Tutorials und anderen Materialien zur Nutzung der Datenabgleich-Funktion, insbesondere in OpenRefine. Hier eine Auswahl:


Für Details des zugrunde liegenden Protokolls und zur Vorbereitung seiner Standardisierung innerhalb einer Community Group des World Wide Web Consortium (W3C) siehe:

round, chain, old, dirt, macro, cycling, worn, oil, reconciliation, fatty, bicycle part, bicycle chain, bicycle drivetrain part

Reconciliation: 

the process of comparing different accounts etc. in order to check that they add up to the same total or to explain any differences between them

 (Definition nach Cambridge dictionary)

Credit: public domain, via pxhere

Dokumentation des GND Forums NFDI, FID und Co


Auch wenn sich noch weitaus mehr Menschen für das GND Forum NFDI, FID & Co am 10. Dezember 2024 angemeldet hatten, so waren wir von den tatsächlich teilnehmenden 250 Menschen wirklich sehr angetan. Für die Teilnehmenden hatte das Team der Niedersächsischen Staats- und Universitätsbibliothek Göttingen und der Arbeitsstelle für Standardisierung der Deutschen Nationalbibliothek aus den Communities der geisteswissenschaftlichen Konsortien der Nationalen Forschungsdateninfrastruktur (NFDI), den Fachinformationsdiensten der Wissenschaften und weiteren Forschungsvorhaben einen Strauß an Vorträgen zu einem dichten Programm zusammengestellt.

Das GND Forum NFDI, FID & Co lud so alle Interessierten ein, sich über aktuelle Vorhaben zur Gemeinsamen Normdatei (GND) im deutschsprachigen Raum zu informieren. Da es sich im Wesentlichen um eine Informationsveranstaltung handelte, liegt der Schwerpunkt der Dokumentation auf der Bereitstellung der Folien zu den neun Vorträgen. Die Vorträge behandelten die unterschiedlichen Aspekte der Arbeit mit der GND aus verschiedenen Perspektiven und stellten die Rolle der GND für die unterschiedlichen Communities vor. Die meisten Vorträge kann man gut mit der Kategorie ”Werkstattbericht” beschreiben. Sie waren so heterogen in Inhalt und vorausgesetztem Wissen, wie das Publikum selbst. Der neunte Vortrag rundete das Programm mit einer Präsentation einer Pilotanwendung für eine KI-gestützte Inhaltserschließung ab. Nebenstehend das vollständige Programm.

Das Programm






GND-Serviceangebote für Forschende 

Im ersten Block dominierten die Serviceangebote rund um die GND für Forschende spezifischer Fachrichtungen. Neben Beratung zum Mehrwert der Verknüpfung eigener Daten mit GND Identifikatoren im Sinne der FAIR Prinzipien und Recherche nach geeigneten Entitäten in der GND, umfasst das Angebot auch die Neuansetzung von GND Normdatensätzen “on demand”. Zentrale Frage aus dem Chat zu diesem Block war daher: “Diskutieren Sie mit den Forschenden Kriterien für die Aufnahme von Entitäten in die GND oder werden prinzipiell alle Wünsche umgesetzt?” Die Antwort auf die Frage orientiert sich einerseits an den Eignungskriterien der GND. Auch die Service-Angebote der Fachinformationsdienste wie die Forschungsprojekte RISM und Qalamos legen GND Datensätze regelkonform im Rahmen der bekannten Verbundstrukturen an. Zum anderen wächst die Einsicht in die Notwendigkeit, hier mit allen Stakeholdern sowohl communityseits als auch innerhalb der GND-Kooperative Lösungen zu finden, die den Bedarfen jeweils gerecht werden.

Vielversprechende Lösungen könnten sowohl die Entwicklung von Relevanzkriterien für den community-spezifischen Bedarf sein, als auch die Formulierung bestimmter Anwendungskontexte. Diese Anwendungskontexte betreffen z. B. die Normdatenerfassung für Produktionen und Ereignisse in den darstellenden Künsten, für Werke der Musik, die nicht (mehr) als Publikation existent sind, auf die dennoch referenziert werden soll oder für Textfragmente der Orientalistik.

Screenshot zur Vielfalt der Communities



Der erste Vortrag des Tages wurde vom FID-Netzwerk  “Künste und Kultur” bestritten. Es trugen vor: Franziska Voss (FID Darstellende Kunst), Elisabeth Hufnagel (FID musiconn) und Maria Effinger (FID arthistoricum). 

GND-Forum_musiconn, arthistoricum, FID DK_2024.pdf 
Vortrag des FID Netzwerks "Künste und Kultur"

Der zweite Vortrag von Anett Krause und Christoph Rauch (beide Staatsbibliothek zu Berlin) galt dem Portal Qalamos, das Handschriften und historische Textobjekte aus dem Nahen Osten und Indien in Sammlungen in Deutschland repräsentieren möchte. Das Portal selbst verfügt über ein wachsendes Repositorium lokaler Normdaten. Von diesen werden in Zusammenarbeit mit dem FID Nahost die Daten in die GND übernommen, die den Eignungskriterien der GND entsprechen.

 Vortrag zu dem Portal Qalamos

Den dritten Vortrag zu dem Projekt im Rahmen von NFDI4Culture, die Musikwerknormdatensätze aus dem Repositorium RISM mit der GND zu verknüpfen, hielten Desirée Mayer und Alexander Faschon (beide Sächsische Universitäts- und Landesbibliothek Dresden (SLUB)). Sie stellten neben dem eigentlichen Projekt den geplanten GND-Editor vor, der in die Erschließungsumgebung des Muscat integriert werden soll. Gemeinsam mit dem FID für Musikwissenschaften musiconn möchte man sich für die offene Diskussion zur Erfassung von Werknormdatensätzen der Musik in der GND und Regelungen dafür einsetzen.

Vortrag zu RISM

Den Abschluss machte folgerichtig Barbara Fischer (DNB), indem sie auf die beiden kurz vor der Veröffentlichung stehenden einführenden E-Learnings für Forschende im GLAM-Bereich zur GND-Nutzung und Mitarbeit in der GND in einem kurzen Impuls verwies. Die beiden Module werden es sicherlich allen Interessenten der zuvor vorgestellten Serviceangebote erleichtern, diese wahrzunehmen, da die Module das dazu erforderliche Basiswissen zum Selbststudium vermitteln.

Impuls zu den GND-E-Learnings

Sich der GND nähern

Wer mag, kann die vier Vorträge des zweiten Blocks in einer leicht veränderten Reihenfolge auch als einen schrittweisen Annäherungsprozess der eigenen Daten an die GND lesen. Der Bogen spannt sich von ganz grundsätzlichen Überlegungen im NFDI4Objects Konsortium zur Standardisierung von Daten und ihre Anreicherung mit verschiedensten Normdaten und kontrolliertem Vokabular, über eine verdichtete Zusammenstellung von Kriterien zur Beschreibung von Objekten zum Minimaldatensatz, weiter zu einer detaillierten Darstellung, wie man mit Hilfe von openRefine seine Daten schließlich mit den gewünschten Normdaten anreichert bis hin zur Beschreibung des Workflows für das Ansetzen neuer GND Normdaten und deren Übermittlung als Batch-Import im Datenformat MarcXML an die GND-Zentrale, damit sie diese nach einer letzten Validierung in die GND aufnimmt.




Anja Gerber (Klassik Stiftung Weimar) schilderte in ihrem Vortrag die schon weit gediehenen Überlegungen des NFDI4Objects Konsortiums zur Standardisierung der doch sehr differenten Daten dieser Community.

Den Vortrag finden Sie bei Zenodo publiziert.

Vortrag zu NFDI4Objects

Sophie Rölle (SLUB) und Domenic Städtler (Institut für Museumsforschung) warben für die Nutzung der Empfehlungen des Minimaldatensatzes für Museen und Sammlungen und den dort gesetzten Verweisen auf die GND als PID-System.

Das Slidedeck finden Sie bei Zenodo publiziert.

Vortrag zur Minimaldatensatzempfehlung

Für Hanna Meiners, die leider ihren Vortrag nicht selbst halten konnte, sprangen ihre Kolleg*innen Klaus Bulle und Julia Rössl (alle drei Deutsches Dokumentationszentrum für Kunstgeschichte (DDK)) ein. Die Folien erläutern detailliert und textreich, die teilautomatisierten Arbeitsprozesse am DDK zur Anreicherung der Daten im Bildindex mit Normdaten aus der GND und Wikidata.

Vortrag zur Datenanreicherung

In Sinne einer schrittweisen Annäherung an die GND böte sich jetzt der dreiteilige Vortrag von Christine Erfurth (Bayerische Staatsbibliothek), Johannes Haslauer (Staatsarchiv Bamberg) und Uwe Sikora (GND Agentur Text+ ) zu einem Vorhaben im Rahmen von NFDI4Memory an. Im Programm stand er jedoch an dritter Stelle des zweiten Blockes. Ein über Deutschland verteiltes Team ging gemeinsam vor, um Daten zu selektieren, aufzubereiten und in die GND einzubringen. Denn während man in Bamberg die nötige inhaltliche Expertise zu den historischen Personen hatte und die Daten in die nun schon bekannte Anwendung openRefine einspielte, konnte man mit der Expertise der GND-Agentur in München die Personen identifizieren, die noch nicht in der GND enthalten waren, und so weit die Daten strukturieren und ergänzen, dass sie für regelkonforme Personendatensätze in der GND geeignet waren. Diese wurden nun mit Hilfe der Göttinger und der Anwendung entityXML in das Datenformat MarcXML konvertiert. Der Arbeitsprozess ist im GitLab der GWDG zur Nachnutzung dokumentiert. Im letzten Schritt wird man die Daten an die GND-Zentrale in Frankfurt übergeben, die sie nach einem Validierungsprozess in die GND aufnimmt.

Vortrag zum Arbeitsprozess



Ein Ressourcen sparender Ansatz

Den letzten Vortrag hielt Cecilia Maas (Aureka). Sie stellte ausführlich bis in die technisch-mathematischen Details dar, wie sie prototypisch und mit guten Ergebnissen mittels Künstlicher Intelligenz gestützter Verfahren dem Stadtmuseum Berlin bei der automatisierten Inhaltserschließung von Zeitzeugeninterviews helfen konnten. Die Anwendung wird konstant weiterentwickelt und ist bereits jetzt generell für die meisten textbasierten Ressourcen einsetzbar.

Das Slidedeck des Vortrags ist hier dokumentiert.

Vortrag zur KI gestützten Erschließung



Die Veranstaltung war ein Versuch, im Rahmen des Dialogformats der GND-Foren quer über die Communities hinweg zu aktuellen Vorhaben zu informieren. Herausgekommen ist eine kleine GNDCon. Die Teilnehmerzahlen belegen das große Interesse an solchen Informationsangeboten durchaus neben den mehr interaktiven Formaten der Veranstaltungen im Rahmen der community-spezifischen GND-Foren oder den deutlich kleineren projektübergreifenden Arbeitsgruppen “Community-Empowerment” und “Agenturentreffen”.

Doch wir wollen es gern etwas genauer wissen, und laden Sie daher ein, unseren kurzen Fragebogen zu beantworten. Ihre Antworten dienen uns als Orientierung, welche Angebote wir im kommenden Jahr machen werden. Bleiben Sie uns gewogen und genießen Sie die Festtage.

Weiterführende Links aus dem Chat 

(sofern nicht bereits  im Fließtext integriert)


Sechste Veranstaltung zur PID-Landschaft des DFG-Projektes PID Network Deutschland: Die Gemeinsame Normdatei als ein PID-System für Kulturelle Objekte in GLAM-Institutionen. Eine Dokumentation

GLAM: 

GLAM ist das englische Akronym für galleries, libraries, archives and museums und hauptsächlich in der digitalen Transformation gebräuchlich.



Am 4. Dezember fand die nunmehr sechste Veranstaltung zur Ausleuchtung der Bedarfe und Angebote in zehn verschiedenen Anwendungsfelder von Wissenschaft und Forschung für persistente Identifikationssysteme (PID) statt. Die Workshopreihe ist eine der Säule der Untersuchungen des Projektteams PID Network Deutschland, bestehend aus den Partnereinrichtungen Helmholtz Open Science Office , Universitätsbibliothek Bielefeld, Technische Informationsbibliothek Hannover (TIB), Datacite und der Deutschen Nationalbibliothek, für die Ausarbeitung einer nationalen PID Roadmap zur Orientierung für Wissenschaft und Politik. Im Fokus standen diesmal kulturelle Objekte und ihre Kontexte (Link zur Workshop Ankündigung). Im Gegensatz zu anderen Anwendungsfeldern, wie wissenschaftliche Instrumente, Projekte, Organisationen oder Forschungsdaten, ging es hier nicht um Identifikatoren für einzelne Kulturobjekte, wie zum Beispiel die Steinaxt aus der Sammlung eines Museums für Vor- und Frühgeschichte, ein Röhrenradio aus dem Bestand eines Technikmuseums oder eine Videoinstallation in einer Kunstgalerie, sondern vielmehr um unterschiedliche PIDs in den Metadaten zu diesen Objekten. Die umfängliche Gemeinsame Normdatei (GND) mit ihren sechs Entitätstypen ist im GLAM-Bereich bereits gut eingeführt, wie auch die Umfrage unter den ca. 130 Angemeldeten zeigte. Danach gaben drei Viertel an, gelegentlich oder regelmäßig die GND anzuwenden (Diagramm 2).  Ein gutes Ergebnis vor dem Hintergrund, dass nur ein knappes Viertel der Beteiligten einen bibliothekarischen Hintergrund angab (Diagramm 1). Hierzu nebenstehend die beiden Diagramme:

        

Diagramm 1: Selbstkategorisierung in Bezug auf das Berufsfeld

Diagramm 2: Selbsteinschätzung in Bezug auf die Vertrautheit mit der GND

Nach einem Überblick über das Gesamtprojekt durch Steffi Genderjahn vom Helmholtz Open Science Office (siehe die nebenstehenden Folien), ging es im folgenden Beitrag von Barbara Fischer (DNB) um die Einsatzmöglichkeiten der GND in wissenschaftlichen Sammlungen in Museen und Archiven. Drei Perspektiven wurden skizziert: die GND in der Recherche zu Literatur und Material. Die Nutzung von GND-Normdaten in den Metadaten der Sammlungsobjekte und schließlich, wie man verfährt, sollte ein Normdatensatz noch nicht Teil des GND Datenbank sein. Die nebenstehenden Folien ganz rechts mit dem entsprechenden Vortragstext bieten zu den drei genannten Perspektiven Auskunft. 

Vortrag von Steffi Genderjahn

Vortrag von Barbara Fischer

Kernstück des Workshops war die Präsentation der Betaversion der beiden E-Learnings, die interaktiv und barrierefrei als Einführung in die Nutzung der GND Normdaten und Mitarbeit in der GND Kooperative Anfang kommenden Jahres publiziert werden sollen. Das erste Modul mit dem Titel “Einfach normiert. Eine Einführung in die Nutzung der GND” beinhaltet die Punkte:

  • Grundlegender Einblick in die GND
  • Vorteile und Potenziale der GND Nutzung
  • Verwendung der GND als Recherchetool
  • Verknüpfung von Forschungsdaten mit GND-IDs

Das zweite Modul “Mitarbeiten in der GND. Eine Einführung in die GND Anwendung” widmet sich den Themen:

  • Tiefergehendes Wissen in die Struktur der GND
  • Kennenlernen der GND-Kooperative und des Netzwerks
  • Einblick in die verschiedenen Möglichkeiten Normdaten in die GND einzupflegen

Nach einer kurzen Vorstellung (Folien nebenstehend ) des Produktionsprozesses und der Funktionsweise der beiden Module durch Gina Drost von der beauftragten Media-Agentur Fischer Knoblauch und Co nutzten gut die Hälfte der Anwesenden die Gelegenheit, die Module zu testen. In zwei Gruppen gaben sie differenziertes Feedback, das noch vor der Publikation in der Masterversion berücksichtigt werden soll.

Insgesamt kamen beide Module gut an. Man fand sie einladend und intuitiv in der Bedienung. Das zeigen die Abbildungen 1 und 2 stellvertretend für beide Module.


Vortrag von Gina Drost

Abbildung 1  Meinungsbild zum Modul 2 Einschätzung des Storytellings

Abbildung 2  Meinungsbild zum Modul 2 Einschätzung des Distributionspotentials

zum Vergrößern bitte jeweils auf das Bild klicken

Wesentliche Punkte im Gespräch waren der Wunsch nach mehr weiterführenden Links und eine Absenkung der Einschätzung der für den Durchgang eines Moduls erforderlichen Zeit von 50 auf eher 30 Minuten. Insgesamt wurde auch in diesem Workshop deutlich, dass es vor allem an Ressourcen in den Einrichtungen fehlt, um wirklich umfassend PID-Systeme wie die GND in die Arbeitsroutinen der Erschließung zu integrieren. Angebote wie die beiden E-Learnings helfen, sich das notwendige Wissen hierfür anzueignen. Doch bleibt am Ende festzustellen, für die gelingende Verknüpfung von Ressourcen, die Verbesserung ihrer Sichtbarkeit und Nachnutzung durch Dritte braucht es noch mehr und vor allem dauerhafte Unterstützung auf der Leitungsebene und durch die Politik als Fördermittelgeber, um die gewünschte Datenqualität zu gewährleisten.

Voraussichtlich zu Beginn des Jahres 2025 werden die beiden E-Learnings online zugänglich sein. Wir informieren in diesem Blog darüber.

Der Workshop wurde vom DFG-geförderten Projekt PID Network Deutschland veranstaltet. Mehr Informationen zu vergangenen und künftigen Veranstaltungen finden Sie hier

Neun Berichte aus der Praxis auf dem GND Forum NFDI, FID & Co

#GNDforum


In den vergangenen Monaten haben wir uns schon mehrfach im kleinen Kreis zum Arbeiten  getroffen und uns gegenseitig von unseren Vorhaben und Plänen erzählt. Jetzt ist es Zeit, die Ergebnisse einem größeren Publikum zu präsentieren und zu diskutieren. Auf dem GND Forum NFDI, FID & Co erwarten Sie insgesamt neun Vorträge aus dem wachsenden Netzwerk der Gemeinsamen Normdatei (GND). Allen gemeinsam ist, sie wollen mit zuverlässigen Normdaten ganz unterschiedliche Ressourcen verknüpfen und dabei vor allem die Fehlermeldung 404 mittels dauerhafter und gepflegter URIs vermeiden. Sie nutzen deshalb das Persistent Identifier (PID) System GND.


Am Vormittag können sich alle Gäste einen Überblick verschaffen, wie in einzelnen Bereichen der Forschung die Arbeit schon heute mit der GND aktiv unterstützt wird. Es geht sowohl um Beratung als auch um konkrete Normdaten-Edition. Wir beginnen mit einem Besuch der GND-Services im FID-Netzwerk Künste und Kultur. Die FID-Koryphäen Maria Effinger, Elisabeth Hufnagel und Franziska Voss laden zu einem Schulterblick ein. Weiter geht es mit der GND in den Bereich der Orientalistik. Anett Krause und Christoph Rauch stellen die Normdaten im Qalamos-Portal vor. Alexander Faschon und Desirée Mayer berichten über ihre Arbeit unterschiedliche PID-Systeme, nämlich das Répertoire International des Sources Musicales (RISM) und Werkdatensätze in der GND, aufeinander abzustimmen. Den Vormittag beschließt Barbara Fischer mit einer Kurzpräsentation zweier E-Learnings, die künftig Einführungen einmal in die GND-Nutzung und zum anderen in die Mitarbeit in der GND zum Selbststudium bieten werden.


Am Nachmittag berichtet uns Anja Gerber über den Umgang mit Normdaten im Rahmen von NFDI4Objects. Sophie Rölle und Domenic Städtler beleuchten die Rolle der GND im Minimaldatensatz zu Objekten des kulturellen Erbes. Im Anschluss leiten wir dann über auf Werkstattberichte über die Nutzung von OpenRefine in der Kombination mit EntityXML in einem Forschungsprojekt im Rahmen von NFDI4Culture. Hier präsentieren Christine Erfurth, Johannes Haslauer und Uwe Sikora ihre Erfahrungen. Der zweite Werkstattbericht kommt von Hanna Meiners. Sie arbeitet ebenfalls mit OpenRefine aber ihr Fokus liegt auf der Qualitätssicherung und Anreicherung der Sammlungsdaten mit GND.


Kaum eine Konferenz mag heute auf das Buzz-Thema "Künstliche Intelligenz" verzichten. Auf dem GND Forum stellt Cecilia Maas daher vor, wie durch den effektiven Einsatz von KI basierter Methoden, Verschlagwortung von textbasierten Ressourcen automatisiert werden kann.

Durch PIDs zum Beispiel Fehlermeldungen vermeiden. Wozu Normdaten sonst noch zu gebrauchen sind, können  Sie am 10.12.24 erfahren.
credit: https://www.digitalmesh.com/blog/how-to-find-and-fix-404-not-found-error/ 

Das vollständige Programm mit genauen Zeiten

(vorbehaltlich von ablaufbedingten Verzögerungen)

  • 09:45 Uhr: Begrüßung
  • 10:00 Uhr: Ansichten auf die GND-Arbeit

    • Maria Effinger, Elisabeth Hufnagel und Franziska Voß: Die GND-Services im FID-Netzwerk Künste & Kultur
    • Anett Krause und Christoph Rauch: Normdaten-Entitäten für orientalische Handschriften: Gegenwärtige Praxis, Probleme und Perspektiven im Qalamos-Portal
    • Alexander Faschon und Desirée Mayer: Musikalische Werknormdaten und Quellen
    • Barbara Fischer: Arbeiten mit der GND - Zwei einführende Kurse zum Selbststudium
  • 12:00 Uhr: Mittagspause
  • 13:00 Uhr: Ansichten auf die GND-Arbeit

    • Gerber, Anja: Forschungsdaten in NFDI4Objects
    • Sophie Rölle und Domenic Städtler: Die Minimaldatensatz-Empfehlung für Museen und Sammlungen
    • Christine Erfurth, Johannes Haslauer und Uwe Sikora: OpenRefine meets entityXML and Marc21
    • Hanna Meiners: Strategien zur Datenanreicherung und Qualitätssicherung unter Einsatz von Normdaten und OpenRefine
  • 15:00 Uhr: Pause
  • 15:10 Uhr: Cecilia Maas: KI-gestützte Erschließung mit der GND
  • 15:30 Uhr: Resümee und Ausblick
  • 16:00 Uhr: Veranstaltungsende

Termin

Dienstag der 10. Dezember 2024

Start 09:45 Uhr

Ort

online nach Anmeldung.

Wir haben durch einen Lizenzwechsel Platz für mehr Teilnehmende geschaffen!
GND Forum NFDI, FID & Co

Im Anschluss an das Forum werden wir, soweit es uns möglich ist, die Folien der Vorträge hier mit Ihnen teilen.

Der sechste Workshop der Reihe der PID Network Deutschland Workshops zu PID Systemen

Das DFG-Projekt PID Network Deutschland lädt Forschende und Mitarbeitende in GLAM-Einrichtungen ein, die GND als PID System kennenzulernen. Die Gemeinsame Normdatei (GND) bietet zehn Millionen Entitäten, mit denen persistent und maschinenlesbar kulturelle Objekte und deren Kontexte beschrieben werden können. Zwar ist die explizite Auszeichnung von individuellen Kulturobjekten als Normdatensätze in der GND nur beim Vorliegen eines entsprechenden übergeordneten Bedarfs an Referenzierung möglich, dennoch kann durch die Verknüpfung von Aussagen zu den einzelnen Objekten mit entsprechenden GND-IDs der Kontext zum Objekt beschrieben und vor allem die Sichtbarkeit kultureller Objekte durch die eindeutige Referenzierung erhöht werden. Während PID Systeme wie ORCID, ROR oder Getty-AAT meist Identifikatoren (IDs) für nur einen bestimmten Entitätstypen vorhalten, bietet die GND in einem PID System IDs zu sechs unterschiedlichen Kategorien an. Datensätze zu Personen, Organisationen, Orten, Allgemein- und Individualbegriffen, Werken und Konferenzen bilden einen eigenen Wissensgraphen, der über den GND Explorer erforscht werden kann. Die Bedeutung der GND für die Verbesserung der Metadatenqualität kultureller Objekte wird am 4. Dezember eine zentrale Rolle spielen. Ein Kurzvortrag beleuchtet zu Beginn des Workshops das reichhaltige Verknüpfungspotenzial der GND. Der Schwerpunkt des Workshops liegt jedoch auf der Präsentation von zwei E-Learning-Modulen. Sie bieten eine Einführung in die mitunter komplexe Arbeit mit der GND.  

Im Rahmen des DFG-Projekts PID Network Deutschland hat die Deutsche Nationalbibliothek die Entwicklung und Bereitstellung von barrierefreien E-Learning-Modulen als Open Educational Ressource für zwei spezifische Zielgruppen beauftragt. In diesem Seminar werden die beiden E-Learning Module erstmals einer Fachöffentlichkeit vorgestellt. Es gibt ausreichend Platz zum Testen, für Fragen und konstruktives Feedback.

  1. Modul für Nutzende der GND: Dieses Modul richtet sich an alle, die mit GND Identifikatoren arbeiten möchten. In einer modernen und interaktiven Lerneinheit werden die Vorzüge von Normdaten sowie die Grundzüge der Recherche von GND-Identifikatoren vermittelt. Die Teilnehmenden lernen, wie sie effektiv mit den bereitgestellten Daten umgehen können und welche Vorteile eine strukturierte Nutzung von Normdaten für ihre Forschungs- und Arbeitsergebnisse hat.

  2. Modul für Editor*innen und Anwender*innen: Dieses Modul bereitet potenzielle Anwender*innen auf die Redaktionsarbeit in der GND vor. Hier werden wichtige Aspekte wie die Qualitätssicherung von Datensätzen, das korrekte Anlegen neuer Einträge sowie das Ergänzen und Korrigieren bestehender Datensätze behandelt. Die Teilnehmenden erhalten praxisnahe Einblicke in die Arbeitsabläufe der GND und werden befähigt, aktiv zur Verbesserung der Datenqualität beizutragen.

Beide Module wenden sich an Mitarbeitende in Galerien, Museen und wissenschaftlichen Sammlungen, die Inhalte lassen sich jedoch ebenso auf weitere Anwendungsbereiche in der Forschung oder im Archivwesen übertragen.



Bitte melden Sie sich über diese PID Network Deutschland Seite an. 

Der Workshop ist kostenfrei und findet am 4. Dezember online von 13:00 bis 16:00 Uhr statt.

Eine Anmeldung ist erforderlich: https://gfz-potsdam-de.zoom.us/meeting/register/u5ApfuupqTkiG9Gt0HFnmqL3KwGTN-MFU2WG#/registration


Programm

13:00 Begrüßung

13:15 Impulsvortrag: Die Funktion der GND in der Beschreibung kultureller Objekte; Barbara Fischer (DNB)

13:30 Präsentation der Module 1 und 2; Gina Drost (FKC)

14:30 Kurze Pause

14:35 Zeit zum Testen der Module und anschließendem Austausch in Breakout Sessions 

15:00 Diskussion der Eindrücke aus den Sessions

15:40 Kurze Pause

15:45 Wrap up und Ausblick auf den weiteren Verlauf des Projektes 

16:00 Ende der Veranstaltung


Veranstalter sind die Projektpartner von PID Network Deutschland in alfabetischer Reihenfolge: Datacite, Deutsche Nationalbibliothek, Helmholtz Open Science Office, Technische Informationsbibliothek Hannover (TIB) und Universitätsbibliothek Bielefeld. Das Projekt wird gefördert durch die Deutsche Forschungsgemeinschaft.


aktualisiert


Was tut sich in der IG Museen und Sammlungen?

Ein Jahr nach der Gründung der GND Interessengruppe Museen und Sammlung (IG MuS) im Rahmen der Herbsttagung der Fachgruppe Dokumentation 2023 des Deutschen Museumsbundes findet das zweite GND Forum Museen und Sammlungen statt. 

Auf dem ersten GND Forum im Frühjahr 2023 tauschten sich gut 350 Teilnehmende über den derzeitigen Einsatz kontrollierter Vokabulare und der Gemeinsamen Normdatei (GND) in den Museen und wissenschaftlichen Sammlungen aus. Die komplette Dokumentation mit allen Vorträgen, zum Teil auch Mitschnitte und eine weiterführende Linkliste findet sich auf den Seiten des Deutschen Museumsbundes, der die Initiative maßgeblich unterstützt. Auf diese Veranstaltung ging dann im Herbst 2023 gegründete IG MuS zurück.

Im Zentrum des Interesses steht der Einsatz von Normdaten wie der GND zur verbesserten Vernetzung der Daten und Objekte im digitalen Raum der Museen und Sammlungen. Die Veranstaltung richtet sich an alle, die bei Erschließung und Dokumentation in Museen und Sammlungen mit Normdaten, kontrollierten Vokabularen und Terminologien arbeiten, diese (weiter-)entwickeln oder sich vertieft in diesen Bereich einarbeiten möchten. 

Hierzu beleuchten wir zum einen die Ergebnisse der von NFDI4Object in Auftrag gegebene Umfrage zur Nutzung von kontrolliertem Vokabular. Sie bestätigt u.a. den bereits auf dem ersten Forum gewonnenen Eindruck, dass die Vernetzung von Daten noch noch eine offene Flanke ist. Alle Ergebnisse dann am 25.11. direkt von den Macher*innen der Umfrage, Johannes Schäffer und Magdalena Schlösser. Nach der Mittagspause geht es um die Interessengruppe selbst. Wer ist hier aktiv? Was hat sie sich vorgenommen und in welchem Umfeld agiert sie? Die Sprecher*innen Gesa Grimme (Koordinierungsstelle wissenschaftliche Universitätssammlungen), Katja Hofmann (Staatliche Kunstsammlungen Dresden) und Frank von Hagel (Institut für Museumsforschung) stellen die IG vor. Barbara Fischer (DNB) gibt einen kurzen Überblick zum Stand der Integrationsarbeit neuer Communities in die GND-Kooperative. Anschließend präsentieren die Arbeitsgruppen innerhalb der IG MuS ihre Vorhaben. In kleineren Gruppen können diese Ideen und Ansätze diskutiert werden. Alle Teilnehmenden sind eingeladen, sich aktiv in die AGs einzubringen, gern auch nach der Veranstaltung.

Die drei Schwerpunkte der Arbeitsgruppen spiegeln die auf dem ersten Forum genannten Bedarfe der Museen und Sammlungen:


  1. Wir brauchen mehr Wissen über die GND und verwandte Belange  right arrow  AG Wissensvermittlung
  2. Wir wollen besser verstehen, wie GND Datensätze angelegt werden und die Möglichkeit bekommen, auf diese Regeln Einfluss zu nehmen right arrow  AG GND Dokumentation
  3. Wir wollen (hauseigene) Fachvokabulare mit der GND verknüpfen und einzelne Begriffe auf die GND gemappen right arrow  AG Fachthesauri und Mapping

Den Abschluss des Tages bildet der Vortrag von Sebastian Ruff (Stiftung Stadtmuseum Berlin). Er gibt uns einen Einblick, wie es dem Museum gelang – trotz knapper Arbeitsstunden – Zeitzeugen-Interviews  mit kontrolliertem Vokabular aus der GND gut verschlagwortet in die Sammlung des Stadtmuseums zu integrieren. Spoiler: KI spielt eine Rolle. 

Das Forum ist öffentlich, kostenlos und online. Sie müssen sich nur anmelden.


Das Programm im Einzelnen

Zeit

Programm

Referent*innen

10:00

Begrüßung

die Sprecher*innen der IG 

Gesa Grimme, Katja Hofmann und Frank von Hagel

10:15

Zur Nutzung von kontrolliertem Vokabular, Thesauri und Normdaten in Museen und Sammlungen Präsentation der Auswertung der Umfrage des

Instituts für Museumsforschung und Koordinierungsstelle Wissenschaftliche Universitätssammlungen im Auftrag von NFDI4Objects  

mit anschließender Diskussion in kleineren Gruppen

Johannes Schäffer und Magdalene Schlösser

11:15

Pause


11:30

Die IG MuS 

zum Status quo

die Sprecher*innen der IG 

11:50

Die Öffnung der GND

zum Status quo

Barbara Fischer

12:00

Mittagspause


13:00

Themen und Programm der drei Arbeitsgruppen 

mit anschließender Diskussion in Breakout Räumen

mit Vertreter*innen aus den Arbeitsgruppen

14:00

Pause


14:15

KI im Einsatz 

ein Impuls aus der Praxis der Stiftung Stadtmuseum Berlin mit anschließendem Austausch

Sebastian Ruff

15:15

Resümee und Ausblick

die Sprecher*innen der IG 

16:00

Veranstaltungsende


Illustration des Themas hergestellt mit ChatGPT von Frank von Hagel (IfM SM Berlin) 2024


Zweites GND-Forum Museen und Sammlungen

Termin:

Montag, der 25. November 2024

von 10:00 bis 16:00 Uhr online 

Anmeldung erforderlich



Die veranstaltenden Einrichtungen:


Bitte melden Sie sich über GND.Network oder diesem Link zur Veranstaltung an. Sie erhalten dann spätestens ab dem 21.11.2024 den Link zur VC-Konferenz.


Wenn Sie für Ihre Community Interesse an der Gründung einer Interessengruppe im Netzwerk der GND oder der Ausrichtung eines GND-Forums haben, dann schreiben Sie uns bitte unter gnd-info @ dnb.de

Eine kleine Einführung zur Nutzung der GND in der Erschließung von Objekten in Museen und Sammlungen bieten diese Folien: 


credit: Barbara Fischer (DNB), CC BY, 2024


Die Dokumentation des 4. GND Forum Archiv liegt vor.

Bereits zum vierten Mal traf sich Ende September die Archiv-Community im GND Forum Archiv. Im Fokus des Austausches standen diesmal zum einen die Arbeitsergebnisse der IG Archiv und zum anderen drei Praxisbeispiele zur Anwendung der GND im archivischen Arbeitsalltag. Die vorgestellten Resultate machen deutlich: Die Archiv-Community ist schon mittendrin im GND Netzwerk.

Alle Details 

  • zur Handreichung zum Einsatz der der Gemeinsamen Normdatei in Archiven, 
  • zu den Relevanzkriterien für die Normdatenansetzung in Archiven und 
  • Tools und Anwendungen zur Arbeit mit der GND in Archiven

können Sie in der ausführlichen Dokumentation im STA-Community Wiki nachlesen und über weiterführende Links vertiefen. In der Dokumentation finden Sie auch die Folien der drei Impulsvorträge.


Das fünfte GND Forum Archiv findet voraussichtlich Anfang April 2025 statt. Wir werden Sie informieren.

Die veranstaltenden Einrichtungen

Ein Fenster wie eine Einladung – das Historische Archiv der Stadt Köln am Heumarkt. © Raimond Spekking / CC BY-SA 4.0 (via Wikimedia Commons)

In wenigen Tagen findet das 4. GND-Forum statt. Die Veranstaltung ist online, kostenlos und öffentlich. Ein extra Anmeldung ist nicht erforderlich. 

Seit das GND-Forum Archiv im Herbst 2022 zum ersten Mal stattfand, ist es fast schon zu einer kleinen Tradition geworden: Als Forum für alle Themen rund um die Nutzung der Gemeinsamen Normdatei GND im Archivbereich bietet es die Möglichkeit zur gegenseitigen Information und zum Austausch in großer Runde, aber auch zur gemeinsamen Weiterentwicklung archivischer Themen im Rahmen der GND-Arbeit.
Die IG Archiv lädt herzlich ein zum

4. GND-Forum Archiv (online) "Normdaten in der archivischen Erfassung" 

am 23. September 2024 von 9.30 bis 12.30 Uhr

Meetlinglink: https://eu02web.zoom-x.de/j/65872106460?pwd=WnRQYmNjcGxOQkJmdnFsWk9iSWhFQT09
Das 5. GND-Forum informiert über Neuigkeiten, unter anderem zum aktuellen Stand bei den GND-Agenturen und -Redaktionen. Die drei Arbeitsgruppen der "Interessengruppe Archiv" stellen ihre ersten Ergebnisse vor, die den Einsatz von Normdaten im Archiv erleichtern sollen. Um beim Forum diese Arbeitspapiere mitzudiskutieren, sind Sie herzlich eingeladen, vorab einen Blick hineinzuwerfen. Die Arbeitspapiere stehen hier unter dem Reiter „Arbeitspapiere“ online zur Verfügung.
Abschließend gewähren Kolleginnen und Kollegen aus dem Kreisarchiv Storman, den Staatlichen Archiven Bayerns und vom Landesarchiv Baden-Württemberg in Impulsreferaten Einblicke, wie die GND derzeit genutzt wird, um Erschließungsdaten noch besser auffindbar und sichtbar zu machen.
Das GND-Forum ist die zentrale öffentliche Plattform für alle Interessierten, die unter dem organisatorischen Dach der "Interessengruppe Archiv" im GND-Netzwerk an der Entwicklung teilhaben möchten. Die Teilnahme steht Vertreterinnen und Vertretern aller Archivsparten - und stets auch neuen Teilnehmenden - offen, das Forum kommt 1-2mal jährlich zusammen. Um über Neuigkeiten und Termine in der IG Archiv auf dem Laufenden zu bleiben, können Sie sich in die Mailingliste der IG Archiv eintragen lassen (https://lists.dnb.de/mailman/listinfo/ig_archiv).
Das GND-Forum und die Treffen der Arbeitsgruppen werden stets dokumentiert (zugänglich unter https://wiki.dnb.de/display/STAC/IG+Archiv+%7C+Veroeffentlichungen%2C+Vortraege+und+Veranstaltungen). Hier finden Sie auch die anschauliche Dokumentation des 3. GND-Forums, das am 24. November 2023 online stattgefunden hat (https://wiki.dnb.de/pages/viewpage.action?pageId=311789986)

Ein Fenster wie eine Einladung – das Historische Archiv der Stadt Köln am Heumarkt. © Raimond Spekking / CC BY-SA 4.0 (via Wikimedia Commons)

Das Programm im Einzelnen

9:30
Begrüßung
mit Dr. Mirjam Sprau und Andrea Langner
9:35
GND-Update
mit Barbara Fischer und Dr. Patrick Leiske
9:55
Präsentation: Handreichungen und Positionspapier der Arbeitsgruppen zum Einsatz der GND im Archiv
mit Dr. Mirjam Sprau, Simon Göllner, Dr. des. Johannes Haslauer und Verena Mack
Moderation: Andrea Langner
10:30
Austausch und Feedback
Breakout-Sessions zu den Handreichungen und zum Positionspapier
10:50
Zusammenfassung
Berichte aus den Breakout-Sessions – wie geht es weiter?
mit Dr. Patrick Leiske
11:20
Pause
11:30
Impulse
  • Die GND im Kreisarchiv Stormarn: Das Stormarn Lexikon 
    mit Dipl.-Archivar (FH) Stefan Watzlawzik (Kreisarchiv Stormarn)
  • Hands-on Normdaten! Projekt der Staatlichen Archive Bayerns zur Implementierung der GND in die Erschließungsworkflows (NFDI4Memory-Incubator)
    mit Dr. des. Johannes Haslauer und Maximilian Stimpert M.A. (Statsarchiv Bamberg)
  • GLAM goes OPEN DATA. Wikidata-Editathon und der Nutzen von Normdaten
    mit Dr. Patrick Leiske (Landesarchiv Baden-Württemberg)
12:10
Abschlussdiskussion
12:25
Wrap-up und Ausblick

Detailinformation zu den Ergebnissen der Arbeitsgruppen und der IG Archiv insgesamt:


Die Veranstalter

Wie immer werden die Ergebnisse des GND Forums im Anschluss dokumentiert und publiziert. 


In den geisteswissenschaftlichen Forschungsdisziplinen und Kulturwissenschaften spielen Daten in immer größer werdenden Umfang eine bedeutende Rolle. Um der Masse der Daten Herr zu werden, ist Forschungsdatenmanagement gefragt. Universitäten unterstützen ihre Forschenden bei der Erschließung ihrer Forschungsdaten oder zumindest bei der Erschließung der Metadaten, mit deren Hilfe die Forschungsdaten beschrieben werden, durch die Mitarbeitenden in den Universitätsbibliotheken und Fachinformationsdienste. Die Bibliothekar*innen nutzen dabei die Gemeinsame Normdatei (GND) als brückenbauendes Vokabular. Welche neuen Anforderungen dadurch auf die GND zukommen und welche Rolle der Einsatz von Künstlicher Intelligenz einnehmen könnte, diskutierten auf der BiblioCon in Hamburg 2024 Fachleute in einem Panel. Hier eine kurze Zusammenfassung der Diskussion:

Die Notwendigkeit, Forschungsdaten beziehungsweise zumindest die Metadaten zu den publizierten Datensets mittels des Einsatzes der GND interoperabler und nachnutzbarer zu machen, bekräftigte die gesamte Session. Die Diskussion mit dem Publikum oszillierte zusammenfassend zwischen zwei Polen. Auf der einen Seite die am Horizont dräuende KI mit ihren ebenso verlockenden wie bedrohlichen Perspektiven. Da steht die Erwartung insbsondere der Entscheidungsträger und Finanziers, mittels KI ließe sich alles automatisieren und damit enorm viel Arbeit rationalisieren, der Befürchtung der Experten gegenüber, dass Menschen, die den Bibliotheken vertrauen, durch falsche Kategorisierungen, verunsichert und enttäuscht werden könnten, bis hin, dass mit der KI fake news und der Verbreitung von Unwahrheiten Tür und Tor geöffnet werden könnten.  Dem kann man durch den verstärkten Einsatz von Normdaten wie der GND in der Erschließung von Forschungsdaten wirkungsvoll entgegnen. Nur – und hier kommen wir zum anderen Pol der Diskussion – für die sachgemäße Erschließung der Forschungsdaten mit der GND fehlt es letztendlich an kompetenten Personal. Diesen Personalmangel allein mit Geld ausgleichen zu wollen, wird nicht reichen. Die Bedeutung der Erschließungsarbeit und Wertigkeit der Normdaten muss noch stärker gegenüber den Entscheidungsträgern und Forschenden kommuniziert werden. Die Zugänge zur Nutzung, Edition und zum Regelwerk also insgesamt der Infrastruktur müssen noch bekannter und attraktiver gemacht werden. Die KI kann helfen, an definierten Stellen, Arbeitsprozesse effizienter zu gestalten, um so Ressourcen für qualitative Entscheidungsprozesse intellektueller Art der Mitarbeitenden frei zu machen. Vor allem aber muss die Zusammenarbeit im Einsatz von GND-Normdaten zwischen den Forschenden aller Sparten, den Bibliotheken und innerhalb der GND Kooperative als elementare Grundlage für die gelingende Organisation von Daten, deren Verdichtung zu Information und Schöpfung neuem Fakten basierten Wissens gefördert werden.

Im Blog der Deutschen Nationalbibliothek können Sie den ganzen Artikel lesen:

https://blog.dnb.de/brueckenbauende-vokabeln/

Inzwischen gibt es einige Angebote in Ergänzung zur eigentlichen biliothekarischen Erschließungsarbeit an Bibliotheken, die sich gezielt an Forschende verschiedener Fachrichtungen richten.

Eine unvollständige Liste von GND-Serviceangeboten für Forschende:

  1. Musikwissenschaften: https://www.musiconn.de/services/musiconnnormdatenservice; SLUB Dresden und BSB München
  2. Performing Arts: https://www.performing-arts.eu/services/gnd/, FID DK
  3. Kunstgeschichte: https://www.arthistoricum.net/service/normdatenservice-kunst, UB Heidelberg
  4. Qalamos Orientwissenschaften https://www.qalamos.net/content/index.xed, SBB Berlin und BSB München
  5.  ...

Wenn Sie noch weitere Angebote kennen, nutzen Sie bitte die Kommentarfunktion. Wir lernen gern von und mit Ihnen.

Network of words, credit Anders Sandberg CC BY via Flickr

Neuigkeiten zur Zusammenarbeit des Hochschulbibliothekszentrums des Landes Nordrhein-Westfalen (hbz) und der Deutschen Nationalbibliothek (DNB)

Die GND-Kooperative besteht aus vielen Partnereinrichtungen. Sie arbeiten im Verbund an der Pflege und Verbesserungen der Gemeinsamen Normdatei (GND). Das umfasst zum einen die tägliche Arbeit mit den Datensätzen und zum anderen die Entwicklung, Instandhaltung sowie den Ausbau von Services, die die Arbeit mit der GND erleichtern.

Die Mitglieder der GND-Kooperative orientieren sich für die Arbeit an den Datensätzen an ihren konsensual vereinbarten Regeln. Für die Arbeit an den ergänzenden Services können sie autonom für sich agieren. Letzteres funktioniert gut und zeitigt Ergebnisse, die von vielen Nutzenden der GND und den neuen Initiativen gern in Anspruch genommen werden. Das gilt auch für den Service lobid-gnd des Hochschulbibliothekszentrums des Landes Nordrhein-Westfalen (hbz) oder das Angebot des GND-Explorers der Deutschen Nationalbibliothek (DNB). Doch noch mehr kann man gemeinsam erreichen und daher werden die DNB und das hbz ab sofort unter anderem den GND-Reconciliation-Service gemeinsam weiterentwickeln. Der GND-Reconciliation-Service unterstützt Anwender*innen bei der Prozessierung ihrer Daten und dem Abgleich mit der GND.

Auch möchten wir alle Leser*innen des GND-Blogs einladen, das Angebot des Forums zu metadaten.community wahrzunehmen, um dort unter der neu eingerichteten GND-Kategorie Ideen zur Verbesserung der GND zu diskutieren oder Fragen zur Nutzung von Features oder der Umsetzung bestimmter Aufgaben zu erörtern. Endlich haben wir ein echtes digitales Diskussionsforum! Wir freuen uns auf Ihre Beiträge dort.

Weitere Details zum gemeinsamen Mitte Mai gezeichneten Memorandum of Understanding zwischen dem hbz und der DNB wurden in eben diesem Forum veröffentlicht und zur Diskussion gestellt. 

Siehe auch Publikation https://www.hbz-nrw.de/aktuelles/nachrichten/gnd-reconciliation-service-kooperation-von-hbz-und-dnb 

Zusammenhänge stärken, screenshot aus dem GND Explorer



Rückblick

Bibliotheken vor den Fragen der Zeit

Die diesjährige BiblioCon mit ihren 4000 Gästen im sonnigen Hamburg kreiste vornehmlich um zwei aktuelle Themenschwerpunkte: Künstliche Intelligenz und die Demokratie in unruhigen Zeiten. Beides Themen, die natürlich die Bibliotheken als “dritte Orte” und ihre Aufgabe als Informationsvermittlerin und Wissensmanagerin direkt betreffen. Ja, beide Themen hängen noch miteinander zusammen, wie die Keynote von Arne Semsrott von “Frag-den-Staat” betonte. Letztlich leistet auch die GND hier ihren Beitrag, indem sie unter anderem eindeutige Sucheinstiege zu Informationen bietet und wir mit der Modernisierung und Öffnung der GND für Wissen Schaffende quer durch Forschung und Kultur dieses Werkzeug zugänglicher machen, auch für die Nutzung in KI-basierten Anwendungen.

Vier Beiträge aus der GND-Zentrale veranschaulichten dies. Zum einen braucht es für jedes Werkzeug eine gute Anleitung zu seinem Gebrauch. Die Vorträge Neue Wege der Wissensvermittlung - Die GND als Thema für E-Learning-Angebote von Barbara Fischer (DNB, AfS) und Gemeinsame Plattform des Standardisierungsausschusses für Standards rund um die Erschließung von Ressourcen von Michaela Edelmann (DNB) stellten zwei aktuelle Produkte zur Gebrauchsanleitung im Portfolio der GND Gemeinschaft vor. Die auf der Plattform abgelegten strukturierten Regeln sind zum einen dadurch auch maschinenlesbar und können mit den eigentlichen Normdaten der GND KI-basierte Anwendungen gegen betriebsimmanente Halluzinationen feien und deren Retrieval verbessern. Zum anderen präsentierte sich die so genannte STA-Community mit ihren Arbeitsgruppen und Expertenteams als Orte des Austausch und Weiterentwicklung der Standards, die für die Erstellung von Normdaten und allgemein zur Erschließung von Kultur- und Forschungsressourcen nötig sind. Aufschlussreichster Moment in dieser Session war für mich die Erkenntnis einer Teilnehmerin, dass die Standards und Regeln überhaupt veränderbar sind und im Konsens der Mitwirkenden gestaltet werden. Damit gewissermaßen die Macht der Legislative in die Hände vieler zu legen, ist das Kennzeichnen einer demokratischen Einrichtung. Wunderbar, dass im deutschsprachigen Raum die “authority files” ebenso gemeinsam erarbeitet werden. Am letzten Tag diskutierten die Panelist*innen die Neuen Anforderungen an Universitätsbibliotheken, Verbundzentralen und die GND durch die Erschließung von Forschungsdaten. Natürlich braucht es für die neuen Aufgaben für alle Beteiligten, ob Forschende, Universitätsbibliotheken, Verbundzentralen oder die Gremien der GND, einerseits entsprechend dauerhaft angelegte Strukturen und Stellen, aber vor allem, braucht es noch mehr Austausch und Verständigung. Mit der Hoffnung, die Künstliche Intelligenz könne uns allen vielleicht hierfür die erforderlichen zeitlichen Freiräume schaffen, endete die #112BiblioCon aus der Perspektive der GND.  Eine Zusammenfassung der Diskussion findet sich als Post im DNB Blog.

Vorankündigung

Vom 4. bis zum 7. Juno findet die diesjährige BliblioCon in Hamburg statt. Auch wer nicht vor Ort dabei sein kann, kann sich noch zum kostenpflichtigen Streaming anmelden oder sich im Nachgang eine Auswahl der Beiträge als Mitschnitt kostenfrei über das TIB AV Portal anschauen. Die Vorträge werden in der Regel im Anschluss allen über den OPUS-Server zu Verfügung gestellt. Es gibt viele spannende Beiträge und Diskussionen nicht nur für Menschen der Bibliothekswelt. Die Themen Standardisierung, Wissensmanagement und Informationsstrukturen betreffen schließlich den gesamten Kultur- und Forschungsbereich.

Im Folgenden verweisen wir auf die Beiträge im Programm, die sich schwerpunktmäßig mit Themen rund um die GND befassen. Unter den Links können jeweils die kurzen Ankündigungstexte und Informationen zu den Referent*innen abgerufen werden.

Alle Angaben vorbehaltlich Änderungen durch die Konferenzleitung.


1) 4.6. Session “Standards als Gemeinschaftsaufgabe” 16:00 bis 18:00 Uhr

Saal G.1 / 2. OG (Streaming)

Normdaten als gemeinsame Aufgabe von FID und NFDI  von Volker Adam (FID Nahost) und Susanne Al-Eryani (Text+)

Community Empowerment am Beispiel der AG Performing Arts des Standardisierungsausschuss (STA) von Franziska Voß (FID DK) und  Melanie Gruß (NFDI4Culture)

Persistent Identifier in Deutschland – Umfrageergebnisse zur Verbreitung und Nutzung an Kultur- und Wissenseinrichtungen von Andreas Czerniak (UB Bielefeld)

Neue Wege der Wissensvermittlung - Die GND als Thema für E-Learning-Angebote von Barbara Fischer (DNB, AfS)

2) 4.6. in der Session “KI und Erschließung: Hilfe oder Sackgasse?” 16:00 bis 18:00 Uhr

Saal C.2 / 1. OG

Gemeinsame Plattform des Standardisierungsausschusses für Standards rund um die Erschließung von Ressourcen von Michaela Edelmann (DNB)

3) 5.6. in der Session “Vernetzung von Sammlungen” 11:00 bis 12:30 Uhr 

Saal G.2 / 2. OG (Streaming)

Die Normierung des Mittelalters – Wie Linked Open Data die kollaborative Forschung und Vernetzung unterstützt von Bernhard Runzheimer (UB Marburg)

4) 5.6. & 6.6. Postersession jeweils 12:45 bis 13:45 Uhr

Ausstellung Halle H

Persistente Identifikatoren – Bekanntes und Neues für Bibliotheken mit Marc Lange (PID Network Deutschland)

5) 6.6.  #Freiraum 11:30 bis 12:30 Uhr

Ausstellung Halle H

Meet the STA Community   mit  Sprecher*innen der STA-AGs, Expertenteams und Interessengruppen und Barbara Fischer (DNB, AfS)

6) 7.6. Diskussionspanel 09:00 bis 10:30 Uhr

Saal 4 / EG

Neue Anforderungen an Universitätsbibliotheken, Verbundzentralen und die GND durch die Erschließung von Forschungsdaten mit Dirk Wintergrün (NFDI4Objects), Antje Theise (UB Rostock); Eike Spielberg (UB Essen), Barbara Fischer (DNB, AfS) und Frank Dührkohp (VZG)

Bildnachweis: Hamburger Rathaus von 'o' wie obacht, CC BY 2.0 , via Wikimedia Commons

Außerdem verweisen wir gern auf den Text+ Blog, dort wird eine Synopsis der Beiträge mit Fokus auf die Nationale Forschungsdaten Infrastruktur und des Konsortiums Text+ zu text- und sprachbasierten Wissenschaften gelegt.


Bericht von dem zweiten Treffen des projektübergreifenden Arbeitskreises der nicht-bibliothekarischen Agenturen

Faschingsdienstag in Frankfurt, während viele Menschen Richtung zum "Klaa Paris - Helau" Umzug in den Frankfurter Nordwesten strebten, bahnte sich eine kleine Gruppe Unentwegter ihren Weg an die Deutsche Nationalbibliothek. Sie folgten einer Einladung der Arbeitsstelle für Standardisierung. Insgesamt präsentierten sich ein Dutzend neuer Gruppierungen und Initiativen, denen allen gemeinsam ist, dass sie die Gemeinsame Normdatei bunter, reicher, vielfältiger, offener bei hoher Qualität machen wollen. Sie nutzen dafür die Infrastrukturangebote, wie GND-Agenturen, Fachredaktionen, Interessengruppen und Arbeitsgruppen des Standardisierungsausschusses, die die GND-Kooperative oft initiiert durch das DFG-Projekt GND4C in den letzten Jahren entwickelt hat. Manche der Initiativen sind noch in der Findung, andere in der Gründung oder im Pilotbetrieb. Bisher ergänzt nur die GND-Agentur LEO-BW-Regional im Dauerbetrieb für Kulturgut bewahrende Einrichtungen in Baden-Württemberg das Angebot der schon lange in den Verbundzentralen tätigen Agenturen für Bibliotheken.

Markieren wir die existenten Initiativen, die bei dem zweiten Treffen der Agenturen vor Ort dabei waren, mit einem (tick):

Sie stellten sich mit einem Poster auf dem Treffen vor. Die Galerie wurde ergänzt durch Poster zu unterschiedlichen Services, wie entityXML oder die GND4C Toolbox, und Infografiken der GND-Zentrale zu Themen wie Datenimport, Organisationsstruktur und GND-Dokumentation. Alle Poster sind in der untenstehenden Galerie aufgenommen. Durch Klicken auf eine Abbildung kann man deren Ansicht vergrößern.

Nach einer Begrüßung durch den Generaldirektor der Deutschen Nationalbibliothek, Frank Scholze, und den "dienstältesten" der so genannten "neuen" Agenturen, Patrick Leiske vom Landesarchiv Baden-Württemberg, hatten die Teilnehmenden Zeit, sich auf das folgende Speeddating vorzubereiten. Die ausgestellten Poster entlang der Fensterfront boten viel Information zu den anwesenden Partnern und damit Anknüpfungspunkte für Ideen zur Zusammenarbeit, Entdeckung gemeinsamer Anliegen und Lücken. Ein Ziel der Veranstaltung war die Stärkung des Netzwerkes der Einrichtungen, aber vor allem der Menschen untereinander.

Wir sind an Ihrem Feedback zu den Postern interessiert. Schreiben Sie uns Ihre Gedanken oder Fragen.

Das Poster führt aus, was mit den unterschiedlichen Phasen auf dem Weg einer GND-Agentur in den Dauerbetrieb gemeint ist.
Credit: Chantal Köppl (DNB), CC BY-SA 4.0 Jan 2024

Gut vernetzt! Ein Klebebild der Relationen.
Credit: Stefan Buddenbohm (SUB), CC BY-SA 4.0 Feb 2024
Die Poster zum Projektübergreifenden Agenturentreffen #2

Die Poster sind lizenziert unter einer Creative Commons Lizenz CC BY SA.

Nach zwei turbulenten Speedating-Runden, die allen Gelegenheit boten, sich intensiv miteinander auszutauschen, etlichen Kannen Kaffee und zum Ende des Nachmittags, kam die Zeit der Ernte. Was hat das Treffen gebracht? Was wurde neben den bilateral geknüpften Beziehungen für die Gruppe als Ganzes erreicht? Welche Themen wollen wir in den kommenden Treffen des Arbeitskreises vertiefen? Und auf welche Lücken der Betrachtung sind wir gestoßen? Antworten wurden auf den unten abgebildeten Metaplanwänden gesammelt.

Die wichtigsten Ergebnisse waren:

  • die im Projekt GND4C entstandene Gesprächsrunde "A-Team" öffnet sich konsequent für alle neuen Agentur- und Redaktionsinitiativen. Bestimmt erinnern sich noch viele an die gleichlautende Fernsehserie aus den Achtzigern. Wie Patrick Leiske es in seiner Begrüßung erklärte, so verdankte sich der Erfolg des A-Teams im Fernsehen dem Zusammenspiel der im Team verankerten unterschiedlichen Talente. Das Prinzip passt wunderbar, bei aller Diversität der Perspektiven, auch auf die Gesprächsrunde der Agenturen. Eine entsprechende Seite für die Terminfindung und Themensetzung wird im Wiki eingestellt.
  • Da viele Einrichtungen, die über die neuen Agenturen Daten in die GND einbringen wollen, das Datenschema LIDO verwenden, ist es sehr zu begrüßen, dass Julia Rössel (DDK) und Uwe Sikora (SUB) die Anwendung entityXML für LIDO ausbauen wollen.
  • Wo immer es möglich ist, möchte man entsprechende Schulungsangebote zur GND-Anwendung für Dritte aus dem Kreis öffnen. Kursangebote und freie Plätze können künftig im Wiki bekannt gemacht werden.
  • Die Optionen für eine aktuelle und nachhaltige Beacon-Registry, die die Verknüpfungen von Daten einzelner Sammlungen mit der GND ausweist, sollen geprüft werden.

Für die kommenden Treffen haben wir drei zentrale Themen identifiziert, die wir gemeinsam intensiver diskutieren wollen:

  • das Verhältnis von Agentur und Redaktion als Organisationseinheiten. Welche Form eignet sich wofür?
  • das Thema Schulung einserseits aus der Perspektive der Didaktik betrachtet (Erfahrungsaustausch) und andererseits thematisch zur GND-Dokumentation und Nutzung der Services wie entityXML oder der GND4C Toolbox
  • Mengengerüst für den Bedarf an neuen GND-Datensätzen, ein Erfahrungsaustausch zu Nachfrage, Qualität und Umsetzung

Irgendetwas fehlt immer! In der Öffnung der GND ist noch vieles offen:

  • Die Satzarten "Personen" und "Geografika" gehen schon ganz gut, aber andere Satzarten wie "Werke" und "Sachbegriffe" sind noch kaum eingeübt. Hier ist auch die STA-Community gefragt. Eine Möglichkeit für den integrativen Umgang mit Sachbegriffen könnte die Einrichtung einer AG Terminologie sein.
  • Aufbau eines Netzwerks innerhalb der GND-Kooperative für Schulungen und Wissensvermittlung gemeinsam mit den etablierten Agenturen in den Verbundzentralen.
  • Bislang beschränken sich die Initiativen auf Deutschland. Was tut sich in Österreich und der Schweiz hinsichtlich der Öffnung der GND? Das sollten wir eruieren.

Welche der genannten Themen würden Sie als Leser*in gern vertiefen?

Wie geht es weiter? Impulse aus den Speeddating Runden auf der Leinwand.
Credit: Chantal Köppl (DNB), CC BY-SA 4.0 Feb 2024
Ergebnisse, Themen und Bedarfe gesammelt auf dem Projektübergreifenden Agenturentreffen #2

Die Poster sind lizenziert unter einer Creative Commons Lizenz CC BY SA.

Insgesamt ein voller Tag in guter Atmosphäre, der Lust auf mehr macht. Im Herbst soll das dritte Treffen des projektübergreifenden Arbeitskreises der nicht-bibliothekarischen Agenturen stattfinden. Vielleicht auch eine gute Gelegenheit sich einen griffigeren Namen zu geben. Wenn Sie mit dabei sein wollen, dann schreiben Sie uns eine Email an gnd-info (at) dnb.de.

Impressionen vom Projektübergreifenden Agenturentreffen #2

Die Poster sind lizenziert unter einer Creative Commons Lizenz CC BY SA.

Vom Suchen und Finden

Literatur und Daten mit kontrolliertem Vokabular finden

Wir wissen nicht, welche Vorschläge Ihnen die Künstliche Intelligenz (KI) Ihres Vertrauens unterbreitet, wenn Sie Hilfestellung bei der Lösung einer Forschungsaufgabe brauchen. Vielleicht lassen Sie sich gleich einen entsprechenden Text schreiben, mit oder ohne Literaturangaben. Letztere sind womöglich einfach nur plausibel klingend, ohne tatsächlich zutreffend zu sein. Vielleicht googeln Sie und bedienen sich unter den ersten zehn Suchergebnissen. Vielleicht gehen Sie auch in die nächstgelegene Bibliothek oder besuchen deren Online-Kataloge im Netz. Wir möchten Sie heute auf eine kurze Anleitung zur Daten- und Literaturrecherche mit kontrolliertem Vokabular hinweisen, die von echten Bibliotheksmenschen geschrieben wurde, und allen ab sofort kostenfrei zu Verfügung steht. 

Der Text erklärt, wie man mittels der Verwendung von Normdaten seine Suchergebnisse nach Literatur und Daten verbessern kann. Dazu wird detailliert erläutert, was Normdaten sind und welche Funktion sie bei der Beschreibung von Objekten wie Publikationen, Forschungsdaten oder Sammlungsgut haben. Im Fokus stehen dabei die Normdaten der Gemeinsamen Normdatei (GND), das zentrale kontrollierte Vokabular für Kultur und Forschung im deutschsprachigen Raum. Im Text werden dann verschiedene Anwendungen vorgestellt, mit denen man in der GND passende Suchbegriffe beispielsweise für die Suche nach geeigneter Literatur zum eigenen Thema findet. Zugleich erfährt man, wie man seine eigenen Texte und Daten durch die Verwendung von Normdaten für Dritte leichter auffindbar und damit sichtbarer machen kann.

Lassen Sie uns wissen, ob und wie sich Ihre Suchergebnisse mit der Gemeinsamen Normdatei verbessert haben. Und wer weiß, möglicherweise hilft kontrolliertes Vokabular ja auch beim Prompt Engineering.

Vom Suchen und Finden. Eine Einführung in die Recherche mit der Gemeinsamen Normdatei.

Vom Suchen und Finden im Netz

Credit: Digital Transformation by Dominic Smith via Flickr CC BY

Ein Blogpost von Susanne Al-Eryani, Chantal Köppl, Patrick Leiske, Jens Lill, Verena Mack, Michael Markert, Julia Rössel, Stefanie Rühle und Uwe Sikora.

GND-Agenturen unterstützen ihre Kund*innen dabei, Daten in die Gemeinsame Normdatei einzubringen.

Auf dem Weg dorthin werden die Daten transformiert, bereinigt, angereichert und in das notwendige Format gebracht. Dafür stehen den Datengebenden und Agenturen verschiedene Werkzeuge zur Verfügung. Abhängig von der Beschaffenheit und Qualität der gelieferten Daten und von der Arbeitsweise der jeweiligen Agentur, kommen ein oder mehrere Tools zum Einsatz.

Welche Funktionen die verschiedenen Tools haben und wie sie von den Agenturen zur Datenprozessierung genutzt werden, lesen Sie in diesem Blogpost

Dazu muss zunächst erwähnt werden, dass sich der nicht unerhebliche Aufwand für eine maschinelle Datenprozessierung erst ab einem gewissen Datenumfang lohnt und es ebenfalls einer gewissen Datenqualität bedarf. Im Vorfeld ist daher anhand einer ersten Datenanalyse zwischen Agentur und Datenlieferanten abzuklären, welche Datenfelder noch aufzubereiten oder um weitere Informationen zu ergänzen sind – auch um den Mindestanforderungen an identifizierenden Merkmalen zu entsprechen, die je nach Entität für einen möglichen GND-Import vorausgesetzt werden. Die Verantwortung für die Auftrennung von z.B. in Fließtexten enthaltenen biografischen Angaben zu Personen in entsprechende Datenfelder für Berufe, Geografika oder Datumsangaben sieht die Agentur auf Seiten der Datenlieferanten. Aus einer Datenlieferung muss auch klar hervorgehen, ob es sich bei einer Ortsangabe um den Geburts-, Sterbe- oder Wirkungsort einer Person handelt (Ähnliches gilt für Datumsangaben). Die GND-Agentur gibt in Form von Schulungen/Workshops Hilfestellung zur Datenaufbereitung und ­bereinigung – die Interpretation von Daten aufgrund nicht vorhandener Datenstrukturen obliegt ihr allerdings nicht. Dies liegt alleinig in der Verantwortung der Datenlieferanten.



Credit: Chantal Köppl (DNB), CC BY-SA 4.0 Jan 2024

Bereinigen, Abgleichen und Anreichern – das bieten die verschiedenen Tools


GND4C-Toolbox

Die GND4C-Toolbox ist ein Werkzeug zum differenzierten und zuverlässigen Matching von Datensätzen auf die GND im großen Stil. Im Hintergrund wird die GND-Schnittstelle von lobid.org eingesetzt, die auch die GND-Abgleiche in OpenRefine ermöglicht. In der Toolbox werden für Personen Abfragen mit verschiedenen Kombinationen von Namensbestandteilen durchgeführt, um das Trefferbild zu verbreitern. Anschließend werden bei der Bewertung der Suchergebnisse auch die von den Datengebenden mitgelieferten Informationen berücksichtigt. Während in OpenRefine eine GND-Suche im Regelfall die ersten 10 Treffer nach Namensähnlichkeit zurückgibt, bewertet die Toolbox bei Personen mit vielen Vor- und Nachnamen manchmal Hunderte von GND-Datensätzen und gewichtet sie unter Einbezug von Lebensdaten, Orten und Berufsangaben. Im Falle von Bauwerken werden auch OpenStreetMap und Wikidata befragt, um über Quervergleiche etwa anhand von Adressdaten oder Koordinaten zuverlässiger entscheiden zu können, ob etwa mit der "Stadtkirche Neustadt" in einem Datenset jene in Holstein oder in Brandenburg gemeint ist.
Gedacht ist die Toolbox als eine pythonbasierte Serveranwendung nicht für individuelle Recherchen etwa bei der Anlage von neuen Datensätzen in einem Erfassungssystem, sondern für Massenverarbeitungen von Daten – wenn es darum geht, Hunderte oder gar Tausende von Datensätzen auf einmal abzugleichen. Sie richtet sich entsprechend nicht an Anwender:innen in einzelnen GLAM-Einrichtungen, sondern an die neuen GND-Agenturen mit ihrem Bedarf für schnelle und zuverlässige Bewertungen von großen Datenmengen in Hinblick auf vorhandene GND-Identifier und Kandidaten für Neuanlagen in der GND.



Personen-Matching in der Toolbox. Es wurden Dubletten in der GND gefunden.
Credit: Michael Markert (ThULB), CC 0, Jan 2024

OpenRefine

OpenRefine, ehemals bekannt als Google Refine, ist eine Open-Source-Software zur Datenaufbereitung und -bereinigung. Es ermöglicht Benutzer:innen, große Mengen von unstrukturierten Daten in tabellarischer Form zu importieren, zu erkunden, zu transformieren und zu bereinigen. OpenRefine wurde entwickelt, um den Datenbereinigungsprozess zu vereinfachen und die Qualität von Datensätzen zu verbessern. OpenRefine kann auf verschiedenen Betriebssystemen ausgeführt werden, einschließlich Windows, macOS und Linux. Es wird über einen Webbrowser bedient, daher wird empfohlen, einen modernen und aktuellen Browser zu verwenden. Unterstützte Browser sind Chrome, Firefox und Safari. Die Bearbeitung der Daten erfolgt jedoch lokal, weshalb nicht zwingend eine Internetverbindung vorhanden sein muss. Für den Datenaustausch besonders relevante Funktionen sind etwa der Import von Daten aus verschiedenen Quellen wie CSV-Dateien, Excel-Tabellen oder JSON, Datenexploration um Muster, Fehler oder Inkonsistenzen in Quelldaten zu identifizieren und nicht zuletzt Transformation und Bereinigung: Mit einer Vielzahl von eingebauten Transformationen können Benutzer Daten manipulieren, kombinieren und bereinigen, um konsistente Datensätze zu erhalten. Zudem können die Daten in OpenRefine über Schnittstellen mit der GND und anderen Normdateien gematcht, abgeglichen und angereichert werden. Bereinigte und transformierte Daten können in verschiedenen Formaten, wie z.B. Marc21 exportiert werden, um sie in anderen Systemen zu verwenden.



GND-Abgleich für Personen in OpenRefine


entityXML

EntityXML ist ein XML-basiertes Datenformat zur Beschreibung von Entitäten. Voraussetzung für das Arbeiten mit entityXML ist eine oXygen-Umgebung. Der oXygen XML Editor bietet u.a. den Vorteil, dass Einträge auch in einem nutzerfreundlichen Author-Modus ediert werden können.
In dem auf der GND-Ontologie basierenden entityXML-Schema können Projekte Entitäten unter Berücksichtigung ihrer spezifischen Charakteristika in einer einheitlichen Struktur beschreiben, was der Agentur ein direktes Mapping auf die Datenstruktur der GND ermöglicht. Darüber hinaus können über individuelle Namensräume projektrelevante Elemente außerhalb des Schemas erschlossen werden, die nicht für den Datenimport in die GND gedacht sind. Eine Überprüfung der Datenqualität ist durch das in entityXML implementierte Validierungsschema Relax NG und dem darin enthaltenen Schematron für Projekt und Agentur gleichermaßen durchführbar. Weiterhin lassen sich mit Hilfe bereitgestellter generischer Transformationsszenarien in entityXML angelegte Daten in andere relevante Datenformate (z. B. JSON) übersetzen. Anhand einer Revisionsbeschreibung werden die einzelnen Schritte des Workflows dokumentiert, Anmerkungen zu den Daten können an direkter Stelle notiert werden, sodass sowohl Kommunikation zwischen Datenlieferant und Agentur als auch das Berichtswesen unterstützt werden. Eine Versionierung der Daten ist möglich.
Mit entityXML können zunächst Personen beschrieben werden, das Format wird aber sukzessive für die Beschreibung weiterer Entitäten ausgebaut.


Beispielset für die Auszeichnung einer Person in entityXML (im Text- und Autor-Modus).


Data Preparation Tool

Das Data Preparation Tool (DPT) ist ein Mappingwerkzeug zur Aufbereitung von (bislang vornehmlich) archivischen Metadaten für die Einspielung in die Portale DDB, Archivportal-D, Archivportal Europa und LEO-BW. Entwickelt wurde das Tool in der DDB-Fachstelle Archiv mit dem primären Ziel, die Erstellung granularer providerspezifischer Anpassungen zu ermöglichen, um einmal umgesetzte Anpassungen für weitere Datengeber nachnutzen zu können.

Es handelt sich beim DPT um eine Python-basierte Desktop-Anwendung, die es ermöglicht, Daten aus beliebigen Quellformaten mit einem Workflow aus aneinander gereihten Python-Modulen zu transformieren. Die Verwendung von Python ermöglicht es etwa, auch Quelldaten aus Excel-Dateien und anderen Datenquellen mit einzubeziehen, sowie Feldinhalte aus verschiedenen Quelldateien gleichzeitig anzureichern.

Kern der XML-Transformation ist die Python-Bibliothek lxml, welche eine fehlertolerante und äußerst performante Verarbeitung der Lieferdaten erlaubt und dabei nur geringe Anforderungen an das Host-System stellt. Neben dem erwähnten Providerskript-Workflow bietet das Tool einige "Maintenance-Funktionen", mit dem Ziel, aus möglicherweise fehlerhaften Lieferdaten möglichst schnell einen sauberen ersten Stand zu erhalten, auf dessen Basis dann der Workflow angewandt werden kann.

Im Rahmen des GND4C-Projekts wurde das DPT um eine MARC-XML-Konkordanz für Personen ergänzt, um Datenlieferungen an die DNB für einen GND-Import übergeben zu können. Diese Erweiterung beinhaltet auch die freie Konfiguration einzelner (GND-interner) Datenfelder, die für einen Import vorausgesetzt werden, in der Regel aber nicht in den Ausgangsdaten der Kultureinrichtungen enthalten sind. In der GND-Agentur LEO-BW-Regional ist das DPT fester Bestandteil der Datenprozessierung.

Die aktuellste, für das GND4C-MARC-XML-Mapping angepasste Version des DPT kann hier heruntergeladen werden:
https://github.com/Deutsche-Digitale-Bibliothek/ddblabs-datapreparationtool/releases/tag/v3.5.0-pre6 (letztes Update: 24.07.2023).

Das DPT wird derzeit zu einer webbasierten Anwendung weiterentwickelt, die die gemeinsame Arbeit an Datenlieferungen an zentraler Stelle ermöglicht. Eine erste Version mit Fokus auf die Anforderungen von archivischen Datenlieferungen wird voraussichtlich bis Ende 2024 in Betrieb genommen.


Einblick in das Data Preparation Tool (DPT)

GND-Webformular

Das GND-Webformular bietet sich für Forschungsprojekte und Kulturinstitutionen an, wie etwa für kleinere Bibliotheken, Archive und Museen. Es ermöglicht ihnen, Personen- und Körperschaftsdatensätze in der GND neu anzulegen sowie bestehende Datensätze zu korrigieren oder zu ergänzen. In den nächsten Monaten wird auch die Erfassung von Gebietskörperschaften über das Webformular möglich sein. Die Nutzung des Webformulars kann sinnvoll sein, wenn man eine kleinere Menge von Normdaten ansetzen oder bearbeiten will. Außerdem bietet es sich beispielsweise begleitend zu Projekten an, in denen laufend Daten erfasst werden und auch neue Normdaten-Kandidaten identifiziert werden. Im Gegensatz zu den Erfassungsclients, die in Bibliotheken zum Einsatz kommen, können Personen und Körperschaften über das Webformular nur mit einer begrenzten Auswahl von Eigenschaften erfasst werden.

Sind die Daten über das Webformular eingegeben, landen sie unmittelbar in der GND. Für die Anwender*innen des Webformulars besteht daher ein großer Vorteil des Tools darin, dass sie die generierte GND-ID direkt im eigenen System einfügen können.

Um das Webformular nutzen zu können, braucht man zum Einen eine Vereinbarung mit einer GND-Agentur, die die eingegebenen Daten prüft und langfristig ihre Qualität sicherstellt. Zum Anderen benötigt man einen ISIL. Der International Standard Identifier for Libraries and Related Organizations ist Bestandteil des QS-Systems der GND, mit dem die Herkunft eines Datensatzes deklariert und nachvollziehbar wird. Einrichtungen können ihn bei der ISIL-Sigelstelle an der Staatsbibliothek zu Berlin beantragen. Weitere Infos zum Webformular finden Sie unter https://www.dnb.de/gndwebformular.



Erfassungsmaske des GND-Webformulars zur Bearbeitung von Personennormdaten in der GND.

So kommen die Tools in den neuen GND-Agenturen zum Einsatz


Die Datenprozessierung der GND-Agentur LEO-BW-Regional. Credit: Jens M. Lill (BSZ), CC BY SA

GND-Agentur LEO-BW-Regional

Im Fokus der GND-Agentur LEO-BW-Regional steht der Ansatz, Kultureinrichtungen aus Baden-Württemberg eine einfache, niedrigschwellige Möglichkeit anzubieten, wie diese ihre benötigten Datensätze unkompliziert und ohne allzu großen Aufwand in die GND einbringen und auch unmittelbar nachnutzen können. Dreh- und Angelpunkt der Agenturservices stellen daher die GND-Webformulare der DNB dar, für die regelmäßig Schulungen angeboten werden. Als Agentur unterstützen wir die Kultureinrichtungen bei der Klärung der Zugangsvoraussetzungen und Kommunikation mit der GND-Zentrale und übernehmen die Redaktion und Qualitätssicherung der neu eingetragenen oder bearbeiteten Normdatensätze. Auch für OpenRefine werden Workshops und Selbstlernkurse angeboten, um Kultureinrichtungen in die Lage zu versetzen, ihre Bestands-/Sammlungsdaten selbst analysieren, bereinigen und verbessern zu können.

OpenRefine kommt auch eine besondere Stellung innerhalb der Agenturarbeit an größeren Datensets (bislang nur für Personen) zu, um diese für einen GND-Import aufzuarbeiten. In verschiedenen Arbeitsschritten werden die Personendaten analysiert und bereinigt (u.a. Vereinheitlichung von offensichtlichen Schreibfehlern, geschlechtsspezifische Anpassung von Berufsangaben, Bereinigung von Datumsangaben in ein einheitliches Format) sowie mit der GND abgeglichen und ggf. um weitere Angaben ergänzt (für einen späteren Import in die GND müssen v.a. für Berufs- und Ortsangaben die äquivalenten GND-Nummern nachgeladen werden). Nach diesem Pre-processing werden die Datensets mittels Python-Skripten in ein GND4C-internes Datenformat transformiert, um im Data Preparation Tool die Ergänzung von für einen GND-Import relevanten Datenfelder automatisiert vornehmen zu können. Abschließend erfolgt die Ausgabe des Datensets im MARC-XML-Format zur Übergabe an die GND-Zentrale.





Exemplarischer Datenfluss zwischen Datengebenden, GND-Agentur und GND-Zentrale. Credit: Chantal Köppl (DNB), CC BY SA

Deutsches Dokumentationszentrum – Bildarchiv Foto Marburg | Bauwerke-Redaktion

Institutionen wie Denkmalfachämter, bauhistorische Forschungs- bzw. Publikationsprojekte, wie etwa Dehio digital (DDK 2022) oder auch das Bildarchiv Foto Marburg selbst produzieren Daten zu Bauwerken in sehr unterschiedlichen Datenbank- bzw. Erfassungssystemen. Zudem ist die Standardisierung im Bereich der Bauwerke noch nicht so weit fortgeschritten, wie z.B. in Museen oder Bibliotheken. Zunächst muss intellektuell geprüft werden, welche der Informationen, die in den Quellsystemen bzw. lokalen Erfassungsdatenbanken erhoben werden, für die künftigen Normdatensätze übernommen werden sollen. Für den beiderseitigen Austausch nutzt die Pilot-Agentur – gewissermaßen als Übersetzungshilfe – das Anwendungsprofil Bauwerke. Bauwerke werden in der GND als Geographika (Entitätencode GIB) geführt. Hierzu gehören Ingenieurbauten, bauliche Ensembles, archäologische Stätten mit Baudenkmälern, aber auch Bauskulpturen oder freistehende Objekte wie Monumentalplastik, Denkmäler oder Brunnen. Bislang gibt es kein Webformular, sodass die Erfassung für die GND händisch oder über Masseneinspielung geschieht. Um Bauwerks-Daten in Normdaten umzuwandeln und in die GND einspeisen zu können, werden sie in der Pilot-Agentur Bauwerke mit OpenRefine vorverarbeitet. Hier werden der Standort in Form einer Ortsangabe und der Objekttyp in der GND als instantieller Oberbegriff definiert,  mit GND-IDs schon vorhandener Entitäten gemachted, sofern diese vorhanden sind. In OpenRefine wird auch geprüft, ob sich das Bauwerk bereits in der GND befindet. Es findet also einen Abgleich mit bereits vorhandenen Datensätzen in der GND und gleichzeitig eine Anreicherung der Quelldaten statt. Darüber hinaus können folgende Angaben ebenfalls in den Normdatensatz zu einem ortsfesten Werk übernommen werden, sofern diese vorhanden sind: Alternativbenennung, Datierung, Orts-/Stadtteil, Beziehungen zu übergeordneten Bauwerken, Beziehungen zu Personen oder die Denkmalart entsprechend der denkmalpflegerischen Zuordnung (z.B. Kulturdenkmal, Einzeldenkmal, Flächendenkmal etc.). Nach dem Preprocesseing werden die Daten über ein Template im Format MARC21 exportiert, welches das Lieferformat für die GND darstellt.

GND-Agentur data4kulthura

data4kulthura befindet sich in der Aufbauphase, weshalb es noch keine festen Workflows oder erfolgreichen Großprojekte gibt. OpenRefine ist aber auch bei data4kulthura der Schlüssel zu  Datenbereinigung, -anreicherung und -weitergabe. In der Museumsbetreuung werden seit vielen Jahren damit Importe von Daten in die in Thüringen meistgenutzte Erfassungssoftware digiCULT.web vorbereitet. Mit OpenRefine kann man sehr schnell herausfinden, ob in Tausenden Tabellenzellen irgendwo aus Versehen als Objekttyp "Gemläde" statt "Gemälde" angegeben wurde und das für die Anwendung kontrollierter Vokabulare wie der Objektbezeichnungsdatei (OBG) korrigieren. Im Agenturbetrieb wird die Software etwa eingesetzt, um sich schnell einen Überblick über ein neues Datenset zu verschaffen, da praktisch jedes Format verarbeitet und in leicht interpretierbare Tabellen umgewandelt werden kann. Leicht lassen sich komplexere Aufgaben über Python-Skripte direkt in der Programmoberfläche automatisieren. Über die Reconciliation-Schnittstelle in OpenRefine lassen sich nicht nur neue Identifier etwa zu Ortsangaben oder Sachbegriffen schnell erzeugen, sondern auch leicht Zusatzinformationen aus der GND oder Wikidata nachholen, wenn entsprechende Identifier vorliegen. So kann geprüft werden, ob Identifier überhaupt korrekt oder Angaben im Quelldatensatz fehlerhaft sind.
Leider sind die Exportmöglichkeiten aus OpenRefine heraus recht eingeschränkt und es lässt sich nicht so ohne Weiteres das Format wieder erzeugen, das hineingegeben wurde. Hier müssen aufwändige Transformationen für den jeweiligen Einzelfall erstellt oder nachträglich angewendet werden. Eine Exportfunktion, die zweifellos in Zukunft weiter an Bedeutung gewinnen wird, ist die Einspielung in Wikibase-Instanzen wie Wikidata oder Factgrid über die eingebaute und sehr komfortable Wikibase-Erweiterung. Damit lassen sich die ohnehin in der Agenturarbeit verbesserten und angereicherten Daten schnell und einfach als Linked Open Data der GLAM-Community zugänglich machen. Auf diesem Wege wurden etwa schon Berufsangaben in Factgrid um GND-Identifier ergänzt und Thüringer Baudenkmale in Wikidata mit dem entsprechenden Denkmalschutzstatus markiert.

GND-Agentur Text+

EntityXML wurde im Rahmen der sich im Aufbau befindenden GND-Agentur Text+ entwickelt, um grundlegende Arbeitsprozesse zu unterstützen. Das Format dient im Wesentlichen text- und sprachbasierten Forschungsprojekten und der Agentur als Austausch- und Speicherformat für Daten, die als Normdaten in die GND eingebracht werden sollen bzw. die aufgrund von Forschungsergebnissen bereits in der GND verzeichnete Einträge ergänzen oder korrigieren sollen. Ziel der Agentur ist es, einen Workflow zu entwickeln, der eine halbautomatisierte Anreicherung von Daten mit GND-URIs und die Einspielung von Daten in die GND ermöglicht. In diesem Kontext wird eine auf entityXML aufbauende technische Umgebung entwickelt.
EntityXML ist ein Erschließungs- und Redaktionsformat. Projektspezifische Daten werden von den Projekten angelegt, gepflegt und eventuell in eigenen Systemen direkt genutzt. Die vom Projekt als GND-relevant identifizierten Daten zu Entitäten (Personen, Werken, Orten etc.) werden als Lieferungen mit der Agentur ausgetauscht.
Die Datenlieferungen werden von der Agentur in einem ersten Schritt durch in entityXML enthaltene Validierungsroutinen hinsichtlich formaler Qualitätsrichtlinien überprüft. Lieferungen, die schwerwiegende Verstöße gegen diese Richtlinien aufweisen, werden mit Anweisungen zum notwendigen Datencleaning an die liefernde Institution zurückgesendet. Qualitätskonforme Daten werden von der Agentur übernommen. Je nach Absprache mit dem Datenlieferanten werden die Daten durch die Agentur nachträglich bereinigt und harmonisiert.
Anschließend werden die Daten über ein in entityXML implementiertes Transformationsszenario in das JSON-Format der Toolbox konvertiert und dort mit der GND abgeglichen. Datensätze, die bereits in der GND enthalten sind, können über eine Konversion mit Daten aus der GND angereichert werden. Hierfür wird die LOBID-API genutzt. Die mit dem entsprechenden GND-URI und ggf. weiteren Daten aus der GND angereicherten Daten werden an das Projekt zurückgeliefert. Derzeit wird ein Verfahren entwickelt, wie Datensätze, die keine Entsprechung in der GND haben, wieder zurück in das entityXML-Format gespielt werden können.
Entitäten, die neu in die GND eingebracht werden sollen, werden anhand des in entityXML enthaltenen Validierungsschemas hinsichtlich ihrer Eignung und Relevanz geprüft. Das Ergebnis der Überprüfung wird dem Projekt mitgeteilt, sodass das Projekt unzulängliche Datensätze ggf. nach den geltenden Kriterien nachbessern kann.
Das bereinigte entityXML-Datenset, in dem nun die potentiellen GND-Kandidaten enthalten sind, wird schließlich durch XSLT in das GND-Lieferformat MARCXML konvertiert. Der aus Leader und entsprechenden Kontroll- und Datenfelder bestehende vollständige MARCXML-Datensatz wird von der Agentur an die Redaktion der GND zur Prüfung und Einspielung ins Testsystem versendet. Abschließend wird die mit den URIs der neu erstellten GND-Einträge angereicherte entityXML-Datenlieferung zusammen mit einem Bearbeitungs- und Einspielungsbericht an das Projekt zurückgeschickt.

Dokumentation
Autor: Johannes Renz, Landesarchiv Baden-Württemberg, Mitglied der Interessengruppe Archiv
Auszug aus dem Bericht

Am 24. November 2023 fand das 3. GND-Forum Archiv erneut in virtueller Form statt. Mit insgesamt 68 teilnehmendem Personen waren es zwar knapp die Hälfte weniger als bei der letzten Veranstaltung, daraus ergab sich aber eine angenehme Workshop-Atmosphäre. Nachdem im 2. GND-Forum der intensive Austausch unter den Teilnehmenden in mehreren Breakout-Sessions im Vordergrund stand, wurde dieses Mal bewusst das Format einer Informationsveranstaltung mit Impulsvortrag, Updates zu Entwicklungen in der GND-Kooperative, Rück- und Ausblick über die Arbeit der IG Archiv und ihrer im März 2023 konstituierten Arbeitsgruppen gewählt. Die Organisation des Forums übernahmen erneut Kolleginnen und Kollegen von der Arbeitsstelle für Standardisierung an der DNB, dem Hessischen Landesarchiv, der Genereldirektion der Staatlichen Archive Bayerns, dem Geheimen Staatsarchiv Preußischer Kulturbesitz, dem Bundesarchiv sowie dem Landesarchiv Baden-Württemberg mit der dort angesiedelten GND-Agentur LEO-BW-Regional. ...

... bitte diesem Link im STA-Community Wiki folgen, um den kompletten Text der Dokumentation mit den Folien der Vorträge zu lesen: https://wiki.dnb.de/x/oomVEg


Das Forum ist die zentrale öffentliche Plattform für alle Interessierten, die unter dem organisatorischen Dach der "Interessengruppe Archiv" im GND-Netzwerk an der Entwicklung teilhaben möchten. Die Teilnahme steht Vertreter*innen aller Archivsparten - und stets auch neuen Teilnehmer*innen - offen. Wir freuen uns, wenn das Angebot wieder auf Ihren Zuspruch stößt!

Mehr Information zum Dialogformat der GND Foren finden Sie hier.


Ein Fenster wie eine Einladung – das Historische Archiv der Stadt Köln am Heumarkt. © Raimond Spekking / CC BY-SA 4.0 (via Wikimedia Commons)


Leseempfehlung wie lange Winterabende

In der Zeitschrift des Arbeitskreises der Kunst- und Musikbibliotheken ist in der jüngsten Ausgabe ein Beitrag von Anna Bohn und Margret Schild zur Funktion der GND in der Vernetzung im GLAM Bereich erschienen. Ein Vorabdruck ist hier verlinkt.