Versionen im Vergleich

Schlüssel

  • Diese Zeile wurde hinzugefügt.
  • Diese Zeile wurde entfernt.
  • Formatierung wurde geändert.

Autor:innen: Marie Annisius, Stefan Buddenbohm


Wir, das heißt das GND-Team in der Task Area Infrastructure/Operations in Text+, bestehend aus Kolleg:innen der Arbeitsstelle für Standardisierung der DNB sowie der Abteilung Forschung und Entwicklung und der Gruppe Metadaten an der SUB Göttingen, haben am 26.01.2023 das zweite GND-Forum Text+ durchgeführt. Zuerst ein Dankeschön an alle 45 Teilnehmerinnen und Teilnehmer aus Text+, aus anderen Konsortien, aus dem großen Team der DNB selbst sowie den Fachverbänden und Fachinformationsdiensten! Ziel des Treffens war es, über den neuesten Arbeitsstand der verschiedenen Aktivitäten die GND im Zusammenhang mit Text+ betreffend zu informieren. Anders als beim Auftaktforum im Juni 2022 ging es dieses Mal vor allem darum, der Community einen Einblick in den GND-Task in Text+ selbst sowie in die übergreifenden Aktivitäten der DNB beim Thema zu vermitteln. Beim nächsten Forum werden dann die Datendomänen aus Text+ mit ihren Normdatenaktivitäten im Mittelpunkt stehen. Das dritte GND-Forum Text+ wird voraussichtlich im Sommer oder Herbst dieses Jahres stattfinden. Im Folgenden geben wir eine Zusammenfassung des letzten Workshops. (Fast Lane: Alle Materialien finden sich am Ende dieses Blogposts verlinkt.)


Aktivitäten in der Text+ Task Area Infrastructure/Operations


Ausschnitt aus dem Whiteboard des GND-Designworkshops 2022

Ausschnitt aus dem Whiteboard des GND-Designworkshops 2022

Ein kurzer Bericht vom Community-Empowerment Workshop am 06.12.2022 ((Dokumentation des Workshops Kollaborative Konzeptarbeit: Wissensvermittlung für die GND-Community)) leitete den Workshop ein und beleuchtete die Zielrichtung für Schulungsmaterialien rund um die GND. Geplant sind ein modularer Baukasten von Lerninhalten, verschiedene Vermittlungsformate und Methoden sowie eine Materialsammlung auf der GND-Website. Im nächsten Schritt wird dazu eine Customer Journey ausgearbeitet. Konsens ist, wo immer dies möglich und einfach umsetzbar ist, nach Synergien zu streben. Die NFDI bietet dafür einen verbindlichen Rahmen und mit der DNB ist ein sehr erfahrener Partner mit “langem Atem” involviert. So unterschiedlich die Datendomänen der Nutzenden sind, so finden sie doch mit der GND einen etablierten “infrastrukturellen gemeinsamen Nenner”. Daher ist es sinnvoll, für Schulungsmaterialien und Beratungen nicht das Rad neu zu erfinden und rechtzeitig in den Dialog mit anderen zu treten, die eine ähnliche Zielgruppe adressieren. Mit der Gruppe der geistes- und kulturwissenschaftlichen Konsortien – NFDI4CultureNFDI4MemoryNFDI4Objects sowie Text+ – existiert eine Peer Community, die dieses Thema gemeinsam diskutieren kann.

Logos der Teilnehmenden des GND-Designworkshops am 6.12.2022

Die Teilnehmenden des GND-Designworkshops am 06.12.2022


Die GND-Umfrage, die Ende 2022 in der Text+ Community durchgeführt wurde, hat gezeigt, dass über die GND bereits viel bekannt ist. Die Bedarfe liegen vor allem in vereinfachten Beteiligungsmöglichkeiten, Abgleichsmöglichkeiten sowie in mehrsprachigen Vokabularen. Text+ als NFDI-Konsortium setzt auf die aufzubauende GND-Agentur Text+, um der Community der Datengebenden und Datennutzenden im Kontext sprach- und textbasierter Forschungsdaten als Unterstützung zur Seite zu stehen.


GND Mul – Crosskonkordanzen zur GND

Yvonne Jahns von der DNB stellte das Projekt GND Mul (2021-2022) vor. Dabei geht es um die Vernetzung der GND mit anderen Vokabularen und Thesauri und ganz konkret um Sachbegriffe. GND Mul soll eine Infrastruktur für (sachliche) thematische Zugänge schaffen und die GND interoperabler gestalten.

Damit verfolgt die Bibliothek folgende Ziele: 


  • die Suche verbessern durch Erweiterung des Suchindex um Begriffe aus anderen Thesauri, 
  • mehrsprachige Suche ermöglichen,
  • maschinenlesbare Konkordanzen zwischen GND und z. B. LCSH, ((Library of Congress Subject Headings)) RAMEAU, ((Répertoire d’autorité-matière encyclopédique et alphabétique unifié)) STW, ((Standard-Thesaurus Wirtschaft)) NSogg ((Nuovo Soggettario )) uvm.


Mit GND Mul ist es gelungen, eine Infrastruktur zu schaffen, die sowohl Konkordanzdaten einheitlich verfügbar macht als auch neue Daten aufnimmt. Die in der Projektlaufzeit geschaffenen Strukturen und Abläufe können nun weitergenutzt werden, um zusätzliche Konkordanzen zu erstellen. Die Webseite von GND Mul ist als ausdrückliche Einladung zur Meldung neuer Konkordanzen bzw. zur Mitarbeit an Konkordanzen zu weiteren Thesauri zu verstehen. Die Kontaktdaten sind hier zu finden. Konkordanz-Datensätze sind ab Sommer 2023 aktualisiert als Open Data (in der Regel CC-BY) über die Metadatendienste der DNB verfügbar. Die Regeln für Crosskonkordanzen fassen die Erfahrungen des Projektes GND-Mul für die Pflege von Konkordanzen zusammen. Ebenso gibt es ein Handbuch unter Berücksichtigung der Thesaurus-Norm.


Folie mit den Crosskonkordazen zu Fachthesauri

Alle Ergebnisse aus GND Mul sind im DNB-Wiki verfügbar

Die Möglichkeiten für den Abgleich von Daten liegen im


  • vollständig händischen Abgleich,
  • semi-automatischen Abgleich von Datendumps nach bestimmten Bedingungen, die nach einer gründlichen Betrachtung der Datensets festgelegt werden, bspw. hierarchische Strukturierung der Daten,
  • vollautomatischen Abgleich im Bereich der Sachbegriffe, welcher weniger verbreitet und für Individualnamen besser geeignet ist.


Technische Infrastruktur der GND – Aktuelle Entwicklung

Jürgen Kett gab einen Überblick über die Entwicklungen der technischen Infrastruktur der GND, von Organisation und Kommunikation über die Erweiterung der Datenbasis, Datenvernetzung, Datenredaktion sowie Regel- und Formatdokumentation bis hin zu Werkzeugen und Schnittstellen.

Es gibt viele heterogene Anforderungen an die GND und damit auch an die Infrastruktur. Ausschlaggebend für den Erfolg der Infrastruktur ist somit ihre Anpassungsfähigkeit an verschiedene Nutzungsszenarien. Mit Blick auf die NFDI kann es bereits bei den geistes- und kulturwissenschaftlichen Konsortien zu einem Spektrum unterschiedlicher Anforderungen kommen, einfach weil mit unterschiedlichen Forschungsdaten gearbeitet wird.

Ein Ziel ist, das GND-Netzwerk sichtbar zu machen, um so zur Interaktion einzuladen und zu Feedback aufzufordern. Der GND-Explorer bietet einen einfachen Einstieg in die Suche in der GND. Geplant sind in Zukunft Features wie eine Karten- und Zeitstrahlansicht, verkürzte Meldeverfahren und auch die Darstellung von Relationen zu externen Ressourcen, welche die GND verknüpfen ebenso wie Community-Sichten (bspw. für ausgewählte Datenräume oder -typen) und die Integrierbarkeit in Partner-Anwendungen.

Ein weiteres geplantes Angebot ist der One-Stop-Shop: Hier sollen APIs angeboten werden. Dazu werden aber zunächst Integrationsschnittstellen benötigt, die nach der Fertigstellung auch als externe Schnittstellen dienen können. Als Eingabeoberflächen sind Webformulare für Geografika geplant sowie die Integration in Drittsysteme (RISMISNI). Bereits erfolgt ist die Integration von ORCID.

Screenshot aus der Präsentation von Jürgen Kett

Screenshot aus der Präsentation von Jürgen Kett

Ausschnitt aus dem Infrastrukturkonzept der GND

Im Themenbereich der Regeln und Formatdokumentation wäre eine Sonderarbeitsgruppe Text+ innerhalb der Gremienstruktur der GND denkbar. Bereits eingeführt ist das Konzept der Anwendungskontexte. Diese können das Taggen von community-spezifischen Regeln enthalten oder die Nutzung von Datensätzen als Ganzem oder nur einzelner Datenfelder (PLUS-Markierung) in einer spezifischen Weise. Anwendungskontexte bieten die Möglichkeit, verschiedene Ansichten der GND zu filtern. Aber es gilt: Wir arbeiten weiterhin alle in einer GND. Die verschiedenen Bedarfe der Communities an die Regeln und an das Datenmodell stellen somit eine bleibende Herausforderung dar.

Das Konzept für die semi-automatische Datenintegration (Massen-Integration) sieht das Matching in der Verantwortung der einzelnen Communities. Es erfolgt der Abgleich der Sammlungs-/ Objekt-/ Forschungs-Daten mit der GND. Fehlende Kandidaten können dann als Vorschläge in die GND eingebracht werden. Um GND-URIs angereicherte Sammlungs-/ Objekt-/ Forschungsdaten werden damit Teil des GND.networks.


Eine GND-Agentur für Text+ – erste prototypische Workflows

Im letzten Teil stellte Susanne Al-Eryani die geplanten Angebote der GND-Agentur Text+ mit Fokus auf die Bereiche Kontakt, Beratung und Datenservices vor und gab einen Einblick in den geplanten Workflow zur Verarbeitung von eingehenden Forschungsdaten. Dieser Workflow bildet einen wichtigen Beitrag zur entstehenden GND-Agentur Text+.

Der untenstehende Workflow in schematischer Darstellung ist das Ergebnis der Arbeit seit Projektbeginn von Text+ und spiegelt vor allem die Rückmeldungen und Erfahrungen aus der Zusammenarbeit mit drei Pilotprojekten wieder. Bei diesen Pilotprojekten handelte es sich um die Carl Schmitt-Tagebücher, die Klaus Mollenhauer-Gesamtausgabe sowie Gelehrte Journale und Zeitungen der Aufklärung, alle drei Editionsprojekte, die mit der Georg-August-Universität Göttingen verbunden sind.

Schematische Darstellung des Workflows aus der Präsentation von Susanne Al-Eryani

Schema des geplanten Workflows zur Verarbeitung von eingehenden Forschungsdaten.


Die Erhebung der Bedarfe und Ausgangsbedingungen wurde mithilfe eines strukturierten Leitfadens durchgeführt. Standen bisher Editionen im Mittelpunkt, wird der Workflow zukünftig auf andere Datentypen auszuweiten sein.

Ein wesentliches Ergebnis der Arbeit ist mit entityXML ein Austausch- und Speicherformat, mittels dessen die Normdatenmeldung aus Forschungsprojekten an die GND erfolgen kann. Das Werkzeug wird im Frühjahr 2023 offiziell veröffentlicht.

Screenshot aus der Präsentation von Jürgen Kett

Screenshot aus der Präsentation von Uwe Sikora

Wie geht es weiter?

Während der verschiedenen Diskussionen wurden Fragen aufgeworfen, die nicht alle im Verlauf der Veranstaltung geklärt werden konnten, zum Teil auch gar nicht sollten, und die es gilt, in Zukunft anzugehen, bzw. die eine Anregung für zukünftige Arbeiten darstellen können:


  • Mit welchen Datenzentren/Datenbeständen aus den Datendomänen Sammlungen und Lexikalische Ressourcen können/wollen wir im Rahmen der Forumsreihe und im GND-Task in Text+ weiterarbeiten? 
  • Welche externen Zielgruppen wollen wir einbinden? Reicht das GND-Forum Text+ oder braucht es mehr/andere Formate?
  • Besteht Interesse an einem Workshop/Erfahrungsaustausch zum Abgleich von Daten mit der GND z. B. via Open Refine?
  • Wie lassen sich die durch GND Mul geschaffenen Möglichkeiten/Infrastrukturen durch Text+ nutzen, z. B. für die Registry?


GND-Forum als Blueprint – bitte nachmachen!

Das GND-Forum Text+ bettet sich ein in eine Palette ähnlich ausgerichteter Foren, die mit Hilfe der DNB für ganz unterschiedliche Zielgruppen angeboten werden: das GND-Forum Performing Arts, das GND-Forum Bauwerke, das GND-Forum Archiv oder das GND-Forum Museen und Sammlung. Allen gemein ist die Zielsetzung, das Thema Normdaten und das GND.network an die spezifischen Bedarfe unterschiedlicher Communities heranzutragen, anzupassen, mit ihnen gemeinsamen weiterzuentwickeln. Die GND, insbesondere die Arbeitsstelle für Standardisierung, unterstützt dabei maßgeblich und ist auch – im Falle von Text+ – konkret an der Arbeit im NFDI-Konsortium beteiligt. In Text+ fließen die normdatenbezogenen Aktivitäten im GND-Task der Task Area Infrastructure/Operations zusammen. Text+ adressiert während der Laufzeit vor allem die drei Datendomänen Sammlungen, Editionen und Lexikalische Ressourcen, aber auch Kolleginnen und Kollegen aus den Fachinformationsdiensten, den Fachverbänden sowie anderen NFDI-Konsortien.

Damit wird deutlich, dass ein ganz wesentlicher und kritischer Erfolgsfaktor für die weitere Verbreitung und Nutzung (upscaling) der GND der intensive Dialog mit den spezifischen Communities ist. Für Text+ sind das vor allem Projekte und Institutionen, die sich mit text- und sprachbasierten Forschungsdaten befassen. Den Dialog in Gang zu setzen und in Bewegung zu halten ist für ein Projekt wie Text+ eine Herausforderung, da verbindliche und zielgerichtete Kommunikation Vertrauen und eine gewisse Frequenz bedingt. Aus diesem Grund sind die praktischen Umsetzungen aus den Text+ Datendomänen so wichtig, um der Community Anreize zum Mittun zu geben.

Das dritte GND-Forum Text+ ist für den Sommer/Herbst 2023 geplant und wir freuen uns, Sie wieder begrüßen zu dürfen! Wenn Sie mit uns abseits der Workshopreihe in Kontakt treten möchten, Fragen haben oder vielleicht ein kleines Projekt aus ihrem Kontext umsetzen wollen, freuen wir uns sehr, von Ihnen zu hören. Schreiben Sie dafür einfach an die Verantwortlichen für den GND-Task in Text+ Barbara Fischer, Marie Annisius und Stefan Buddenbohm oder wenden Sie sich an unseren Text+ Helpdesk.