Versionen im Vergleich

Schlüssel

  • Diese Zeile wurde hinzugefügt.
  • Diese Zeile wurde entfernt.
  • Formatierung wurde geändert.


Section


Column
width30%
View file
nameKeynote.pdf
height250


Panel
borderColor#808080
titleColor#262626
titleBGColor#F2F2F2
borderStylesolid
titleVideo-Mitschnitt Eröffnung


Widget Connector
width80%
urlhttps://www.youtube.com/watch?v=MNUS8oG8XYQ&list=PLiOn8zIQG_S1wTW6BBLa1UnY8SRaWuExJ&index=1&t=1173s
height80%




Image Removed Zum Aufrufen der Folien bitte auf das Bild klicken.
Column
width5%



Column
width30%


Panel
borderColor#808080
titleColor#262626
titleBGColor#F2F2F2
borderStylesolid
titleTermin


Column
width10%


Column
width70%

MONTAG 7. JUNI 2021


Section


Column
width70%

Slot 1: 9:30 - 11:00 Uhr

303 Teilnehmende300 Teilnehmende


Column
width25%

Begrüßung
Keynote





Column
width5%



Column
width30%


Panel
borderColor#808080
titleColor#262626
titleBGColor#F2F2F2
borderStylesolid
titleVideo-Mitschnitt
(Platzhalter für das Widget)
Keynote

Widget Connector
width80%
urlhttps://www.youtube.com/watch?v=

mdeOMeVUwbA

bkj1GxoLT9g&list=PLiOn8zIQG_S1wTW6BBLa1UnY8SRaWuExJ&index=5
height80%







Section


Panel
borderColor#808080
titleColor#262626
titleBGColor#F2F2F2
borderStylesolid
titleBegrüßung zur Eröffnung


Column
width75%

Die GNDCon 2.0: Digital, Divers und Dezentral

Der Generaldirektor der Deutschen Nationalbibliothek (DNB), Frank Scholze, hieß die Teilnehmenden willkommen zur GNDCon 2.0. Im Gespräch mit den beiden Moderator*innen, Jürgen Kett und Barbara Fischer, haben gaben sie gemeinsam einen Ausblick gegeben auf eine Woche GNDCon 2.0 digital, divers und dezentral. Im Gespräch erläuterten Frank Scholze und Jürgen Kett jeweils ihre Perspektive auf die Öffnung der GND.

Gemeinsam gewinnen

Vor dem Hintergrund der strategischen Prioritäten der DNB betonte Frank Scholze, wie notwendig es sei, für das gemeinsame Arbeiten an der GND eine gemeinsame Haltung zu entwickeln. Mit dieser Haltung könne es gelingen, eben die Balance zu finden, in der die unterschiedlichen Bedürfnisse und Rahmenbedingungen der kooperierenden Partner miteinander austariert werden könnten. Die DNB sähe sich in diesem Prozess als Moderatorin, für die der gemeinsame Erfolg ein zentrales Anliegen sei. Jürgen Kett hob hervor, dass der Fokus nach den überwiegend konzeptionellen Arbeiten seit Beginn des Öffnungsprozesses 2017 nun auf der Umsetzung der praktischen Erfordernisse läge. Auf drei Ebenen ginge man dies an: Mit dem GND-Explorer zur verbesserten Darstellung der GND und der Entwicklung von weiteren Werkzeugen wolle man die technische Infrastruktur der GND zugänglicher machen, mit der Bereitstellung von benutzerfreundlicheren Redaktionsoberflächen – Stichwort Eingabemasken – solle die Redaktionsarbeit erleichtert werden, drittens ginge es auf der organisatorischen Ebene darum, gerade den neuen Akteur*innen Hilfe zur Selbsthilfe zu leisten. Dafür warb Jürgen Kett ausdrücklich um die tatkräftige Unterstützung durch die bereits aktiven Anwender*innen in der GND-Kooperative. Er lud die Gäste der GNDCon ein, die Veranstaltungswoche zu nutzen, sich nicht nur zu vernetzen und auszutauschen, sondern auch miteinander die Freude am gemeinsamen Arbeiten zu genießen.


Column
width25%



Panel
borderColor#808080
titleColor#262626
titleBGColor#F2F2F2
borderStylesolid
titleReferentenReferent*innen


Column
width5%


Column
width95%

Frank Scholze
Jürgen Kett
Barbara Fischer
(alle DNB)







Section


Fabian Steeg: OpenRefine Reconciliation mit lobid-gnd

Image Removed

Jakob Voß: Mapping mit Cocoda
Panel
borderColor#808080
titleColor#262626
titleBGColor#F2F2F2
borderStylesolid
titleKeynote


Abstract

Die fortschreitende Digitalisierung ermöglicht es den Wissenschaften stetig wachsende Datenmengen zu produzieren. Die effiziente Nutzung dieser Daten, also deren dauerhafte Sicherung, Ordnung, Verarbeitung und insbesondere auch ihre Bereitstellung für eine wissenschaftliche Nachnutzung, setzt funktionierende Infrastrukturen wie etwa Archive, Bibliotheken oder Fachinformationszentren voraus. Ziel der Nationalen Forschungsdateninfrastruktur ist es, diese Datenbestände für das gesamte Wissenschaftssystem systematisch zu erschließen, zu vernetzen und nachhaltig nutzbar zu machen. Um dieses Ziel zu erreichen kommen Techniken der Künstlichen Intelligenz vermehrt zum Einsatz, mit denen die heterogenen verteilten Datenbestände sowie deren Metadaten miteinander in Bezug gesetzt und gemeinsam nachnutzbar gemacht werden sollen. Die dazu notwendige semantische Erschließung der Daten setzt verstärkt auf subsymbolische maschinelle Lernverfahren (Deep Learning Technologien) in Verbindung mit symbolischen Wissensrepräsentationen (Ontologien und Knowledge Graphen). Eine entscheidende Rolle dabei werden effiziente Standardisierungsprozesse ebenso wie Normdaten und die Möglichkeit deren dynamischer Erweiterung und Anreicherung spielen. 

Die Folien finden sich hier: https://raw.githubusercontent.com/lysander07/Presentations/main/Die%20Welt%20ist%20klein...GNDCon2.0-2021.pdf

Prof. Dr. Harald Sack

Column
width75%

"Die Welt ist klein und man trifft sich immer zweimal..."

Im Anschluss sprach Herr Prof. Dr. Harald Sack, Bereichsleiter für Information Service Engineering bei FIZ Karlsruhe – Leibniz-Institut für Informationsinfrastruktur und Professor für Information Service Engineering am Karlsruher Institut für Technologie (KIT) über Forschungsdateninfrastrukturen und die Renaissance der Normdaten. Anschließend fand eine Diskussion statt

expand

title
Column
width22%
View file
nameKeynote.pdf
height250

Image Removed Zum Aufrufen der Folien bitte auf das Bild klicken.
Column
width22%
Column
width22%
View file
nameVoss_gndcon2021.pdf
height150

Bericht

original als Blopost veröffentlicht.

Reconciliation mit lobid, OpenRefine und Cocoda bei der GNDCon

18 Jun 2021, Adrian Pohl, Fabian Steeg, Jakob Voß | 

In der letzten Woche fand die GNDCon 2.0 statt. Die zweite Ausgabe der GNDCon wurde dezentral veranstaltet. Verschiedene Akteure übernahmen dabei die inhaltliche Umsetzung und kümmerten sich um das technische Hosting für eine “MiniCon”. Wir haben gemeinsam mit Jakob Voß von der Verbundzentrale des GBV die MiniCon “Wie verlinken wir unsere Daten mit der GND?” angeboten.

Die Logos von ColiConc, OpenRefine, lobid und GNDImage Removed

Reconciliation als Grundlage für die Verlinkung mit Normdaten

Grundlage einer solchen Verlinkung eigener Daten ist ein Abgleich dieser Daten mit der GND. Dieser zugrunde liegende Prozess des Datenabgleichs wird auch als Reconciliation bezeichnet. Adrian bestimmte in seinem Einleitungsvortrag Reconciliation wie folgt:

“Reconciliation ist ein Prozess zum Abgleich von Namen und ggf. weiteren Attributen (einer Person, eines Ortes, eines Schlagworts etc.) mit jeweils einem Eintrag innerhalb einer Normdatei”

Anwendungsfälle gibt es viele, allein schon im Kontext der Gemeinsamen Normdatei (GND) wollen viele Akteure aus Museen und Archiven oder etwa den Digital Humanities eigene Daten mit der GND verknüpfen. Neben der GND gibt es eine größere Anzahl weiterer Datenquellen, für die eine Reconciliationschnittstelle angeboten wird. Der große Bedarf an Möglichkeiten zur Reconciliation mit Normdatenquellen – nicht nur im Bibliotheksbereich – wurde von der Community erkannt und hat zur Gründung einer Entity Reconciliation Community Group (CG) im Rahmen des World Wide Web Consortium (W3C) geführt. Das lobid-Team ist mit Adrian und Fabian in der Gruppe vertreten, siehe auch Fabians Blogbeitrag “Supporting reconciliation from a library perspective”.

Die Entity Reconciliation CG zielt mittelfristig auf die Spezifikation eines allgemeinen Protokolls für den Datenabgleich im Web ab. In einem ersten Schritt wird zunächst die bestehende API der Reconciliation-Funktionalität in OpenRefine spezifiziert. OpenRefine ist – auch im Bibliotheksbereich – eines der meistbenutzten und -bewährten Werkzeuge für Datenbereinigung und -abgleich und wird als Essential Open Source Software for Science gefördert. Als generisches tabellenbasiertes Werkzeug zur Bereinigung und Transformation von Daten ermöglicht OpenRefine auch die Verknüpfung mit verschiedenen Normdatenquellen und die darauf folgende Anreicherung aus den verknüpften Normdaten.

Reconciliation von lokalen Daten und der GND mit OpenRefine

In seiner Präsentation zur OpenRefine Reconciliation mit lobid-gnd gab Fabian zunächst einen Überblick zu den Datenquellen und der Rechercheoberfläche von lobid-gnd. Die Oberfläche dient hier zum Erkunden der Daten, deren Verständnis eine wichtige Grundlage für einen erfolgreichen Abgleich darstellt.

Im Anschluss wurde zunächst das grundsätzliche Vorgehen beim Datenabgleich mit der Reconciliation-Schnittstelle von lobid-gnd in OpenRefine vorgestellt, sowie die darauf aufbauende Anreicherung auf Basis der abgeglichenen GND-Einträge.

Schließlich wurden verschiedene Strategien zur Verbesserung der Qualität des Abgleichs vorgestellt, insbesondere die Verwendung zusätzlicher lokalen Daten (z.B. Lebensdaten und Berufe) als Merkmale zur Disambiguierung der abzugleichenden Namen.

Reconciliation von Normdaten untereinander mit Cocoda

Mit Cocoda wurde im zweiten Teil der MinCon eine Webanwendung vorgestellt, die ebenfalls die Reconciliation API verwendet, um passende Einträge in der GND oder in anderen Normdateien zu finden. Wie Jakob in seiner Präsentation und einer kurzen Live-Demo zeigte, ist Cocoda im Rahmen des Projekt coli-conc vor Allem entwickelt worden um verschiedene Klassifikationen durch Mappings aufeinander abzubilden. Herausgekommen ist allerdings auch eine Infrastruktur zum einheitlichen Zugriff auf unterschiedlichste Vokabulare, darunter GND, RVK, DDC und Wikidata.

In Cocoda lassen sich nicht nur Vokabulare auf die GND abbilden sondern auch vorhandene Mappings von und auf die GND durchsuchen. Eine Besonderheit von Cocoda ist, dass einzelne Mappings mit ihrer Provenienz gespeichert werden und mit einem Review-System auch komplexere Workflows zur Qualitätssicherung umgesetzt werden können. Der Vortrag schloss mit einem Vergleich von Cocoda und OpenRefine um Anhaltspunkte zu geben wann welches Werkzeug besser geeignet ist.

Diskussion

Schon während der Vorträge entstand im Chat eine lebhafte Diskussion, die zum Teil in Pausen, zum Teil nach den Vorträgen im Plenum aufgegriffen wurde. Den vollständigen Chatverlauf und die Ergebniss von zwei Umfragen finden sich im Etherpad zu der Veranstaltung.

So wurde etwa das Einspielen eigener Daten angesprochen, wenn die GND keinen passenden Eintrag enthält. In OpenRefine lässt sich eine Liste von nicht gemappten Einträgen exportieren, um anschließend beispielsweise im GND-Redaktionsystem neue GND-Einträge zu erstellen. In Cocoda ist es möglich, zumindest auf übergeordnete Einträge zu mappen. Eine Vorschlagsfunktion für neue GND-Einträge ist in Cocoda angedacht, erfordert jedoch die Anbindung an eine Schreib-API für neue Begriffe. Solch eine API könnte auch in OpenRefine verwendet werden um direkt aus der Anwendung Ergänzungen in die GND aufzunehmen, vergleichbar mit der in OpenRefine enthaltenen Extension zum Import in Wikidata.

In der Runde des Resümees am Ende des Tages wurde mit Vertreter*innen verschiedener technisch orientierter MiniCons über die technische Weiterentwicklung der GND diskutiert. Auch hier war der Datenabgleich ein Thema, insbesondere wurde die Bedeutung von Standards bei der Zusammenarbeit in einer verteilten Infrastruktur wie der GND-Kooperative betont.

Zugleich wurde deutlich, wie herausfordernd eine konsolidierte webbasierte Bereitstellung der GND-Daten ist. Die Daten liegen originär in traditionell bibliothekarischen Datenformaten vor (Internformat Pica, Austauschformat MARC), die sich nicht unmittelbar für die Webentwicklung eignen. Deshalb bildet für lobid-gnd der Linked-Data-Service (LDS) der DNB die Datenbasis, allerdings bilden die LDS-Daten nicht alle Informationen aus den Pica-Daten ab. Die Möglichkeit einer kollaborativen Weiterentwicklung der LDS-Daten wäre aus unserer Sicht ein wichtiger Schritt hin zu mehr Zusammenarbeit in der GND-Kooperative bei der Entwicklung neuer bzw. Konsolidierung bestehender GND-Webangebote.

Comments? Feedback? Just add an annotation with hypothes.is.

Eindrücke aus dem Vortrag

Harald Sack überraschte in seiner Auftaktrede die Gäste der GNDCon mit einer persönlichen Zeitreise. In seinem Vortrag erklärte er, warum er heute, zehn Jahre nach seinen ersten Versuchen, die damals noch getrennt voneinander betriebenen Normdateien für ein verbessertes Retrieval (Auffindbarkeit) im semantischen Netz zu verwenden, eine Renaissance des Interesses an der GND erlebe. Ziel des Aufbaus der Nationalen Forschungsdateninfrastruktur (NFDI), die jetzt gerade über DFG-Fördermittel in Angriff genommen wird, sei die Überwindung der Forschungsdatensilos nach den FAIR Data Prinzipien. Harald Sack unterstrich: “Dafür brauchen wir eine gemeinsame Sprache … hier werden die Normdaten der GND eine zentrale Rolle spielen.” Die Gäste der GNDCon hatten sowohl in dem Beitrag zum GND.network im Ideenforum als auch in der Runde der Resümees am zweiten Tag Gelegenheit, ihre Vorstellungen, wie die GND diese zentrale Rolle als Knotenknüpferin ausfüllen sollte, zur Sprache zu bringen. Die Regelwerke vereinfachen, mehr Vernetzung mit anderen Daten ermöglichen und mehr technische Unterstützung beim Datenabgleich waren die genannten Kernerwartungen an die Öffnungsarbeit der GND.


Column
width25%



Panel
borderColor#808080
titleColor#262626
titleBGColor#F2F2F2
borderStylesolid
titleReferent


Column
width5%

Image Added


Column
width95%

Prof. Dr. Harald Sack

View file
nameKeynote.pdf
height150

Image Added Zum Aufrufen der Folien bitte auf das Bild klicken.

  • Contact
  • lobid.org
  • github.com/hbz
  • Feed
  • Old blog (2010-2015)