Wann: 

6. und 7. Mai 2025 

Wo:

Universität Mannheim, FUCHS-Festsaal (O 138), Anfahrt

Veranstalter:

DINI-AG KIMUB Mannheim
Programmkomitee+
Organisationsteam:

Alex Jahnke (SUB Göttingen), Jana Hentschke (ZBW), Sylvia Hulin (UB Mannheim), Tracy Arndt (DNB), Philipp Zumstein (UB Mannheim), Jakob Voß (VZG Göttingen), Tobias Bülte (hbz), Petra Schramm (Staatsbibliothek zu Berlin)

Teilnehmendenliste:

https://dini.de/veranstaltungen/workshops/kim-workshop-2025/teilnehmendenliste

Kurznachrichtendienste:

Mastodon-Hashtag #kimws25
Kontakt:kim-info@dini.de

Programm

Dienstag, 6. Mai 2025

11:30 - 11:45

Begrüßung

Annette Klein (UB Mannheim, Direktion)

Alex Jahnke (SUB Göttingen), Tracy Arndt (DNB) (DINI-AG KIM AG-Sprecher und -Sprecherin)

11:45 - 12:30

Kennenlernrunde

Metadaten im Alltag: Einsatz von Metadaten im beruflichen Kontext, Erfahrungen, Herausforderungen, Probleme

Moderation: Jana Hentschke


12:30 - 13:30Mittagspause mit Verpflegung
13:30 - 17:30Hands-on-Tutorials - Anmeldung erforderlich

Option 1: Metafacture Revisited - Metadaten verarbeiten, transfomieren und bereinigen mit Metafacture Core und Fix

Leitung: Tobias Bülte, Pascal Christoph (hbz), Petra Maier (VZG Göttingen)

Metadaten analysieren, verarbeiten, transformieren und bereinigen sind wesentliche Aufgaben jeder Einrichtung aus dem GLAM-Bereich. Ein Tool, das dafür genutzt werden kann, ist Metafacture. Metafacture ist sowohl ein Kommandozeilen-Tool als auch eine Software-Bibliothek, die in ein Java-Projekt eingebunden werden kann.

Seit 2019 ist das hbz Maintainer von Metafacture. Besonders hervorzuheben sind zwei Entwicklungen:

  1. Metafix ist nach vierjähriger Entwicklung nun Kernbestandteil von Metafacure geworden. Durch den record-basierten Ansatz und die Einführung der an Catmandu angelehnten Transformationssprache “Fix” konnte die Umsetzung von Datentransformationen vereinfacht werden.
  2. Der Metafacture Playground bietet eine webbasierte Oberfläche zum Ausprobieren und Austauschen von Workflows. Dadurch soll die Einstiegshürde für Metafacture gesenkt werden, die unserer Erfahrung nach ein zentrales Problem bei der Metafacture-Nutzung ist.

Der Workshop gibt eine Einführung in Metafacture Core und Metafix sowie einen Überblick über die aktuellen Entwicklungen. Im Stil eines Flipped Classroom werden die Teilnehmer:innen darum gebeten, sich in individueller Vorarbeit und ersten Übungen mit Metafacture vertraut zu machen. Wir stellen dafür Lernmaterialien vorab bereit sowie eine Plattform für Fragen.

Zusätzlich sollen die Teilnehmer:innen ein eigenes Problem oder Projekt für Metadaten mitbringen, zum Beispiel die Bereinigung von ISBNs in einem MARC-Datensatz oder die Übertragung von JSON Daten nach MODS. Gemeinsam mit den Workshop-Leiter:innen und anderen Teilnehmer:innen werden diese Probleme analysiert und dann mit Hilfe von Metafacture angegangen. (Alternativ kann auch ein Beispieldatensätze mitgebracht werden, mit dessen Arbeit man vertraut ist, um Metafacture mit eigenen Daten zu testen.)

Der Workshop richtet sich sowohl an Personen, die bisher noch nicht mit Metafacture gearbeitet haben, als auch an Menschen, die ihr Wissen über Metafacture auffrischen und die neuen Entwicklungen kennenlernen wollen. Ein eigener Laptop sollte mitgebracht werden.

Option 2: Einführung in RDF und SPARQL

Leitung: Alexander Jahnke (SUB Göttingen

In diesem Tutorial geht es um die Grundlagen der Suche in RDF-Daten mithilfe der Abfragesprache SPARQL. Neben einer allgemeinen Einführung in die grundlegenden Konzepte von RDF (Was sind Ressourcen, Literale und Blank Nodes) und die Serialisierungssprache Turtle geht es um das Formulieren von Queries mit Hilfe einfacher und komplexerer Graph Patterns, dem Einsatz von Filtern und der Modifikation von Ergebnismengen (Solution Sequences). Wenn noch Zeit ist, schauen wir uns auch die Grundlagen des Managements von Graphen (SPARQL Update) an. Wir üben (das Retrieval) an online zugänglichen Datenquellen; es ist also nicht nötig, Fuseki vorher zu installieren.

Dieser Workshop richtet sich an Leute mit wenig oder keinen Vorerfahrungen in der Anwendung von SPARQL. Bitte bringt Euren eigenen Laptop mit.

 

Option 3: Einführung in entityXML: Ein Erschließungs- und Austauschformat für Normdaten

Leitung: Uwe Sikora (SUB Göttingen)

entityXML wird seit 2023 im Kontext der GND-Agentur Text+ entwickelt, um Normdaten aus verschiedenen Zusammenhängen heraus zu erschließen und mit der GND auszutauschen. Anfänglich noch als einfaches XML-Format geplant, umfasst entityXML mittlerweile eine Vielzahl an Open-Source Werkzeugen, die Nutzer:innen bei der Erfassung und automatischen Validierung von Normdaten unterstützen und die Konvertierung in unterschiedliche Formate, wie z.B. GND-spezifisches MARC erlauben.

Der Workshop richtet sich v.a. an Erstnutzer:innen und Interessierte, die bereits mit XML in Berührung gekommen sind und lernen wollen, wie man Normdaten, z.B. aus eigenen Projekten, in entityXML niedrigschwellig und ohne überbordendes technologisches Wissen aufbereiten und nutzbar machen kann. Zusammen werden wir einen Blick unter die Haube des entityXML Frameworks wagen und entityXML in praxisnahen Beispielen erproben: Nach einer kurzen Vorstellung der Kernkonzepte und Ideen, die entityXML innewohnen, werden wir gemeinsam entityXML installieren und danach dazu übergehen, eigene Daten zu erschließen. Anschließend werden wir uns den verschiedenen Konversionsmöglichkeiten widmen und unsere Daten in andere Formate konvertieren. Der Workshop wird durch den Entwickler von entityXML durchgeführt, der uns somit jeder Zeit für Fragen, Feedback und den ein oder anderen Tipp zur Seite steht.

Für den Workshop wird ein eigener Laptop mit vorinstalliertem und lauffähigem oXygen XML Editor (Download: https://www.oxygenxml.com/download.html) benötigt. Bei einer Erstnutzung erhält man eine 30 Tage gültige Testlizenz, mit der oXygen XML im Rahmen unseres Workshops problemlos ausprobiert werden kann. Wer möchte, kann gerne eigene Daten von Personen, Körperschaften, Werken etc. mitbringen und damit arbeiten. Zuzüglich wird ein Sampledatenset gestellt, an dem wir entityXML ausprobieren können.

- entityXML Handbuch: https://entities.pages.gwdg.de/entityxml/

- entityXML GitLab: https://gitlab.gwdg.de/entities/entityxml


Option 4: Interoperabilität von Metadaten

Leitung: Jakob Voß (VZG Göttingen)

Die Welt der Metadaten zeichnet sich durch eine Vielzahl von Formaten, Standards, Profilen und Akronymen aus. Gleichzeitig sollen Metadaten einheitlich an einer Stelle zusammengeführt werden. Grundlage dafür ist Interoperabilität. Im Workshop sollen anhand von Beispielen und Übungen die Anforderungen und Herausforderungen von Interoperabilität vorgestellt und Strategien zur Lösung ermittelt werden.

Vorkenntnisse: Rudimentäre Kenntnisse von Metadaten(formaten) sind von Vorteil, aber nicht erforderlich.

Voraussetzungen: Eigenes Notebook

Teilnehmeranzahl: max. 25


Für Interessierte: gemeinsamer Restaurantbesuch (Selbstzahler)

Ab 19 Uhr sind Tische reserviert im Restaurant Ellin ("Original Greek", mit vegetarischen Optionen und auch Burgern im Programm), Adresse: E3,1 (Wegbeschreibung)


Mittwoch, 7. Mai 2025

09:00 - 09:30

Moderation: Tracy Arndt

Vortrag

Steffen Rörtgen: Herausforderungen in OER-Infrastrukturen - Bauen wir öffentlich finanzierte Datensilos?

Die OER-Community hat mit dem Allgemeinen Metadatenprofil für Bildungsressourcen (AMB) einen wichtigen Meilenstein erreicht, um Metadaten zu Bildungsressourcen auszutauschen. Jedoch arbeiten Services und Plattformen in der OER-Infrastruktur noch weitgehend isoliert voneinander. Nur wenige Services besitzen gut dokumentierte offene Schnittstellen.

An vielen Stellen werden dieselben Quelldaten erfasst und ins eigene System indexiert, ohne dass ein wesentlicher Datenaustausch zwischen den Systemen stattfindet. Dies ist ineffizient, widerspricht dem OER-Gedanken des Teilens und führt zu vielfacher Doppelarbeit.

Im Vortrag soll der aktuelle Stand der OER-Infrastrukturen in Deutschland aufgezeigt werden sowie pragmatische Lösungsansätze vorgestellt und diskutiert werden.

09:30 - 10:00

Vortrag

Max-Ferdinand Zeterberg (SUB Göttingen): Digitale Editionen als Labelled-Property-Graphs

Für die Erstellung Digitaler Editionen hat sich TEI-XML als Standardformat zur Datenerfassung etabliert. In seiner aktuellen Fassung bietet TEI zahlreiche Elemente und Attribute zur Erfassung der unterschiedlichsten Phänomene in einer Vielzahl von Dokumententypen.

Dennoch ist die Struktur von TEI durch die lineare Hierarchie von XML-Dokumenten begrenzt. Im Fall der Edition des ugaritischen poetischen Textkorpus (EUPT) führt dies zu erheblichen Einschränkungen, da es kaum möglich erscheint, gegensätzliche Deutungen der Originaltexte zu erfassen.

Aus diesem Grund entwickeln wir im Projekt ein Datenmodell zur Erfassung der Edition als Labelled-Property-Graph (LPG). Im Vortrag werde ich unsere Überlegungen dazu vorstellen und beispielhaft das LPG-Datenmodell für EUPT erläutern.

10:00 - 10:30

Vortrag

Angela Vorndran und Stefan Grund (DNB) : Trackdatensätze aus nutzergenerierten Inhalten einer freien Musikenzyklopädie erstellen

Die Deutsche Nationalbibliothek (DNB) sammelt neben schriftlichen Quellen auch Musiktonträger. Trackinformationen, die sowohl für die Suche als auch für die Nutzung im Lesesaal und in Audioplayern eine große Rolle spielen können, liegen für die circa 1,4 Millionen Tonträger im Bestand des Deutschen Musikarchivs (DMA) der DNB allerdings nur in gut 310.000 Datensätzen vor.

Da in nutzergenerierten Angeboten wie MusicBrainz oder Discogs umfassende Informationen zu Tracks enthalten sind, entstand die Idee, diese für die Generierung von Trackdatensätzen zu  nutzen. Über die in der Musikbranche etablierten Standardnummern European Article Number (EAN) und  Universal Product Codes (UPC) wurden Alben aus dem DNB-Bestand in MusicBrainz ermittelt. Über eine automatisierte Abfrage der Schnittstelle konnten aus dem XML-Format der Antwort zahlreiche Informationen für Trackdatensätze ermittelt und über ein Mapping in Trackdatensätze überführt werden. Hierbei wurden beispielsweise Identifikationsnummern (z.B. ISRC) sowie Angaben zu Dauer, Position auf der CD oder zu verschiedenen beteiligten Personen in verschiedenen Rollen (Komponist*in, Interpret*in, technische Mitarbeit), Aufnahmevermerke, Genrebezeichnungen und Länderkennzeichen übernommen. Es können so gut 50.000 Musiktonträger mit gut 860.000 Tracks angereichert werden. Zudem können über weitere Personen-Identifikationsnummern wie der MusicBrainz-ID, ISNI etc. auch Verknüpfungen zur GND hergestellt werden.


10:30 - 11:00Kaffeepause
11:00 - 11:30

Moderation: Tobias Bülte

Vortrag 

Stephanie Nitsche (DNB) : DNBLab: “Behind the Scenes”

Das DNBLab stellt seit 2020 einen zentralen Anlaufpunkt für Präsentation, Zugriff und Nachnutzung digitaler Ressourcen der Deutschen Nationalbibliothek dar und bietet einen Zugang zu Daten, Objektdateien und Volltexten. Zudem bietet das DNBLab auch Online-Coding-Tutorials, Erklärvideos, verschiedene Hand-outs sowie ein stetig wachsendes Angebot an Workshops und Veranstaltungen, um Bezug und Arbeiten mit den Daten der DNB für alle Interessierten zu ermöglichen.

Der Vortrag gibt einen kurzen Überblick über die verschiedenen Angebote und Tätigkeiten des DNBLab und beleuchtet aktuelle Entwicklungen und Planungen. Dazu wird zudem kurz auf die Erkenntnisse aus knapp fünf Jahren Lab-Aktivitäten eingegangen und ein besonderer Fokus auf die Entwicklung kleinerer Tools zu Bezug und Arbeit mit Metadaten gelegt.

11:30 - 12:00

Vortrag

Tracy Arndt (DNB) : Dewey Linked Data

Von 2009 bis 2015 wurde von OCLC die Dewey Decimal Classifikation als Linked Data über dewey.info bereitgestellt. Nach dem Abschalten des Services führen die damals genutzten URIs ins Leere. Seit August 2024 steht die DDC nun wieder als Linked Data zur Verfügung.

Der Vortrag wird den neuen Dewey Linked Data Service vorstellen, die Use Cases betrachten und den Umgang mit Linked Closed Data diskutieren.

 

12:00 - 12:30

Fabian Steeg (hbz) : Katalogisierung als Content Management – Integration eines Open-Source Headless CMS in eine Linked-Data-Umgebung

In einem gemeinsamen Projekt arbeiten das Hochschulbibliothekszentrum des Landes Nordrhein-Westfalen (hbz) und das Landesbibliothekszentrum Rheinland-Pfalz (LBZ) seit Ende 2021 an der Migration der Rheinland-Pfälzischen Bibliographie (RPB) und der Rheinland-Pfälzischen Personendatenbank (RPPD) in ein neues System. Das vorher genutzte System war Allegro.

Es handelt sich um ein recht komplexes Projekt, mit einigen Komponenten und Schnittstellen:

  • Erfassungsformulare für selbständige Werke und Aufsätze
  • Fremddatenübernahme von hbz- und HeBIS-Verbunddaten
  • Integration verschiedener Normdaten und kontrollierter Vokabulare: GND und RPB-spezifische Normdaten, RPPD, RPB-Sach- und Ortssystematik, Fachgebietssystematik
  • Bereitstellung von Rechercheoberflächen für Endnutzer:innen: für die RPB, RPPD plus eine separate Sicht für die Weinbibliographie BiblioVino

Das hbz kann in dem Projekt auf die existierenden lobid-Schnittstellen zurückgreifen und Erfahrungen aus der Bereitstellung der Nordrhein-Westfälischen Bibliographie (NWBib) nutzen. Eine fertige Lösung für die Erfassung und Pflege von Titeldaten war aber zu Projektbeginn nicht vorhanden. Um bestehende Software nachnutzen zu können und gleichzeitig hohe Flexibilität bei den verwendeten Datenstrukturen zu haben, verwenden wir hierfür das Headless Content Management System Strapi.

Der Vortrag gibt einen Einblick in das entstanden Strapi-basierte Erfassungssystem und beschreibt die Entwicklungsaufwände, Vorteile und Herausforderungen des gewählten Ansatzes.

12:30 - 13:30Mittagspause mit Verpflegung
13:30 - 15:00

Lightning Talks und Open Session

Lightning Talks

Wer mag, kann spontan einige Minuten über ein (Metadaten-)Thema reden, das sie/ihn aktuell beschäftigt. Dabei kann/können zum Beispiel

  • über Projekte, aktuelle Aktivitäten und Erkenntnisse informiert werden ("Wir machen gerade ... vielleicht kann jemand davon profitieren oder möchte sich mit uns dazu austauschen")
  • eigene Fragen zur Diskussion gestellt werden ("Hat jemand eine Meinung zu ... ?", "Weiß jemand etwas über ...?", "Hat jemand Erfahrungen mit ...?")

Open Session 

Alle, die ein Thema oder eine Fragestellung haben, zu dem/der sie sich gerne mit den anwesenden Metadaten-Praktikerinnen und -Praktikern austauschen möchte, können hier eine Diskussionsrunde anbieten, die muss auch nicht großartig vorbereitet sein.


Lightning Talks und Themenvorschläge für Open Sessions können schon im Vorfeld oder spontan während des Workshops eingetragen werden unter: https://pad.gwdg.de/CT0_c20OR5KTIJTsAZAdwA?both 

Moderation: Alex Jahnke

15:00 - 15:10

Abschluss

KIM Workshop 2025 - Wrap-Up

Alex Jahnke (SUB Göttingen), Tracy Arndt (DNB)

15:15 - 15:45Öffentliche Sitzung der DINI-AG KIM
15:45Gemeinsamer Abschluss in der Eismanufaktur Fontanella (die Erfinder des Spaghetti-Eis)


  • Keine Stichwörter