Wann: 

20. - 21. April 2026 

Wo:

online unter 

https://meet.academiccloud.de/gl/rooms/c8s-s9e-qgp-ejf/join (Achtung: das ist ein anderer Raum als sonst)

Kurzfristige Änderung des Veranstaltungsortes am 20.04. 10:30 - 11:00 Uhr! https://uni-mannheim.zoom-x.de/j/63529110336?pwd=ahZcVvbo5V8hNtiRTID5hHOwC70gGm.1

Veranstalter:

DINI-AG KIMUB Mannheim
Programmkomitee+
Organisationsteam:

Alex Jahnke (SUB Göttingen), Sylvia Hulin (UB Mannheim), Tracy Arndt (DNB), Tobias Bülte (hbz), Max-Ferdinand Zeterberg (SUB Göttingen)

Kurznachrichtendienste:

Mastodon-Hashtag #kimws26
Kontakt:kim-info@dini.de


Programm

Hinweis: Hinter dem  ist jeweils das entsprechende Thema im metadaten.community-Forum verlinkt, wo sich zu den jeweiligen Beiträgen ausgetauscht werden kann.

Montag, 20. April 2026

09:15 - 09:30

Begrüßung

Tracy Arndt (DNB), Max Zeterberg (SUB Göttingen) (DINI-AG KIM AG-Sprecherin und -Sprecher)

09:30 - 10:00

Vortrag

Karl-Ulrich Krägelin (Uni Münster): InvenioRDM an der ULB Münster – Erfahrungsbericht und Showcase

InvenioRDM ist eine Open-Source-Repositoriumssoftware mit einem DataCite-kompatiblen Metadatenmodell und modernem Python/React-Stack. Ursprünglich vom CERN entwickelt, hat sich rund um InvenioRDM eine internationale Community gebildet, die die Software aktiv weiterentwickelt.

Die Universitäts- und Landesbibliothek (ULB) Münster ist in dieser Community als Projektpartner und Maintainer aktiv. Im Vortrag wird aus technischer Perspektive über den Einsatz von InvenioRDM in drei Kontexten berichtet: 2025 wurde ein "Dark Archive", 2026 dann das öffentliche Forschungsdatenrepositorium der Universität mit InvenioRDM umgesetzt und bis Ende 2026 ist geplant, den Publikationsdienst der Universität auch auf InvenioRDM umzustellen.

Neben dem Aufbau und den Betriebserfahrungen soll gezeigt werden, wie InvenioRDM über sein Erweiterungsmodell institutionsspezifisch angepasst werden kann. Auch soll es kurz um Lessons Learned zu Personalressourcen, Kenntnissen und Zeitrahmen sowie Empfehlungen für Institutionen, die den Einsatz von InvenioRDM erwägen, gehen.

10:00 - 10:30

Vortrag

Philipp Zumstein (UB Mannheim): Fake Referenzen prüfen

Mit KI-Chatbots können schnell Texte produziert werden, welche wissenschaftlich aussehen aber Halluzinationen enthalten. Fake Referenzen sind in diesem Zusammenhang Zitationen und Einträge im Literaturverzeichnis, bei welchen die angegebenen Quellen nicht existieren oder die gemachten Angaben wie Autor*innen-Vornamen falsch sind.

Im Vortrag werden Erfahrungen bei der manuellen Prüfung von Fake Referenzen angesprochen und ein Open-Source-Tool [1] vorgestellt, welches bei der Prüfung unterstützen kann. Dieses sucht automatisch die angegebenen Quellen in verschiedenen Datenquellen (DOI-Registrierungsagenturen, OpenAlex, GoogleBooks, ZDB) und gleicht die bibliographischen Metadaten dort mit den gemachten Angaben ab.

[1] https://github.com/UB-Mannheim/check-fake-references

Folien

10:30 - 11:00

Vortrag

Jan Heinicke (BVA, Kompetenzzentrum Open Data): Open Data verbindet: Offene Verwaltungsdaten und gemeinsamer Austausch

Offene Daten entstehen heute in nahezu allen Bereichen der Verwaltung.

Für die Bundesverwaltung bildet §12a EGovG die rechtliche Grundlage für die Veröffentlichung als Open Government Data.

Doch was bedeutet das konkret für die Bereitstellung? Welche Anforderungen und Rahmenbedingungen sind zu beachten?

Gleichzeitig zeigt sich: Die Bereitstellung von Daten allein reicht nicht aus. Erst durch Austausch, Abstimmung und gemeinsamer Weiterentwicklung entfaltet Open Data sein volles Potential - auch über die Verwaltung hinaus.

Um diesen Austausch zu fördern, wurde 2024 ein gemeiner digitaler Raum geschaffen: das Open Data Forum.

Es bietet die Möglichkeit, Erfahrungen zu teilen, Fragen zu klären und die Weiterentwicklung von Open Data gemeinsam voranzubringen.

Der Vortrag gibt einen Überblick über die Grundlagen offener Verwaltungsdaten und zeigt, wie Austausch und Vernetzung deren Mehrwert in der Praxis stärken können.

11:00 - 11:15Programmpause
11:15 - 11:45

Vortrag

David Zellhöfer (HWR Berlin): Warum Recherchekompetenzen für die Daten-getriebene Verwaltung essenziell sind – Eine Fallstudie

Das Jahr 2025 zeigte anschaulich, dass das Unwissen um bibliothekarische Kernarbeitsbereiche und mangelhafte Recherche durch die Bundesverwaltung nicht nur 25 Millionen Euro Schaden verursachen können, sondern - trotz Nischenthema - auch zum Streisand-Effekt führen können. 

Am Beispiel eines Gutachtens für die Information Professionals der Bundesverwaltung, zeigt der Vortrag auf, warum man bei Informationsmanagement-Problemen auf die Arbeit moderner Bibliotheken schauen sollte und über welche Kompetenzen das dort tätige Personal für die Transformation hin zur Daten-getriebenen Verwaltung verfügt und warum sich dieses in die Verwaltungsdigitalisierung einbringen sollte, damit es endlich einmal vorangeht...

Folien

11:45 - 12:15

Vortrag

Jan Schachtschabel (edu-sharing.net e.V.): Von lückenhaften Metadaten zu KI-ready: der Einsatz maschineller Verfahren bei WirLernenOnline

Wir betreiben eine offene Plattform, die digitale (OER‑) Bildungs-Ressourcen indexiert und über ein umfangreiches Metadaten‑Modell auffindbar und für verschiedene Anwendungsszenarien zugänglich macht. Am Beispiel unseres Projekts IT's JOINTLY zeigen wir, welche maschinellen Methoden wir gezielt einsetzen:

- um bestehende Metadaten automatisiert anzureichern

- um Qualitätseinschätzungen zu Inhalten vorzuschlagen

- um zusätzliche Daten‑Assets bereitzustellen, die den Nutzen der Ressourcen insbesondere für generative KI‑Modelle im Bildungsbereich steigern

- um innovative Use Cases auszuprobieren, die sich aus umfangreichen und gut vernetzten Daten ergeben könnten Der Vortrag zeigt die eingesetzten Verfahren anhand konkreter Beispiele aus der Praxis.

Folien

12:15 - 12:45

Vortrag

Dorothea Strecker (HU Berlin): Disziplinspezifische und generische Metadatenschemata - Untersuchung der Metadatenlieferung an DataCite

Da Forschungsdaten nicht selbsterklärend sind, sind strukturierte Metadaten erforderlich, damit sie gefunden, bewertet und gegebenenfalls nachgenutzt werden können. Die Anforderungen an Metadaten für Forschungsdaten sind vielfältig, das zeigen beispielsweise die “FAIR Guiding Principles for scientific data management and stewardship”: Einerseits wird mit R1.3 die Bedeutung disziplinspezifischer Metadatenschemata betont. Zugleich stärken F1 und F4 die Rolle des generischen Metadatenschemas der DOI Registration Agency DataCite. Um mit dieser Spannung umzugehen, halten viele Forschungsdatenrepositorien Metadatensätze in mehr als einem Schema vor.

DataCite wird als vielversprechende Datenquelle für Metadaten zu Forschungsdaten angesehen, allerdings wird teilweise die Vollständigkeit der Metadatensätze bemängelt. Ein häufig diskutierter Lösungsansatz schlägt vor, Metadatensätze bei DataCite zu vervollständigen, indem durch optimierte Mappings mehr lokal vorliegende Metadaten an den Dienst geliefert werden.

Die vorgestellte Studie befasst sich mit diesem Ansatz und untersucht die Metadatenbestände von 8 disziplinspezifischen Forschungsdatenrepositorien aus den Sozial- und Geowissenschaften. Dazu wurden Metadatensätze verglichen, die dasselbe Objekt beschreiben und auf (1) einem disziplinspezifischen Metadatenschema (DDI, DIF, ISO 19139) und (2) dem DataCite Metadata Schema basieren.

Preprint

12:45 - 13:15

Programmpause

13:15 - 14:15

Diskussion

André Hohmann: Anwendung von Rights Expression Languages (REL) in Einrichtungen des kulturellen Erbes

Im Rahmen der DFG Pilotphase "Digitalisierung und Bereitstellung (noch) rechtebewehrter Objekte" wird unter anderem die Anwendung von Rights Expression Languages (REL) geprüft, um Beschränkungen von Objekten maschineninterpretierbar zu beschreiben. In einem Pilotprojekt der SLUB Dresden mit der SBB-PK wird insbesondere die Library Rights Machine-readable Language (LibRML) auf praktische Anwendung im Bereich Retrodigitalisierung untersucht.

In der DINI-AG KIM Lizenzen Gruppe sollen Anwendungsmöglichkeiten der REL ebenfalls diskutiert und mögliche Standardisierungen untersucht werden. Im besten Fall können Empfehlungen formuliert werden, wie zum Beispiel Empfehlungen für Rechteinformationen in Metadaten (3.0). Dies ist jedoch unter anderem abhängig von den angewendeten Systemen, den zu berücksichtigenden Objekten sowie den bestehenden Abläufen in den Einrichtungen. 

In dieser Session wollen wir mit Euch über die Möglichkeiten des Einsatzes von REL in Einrichtungen des kulturellen Erbes sprechen. Nach einem Impulsvortrag könnten wir insbesondere die folgenden Aspekte diskutieren

  • Anwendung der Rights Expression Languages
    • In Metadaten
    • In Systemen zur Verwaltung von Beschränkungen/Berechtigungen
  • Anwendungsfälle Beschränkungen, Anforderungen an Rights Expression Languages
  • Integration der Rights Expression Languages in bestehende Workflows, insbesondere Retrodigitalisierung (zum Beispiel Ableitung der Beschränkungen aus bestehenden Rechteinformationen)

Folien - Lizenzen Gruppe + Mailing-Liste (für weiteren Austausch)


Dienstag, 21. April 2026

09:15 - 09:30

Ankommen

09:30 - 10:00

Vortrag

Argie Kasprzik, Lakshmi Rajendram Bashyam (ZBW): The challenge of making AI methods work for automated subject indexing with library data (in English)

At ZBW, the AI-based service for automated subject indexing ("AutoSE") has been in productive operations since 2021 and is continuously improved and extended. We use machine learning methods that are developed or adapted in the context of our own in-house applied research. Which models or which combination of models is the best choice for the automation of a subject indexing use case strongly depends on the amount and the characteristics of the data available for training and as input in productive operations, and also on the structure and design of the controlled target vocabulary of descriptors.

We report on some experimental results regarding the interaction of our data sets with the various models we are using or considering to use, including embedding- and transformer-based models by looking at typical errors those models make when applied to our data. We have also evaluated the influence of the structure of the controlled vocabulary "Standard-Thesaurus Wirtschaft" (STW) that is used for subject indexing at ZBW. We conclude with an outlook on how to make these components work together better in the future.

Folien

10:00 - 10:30

Vortrag

Vicky Schirmer: Systemlandschaft E-Ressourcen - Ergebnisse und Erkenntnisse

Die Arbeitsgruppe Systemlandschaft E‑Ressourcen – eine einrichtungsübergreifende Initiative, koordiniert von EZB und ZDB – verfolgt das Ziel, mehr Transparenz über Datenflüsse und Systemabhängigkeiten im Bereich des Electronic Resource Managements (ERM) zu schaffen. Im Rahmen eines Initialprojekts wurde eine interaktive Systemlandkarte entwickelt, die derzeit rund 70 Systeme sowie mehr als 150 Datenaustauschprozesse inklusive zugehöriger Metadaten abbildet. Die zugrunde liegenden Informationen basieren auf strukturierten Befragungen von Systembetreibern.

Die Systemlandkarte ist frei zugänglich und bietet vielfältige Einsatzmöglichkeiten für infrastrukturelle Fragestellungen, etwa zur Identifikation von Abhängigkeiten, Optimierung von Workflows oder Unterstützung kooperativer Projekte im Bibliotheks- und Informationsumfeld. Der Vortrag soll einen Einblick in die Entstehung, Methodik und Ergebnisse des Projekts geben und Möglichkeiten zur Nachnutzung aufzeigen.

10:30 - 11:00

Vortrag

Sebastian Zug, Oliver Löwe (TU Freiberg): OER-ConnectedLecturers

Seit 2018 weist die UB Freiberg in ihrem Katalog OER-Materialien aus dem sächsischen Lern-Management-System OPAL nach. Diesem Schritt der Öffnung eines gekapselten Systems und der Verfügbarmachung offener Daten steht eine schlechte Nutzung gegenüber, die maßgeblich in fehlenden Metadaten begründet ist. Die Dokumente können schlichtweg nicht gefunden werden.

Hier setzt das Projekt OER ConnectedLecturers an, das als zentrale Komponente eine KI-basierte Pipeline zur Ermittlung von Metadaten aus verschiedenen Quellen für textuelle Materialien aus OPAL implementiert. Im zweiten Schritt findet auf der Grundlage der verfügbaren Metadaten eine semantische Ähnlichkeitsanalyse statt, die einen Überblick über thematisch verwandte offene Materialien bietet und damit die Möglichkeit z.B. für Lehrende schafft, sich an vorhandenen Ressourcen zu orientieren. Ein interaktiver Graph demonstriert als Proof-of-Concept, wie Ähnlichkeitsstruktur und Metadaten zusammenwirken, um eine explorative Suche in heterogenen OER-Beständen zu ermöglichen.

Der Vortrag widmet sich der vollständigen Daten-Pipeline für Aggregation, Vorverarbeitung, Metadatenextraktion und Ähnlichkeitsanalyse.

11:00 - 11:15Programmpause
11:15 - 11:45

Vortrag

Andrea Hemmer und Michaela Edelmann (DNB, Arbeitsstelle für Standardisierung): Dokumentationsplattform des Standardisierungsausschusses - Teil 1 (Standards und deren redaktionelle Weiterentwicklung)

  • Was ist die STA-Plattform und welche Standards sind dort zu finden?
  • Wie entstehen die Inhalte für die STA-Plattform?

Die Dokumentationsplattform des Standardisierungsausschusses ist zentraler Zugriffspunkt für alle Standards, Empfehlungen und Verabredungen der Gremien und Arbeitsgruppen des Standardisierungsausschusses.
Auf der STA-Plattform werden die unter dem Namen RDA DACH zusammengeführten Erschließungsregeln für den deutschsprachigen Raum und die Regeln für die Pflege der Gemeinsamen Normdatei (GND) veröffentlicht. Diese Standards sind die Basis für strukturierte Titel- und Normdaten. Mit der STA-Plattform steht ein Webtool zur Verfügung, das Nutzenden vielfältige Einstiegspunkte für ihre tägliche Arbeit bietet.

Die Entstehung der Inhalte auf der STA-Plattform werden durch einen Releaseprozess unterstützt und gesteuert. Im Releaseprozess arbeiten die Gremien des Standardisierungsausschusses in einem gemeinsamen Rhythmus und stimmen ihre Ergebnisse miteinander ab. Dies unterstützt die Akzeptanz der Standards und gewährleistet eine verbreitete Anwendung.

Wir stellen die STA-Plattform und die dort veröffentlichten Standards vor und geben einen Einblick wie die Gremien des Standardisierungsausschusses im Rahmen des Releaseprozesses miteinander arbeiten.

Folien

11:45 - 12:15

Vortrag

Mathias Manecke (DNB, Arbeitsstelle für Standardisierung): Dokumentationsplattform des Standardisierungsausschusses - Teil 2 (Datenmodell und technische Umsetzung)  

  • Wie ist die STA-Plattform aufgebaut?
  • Welches Datenmodell und welche technische Infrastruktur steckt dahinter?

Die Inhalte der Plattform werden in einer Wikibase-Anwendung gepflegt. Wikibase ist ein Set von MediaWiki-Erweiterungen zur RDF-basierten Speicherung strukturierter Informationen. Auf der Basis des simplen RDF-Datenmodells wurde für die Dokumentationsplattform ein Datenmodell entwickelt, welches mit dem hinter RDA und der GND stehenden IFLA-LRM korrespondiert. RDA-Elemente, GND-Datenfelder und –Unterfelder sind als Properties und Entitäts- und Ressourcentypen sind als Items modelliert. Darüber hinaus gibt es Items für einfache Fließtexte und kleinere Regelbausteine.

Wir zeigen, wie aus diesen Datenelementen die WEB-Anwendung für die STA-Plattform entsteht, wie diese Elemente gepflegt und weiterentwickelt werden und welche Möglichkeiten es gibt, die Inhalte für andere Anwendungen nachzunutzen.

12:15 - 12:45

Programmpause

12:45 - 13:15

Diskussion

Adrian Pohl (hbz): (Wie) werden öffentliche Einrichtungen ihrer Verantwortung für offene Standards gerecht?

In dieser Session werden Fragen zur Beteiligung an Standardisierungsaktivitäten durch Gedächtnisinstitutionen und öffentliche Einrichtungen im Allgemeinen diskutiert, unter anderen:

- Wo/Wie beteiligen wir uns bereits an Standardentwicklung und -pflege?
- Welchen Mustern folgt die Beteiligung derzeit?
- Welche Motivation und welche Anreize gibt es für die Teilnahme an Standardisierungsaktivitäten?
- Welche Probleme entstehen durch eine zu geringe Beteiligung an Internet- und Webstandards?
- Wie können wir die Aktivität in diesem Bereich steigern?

Nach einem etwa zehnminütigen Impulsvortrag werden diese und andere Fragen gemeinsam diskutiert, Probleme und Lösungsansätze gesammelt. 

13:15 - 14:15


  • Keine Stichwörter