Versionen im Vergleich

Schlüssel

  • Diese Zeile wurde hinzugefügt.
  • Diese Zeile wurde entfernt.
  • Formatierung wurde geändert.

...

Session_4Moderation: Maximilian Kähler Deutsche Nationalbibliothek
09:00 Uhr

Dr. Jennifer D'Souza  NLP Research Group Lead im Projekt Open Research Knowledge Graph in der Forschungsgruppe Data Science and Digital Libraries • TIB Hannover

The LLMs4Subjects community challenge: LLMs meet extreme multi-label classification of records in digital libraries

Toggle Cloak
id@T10
Abstract


Cloak
id@T10

In 2025, Jennifer led the organization of the LLMs4Subjects community challenge, which was featured
 at two major computational linguistics conferences. In her talk today, she will share key insights
 from this effort and reflect on practical implications for libraries and future AI-supported subject indexing.

09:30 Uhr

Clara Wan Ching Ho, M.Sc. • Computerlinguistik  FID Linguistik • Universitätsbibliothek Johann Christian Senckenberg Frankfurt

Humans, Machines, and Meaning: Rethinking Subject Indexing in the Age of AI

Toggle Cloak
id@T11
Abstract


Cloak
id@T11

This talk provides a reality check on the role of large language models (LLMs) in automatic subject indexing. Drawing on the perspective of an academic library and the indexing of a specialized bibliography, we explore how LLMs can complement and scale cataloguing workflows, while highlighting their limitations in producing reliable, updated and meaningful metadata. The session emphasizes the value of human–machine collaboration to ensure both efficiency and semantic integrity.

10:00 Uhr

Yves Maurer   Responsable de la Division  Bibliothèque nationale du Luxembourg (BnL) 

Pit Schneider  Freiberuflicher KI-Ingenieur

Autocat – Automatische Katalogisierung - Autocat Cataloguing Assistant: Descriptive Cataloguing using LLMs 

Toggle Cloak
id@T12
Abstract


Cloak
id@T12

Für die Formalerschließung der digitalen Pflichtabgabe hat die Nationalbibliothek Luxemburg eine Automatisierung anhand von einem Vision Language Model entwickelt. Die Präsentation erklärt die Beweggründe, die Entwicklung der Idee, die Funktionsweise der aktuellen Lösung und geht auf den aktuellen Status des Projektes ein.

10:30 bis 11:00 Uhr • Kaffeepause
11:00 Uhr

Tobias Weberndorfer TU Wien Bibliothek 

GND ; Datenqualität ; RAG : zur Datenqualität im Rahmen eines RAG-Systems für die Maschinelle Beschlagwortung

Toggle Cloak
id@T14
Abstract


Cloak
id@T14

Flexibilität ist einer der bezeichnenden Vorteile eines RAG-Systems zur maschinellen Sacherschließung.  Erschlossene Daten können an
mehreren Stellen des System dazu verwendet werden, die Leistung des Systems zu verbessern:

1. als Trainingsdaten des Embeddingmodell
2. als Datenbasis für das Retrieval
3. als Trainingsdaten des Rerankers

Bestehende Daten weisen jedoch Fehler und Eigenheiten auf, die sich unterschiedlich stark auf diese drei Ebenen auswirken.  Dieser Vortrag soll mit Blick auf tatsächliche GND-Daten und deren Eigenschaften beleuchten, wie sie möglichst ressourcenschonend möglichst große Verbesserungen eines RAG-Systems zur maschinellen Sacherschließung herbeiführen können.  Die grundlegende Frage hierbei lautet: An welcher Stelle sollen welche Daten auf welche Art eingesetzt werden?

Session 5Moderation: Maximilian Kähler Deutsche Nationalbibliothek
11:30 Uhr

Christoph Poley Deutsche Nationalbibliothek 

Hardware für die automatische Erschließung am Beispiel der DNB

Toggle Cloak
id@T15
 Abstract

 

Cloak
id@T15

Neue und sich schnell entwickelnde KI-Methoden und Hardware-Ressourcen helfen dabei, geeignete und Nutzen bringende automatische Verfahren für Bibliotheken zu entwickeln und einzusetzen. Bereits seit 2009 beschäftigt sich die Deutschen Nationalbibliothek (DNB) mit Verfahren für die automatische Inhaltserschließung, die sich seit 2012 im produktiven Einsatz befinden und seitdem systematisch weiterentwickelt werden. Derzeit finden maschinelle Verfahren für die automatische Klassifizierung mit Sachgruppen und Kurznotationen sowie die Indexierung mit GND-Deskriptoren ihre Anwendung.

Der Vortrag gibt zunächst einen Überblick über die aktuellen fachlichen Use Cases und den zugrundeliegenden Verfahren für die automatische Erschließung. Die Use Cases für die Hardware bauen darauf auf, sie unterschieden sich aber grundlegend davon. Sie bilden deshalb den Schwerpunkt der Präsentation und beinhalten die Gegenüberstellung der unterschiedlichen Hardwareanforderungen für die tägliche Produktion, dem Training der Modelle und der Forschung. Weiterhin wird ein Einblick gegeben, wie sich exemplarisch die Verarbeitungszeit von Daten und damit der Verbrauch wertvoller Ressourcen reduzieren lässt. Ebenfalls werden ersten Erfahrungen mit Large Language Models an der der DNB aufgegriffen, wobei der Focus auf den Hardwareanforderungen liegt.

Abschließend werden einige Ideen für die Modellierung eines durchgängigen Hardwarekonzeptes sowie die in der DNB gegangenen Schritte dafür thematisiert.

12:00 Uhr

Prof. Philipp Wieder     Professor für Data Science InfrastructuresInstitut für Informatik Georg-August-Universität GöttingenStellvertretender Leiter der GWDG

Keynote: Nationale Infrastrukturen – Angebote und Perspektiven

Toggle Cloak
id@T16
Abstract 


Cloak
id@T16


12:45 Uhr 

Abschlussdiskussion

13:00 Uhr

Veranstaltungsende

...