Fachtagung
20232026 des Netzwerks maschinelle Verfahren in der Erschließung am
0729. Januar und
08. Dezember 202330. Januar 2026 in Frankfurt
Die nächste Fachtagung des "Netzwerks maschinelle Verfahren in der Erschließung" findet am 29. und 30. Januar 2026 in der Deutschen Nationalbibliothek in Frankfurt statt. Im Fokus stehen aktuelle Entwicklungen der Künstlichen Intelligenz für die Inhalts- und Formalerschließung – von großen Sprachmodellen (LLMs) über Datenqualität und Evaluierung bis hin zu nachhaltiger Infrastruktur und Betrieb.
Das Programm befindet sich derzeit im Aufbau. Bereits zugesagt haben unter anderem Prof. Felix Naumann (Hasso-Plattner-Institut) und Dr. Nicolas Flores-Herr (Fraunhofer IAIS). Details zum vollständigen Programm und Anmeldung folgen in Kürze.
Am 28. Januar 2026 bieten wir zwei Pre-Conference-Workshops mit Hands-on-Elementen an:
- EMa Inside — Daten, Prozesse, Modelle und Hardware für die automatische Inhaltserschließung
- Evaluierung automatischer Verfahren zur Inhaltserschließung
Die Fachtagung richtet sich an Fachleute aus Bibliotheken, Archiven und Gedächtnisinstitutionen sowie an Akteur*innen aus Forschung und Infrastrukturprojekten, die mit KI, LLMs, Datenqualität und/oder Informationserschließung arbeiten, insbesondere an Personen mit technischem/informatischem Schwerpunkt, die neue Werkzeuge, Schnittstellen und datenbasierte Methoden entwickeln oder implementieren.
Die Präsentationen werden im Anschluss online bereitgestellt (CC BY-SA 4.0). Informationen zum Programm folgen in Kürze.
Die Teilnahmegebühr beträgt 33 € für die Fachtagung und 33 € für die Workshopteilname; sie dient der Finanzierung der anfallenden Veranstaltungskosten
Schwerpunkt der Fachveranstaltung der Deutschen Nationalbibliothek waren die aktuellen Entwicklungen im Bereich generativer KI und großer Sprachmodelle und deren Bedeutung für die Bibliotheken.
Was können die neuesten Technologien leisten und welche Herausforderungen, Chancen und Risiken sind damit verbunden (technische, rechtliche und ethische Aspekte)? Sind die aktuellen Sprachmodelle für Anwendungen in Bibliotheken, Wissenschaft und Forschung geeignet? Und wäre es sinnvoll und rechtlich möglich, dass sich Bibliotheken mit ihren umfangreichen Beständen auch am weiteren Aufbau beteiligen? Das sind die Fragen, die beleuchtet werden.
Panel | ||
---|---|---|
| ||
OrganisationAnsprechpersonen: Elisabeth Mödden, Christa Schöning-WalterMaximilian Kähler Veranstaltungskalender DNB: https://www.dnb.de/kibibliotheken2023 Kontakt: ki-ee@dnb.de |
Programm und Präsentationen (CC BY-SA 4.0)
Donnerstag •
0729.
Dezember 2023Januar 2026
Beginn um 13:00 Uhr
Session 1
Datenräume
Daten als Fundament: Qualität und Training
|
Prof. Dr. Wolfgang Nejdl Felix Naumann • Hasso-Plattner-Institut Design IT. Create Knowledge
• Leibniz Universität Hannover, Institut für Data Science & Forschungszentrum L3S
Toggle Cloak | ||
---|---|---|
|
Was Sie schon immer über Datenqualität wissen wollten, aber bisher nicht zu fragen wagten.
Cloak | ||
---|---|---|
| ||
|
Prof. Dr. Georg Rehm • DFKI Berlin, Speech and Language Technology Lab • HU Berlin, Institut für deutsche Sprache und Linguistik
Toggle Cloak | ||
---|---|---|
|
Cloak | ||
---|---|---|
| ||
|
Session 2
Infrastrukturen und Werkzeuge
|
Gesellschaft im Wandel: Recht, Arbeit und Akzeptanz
Toggle Cloak | ||
---|---|---|
|
Cloak | ||||
---|---|---|---|---|
| ||||
Die Suche nach Informationen steht wieder einmal an einem Wendepunkt in ihrer langen Geschichte: Texte und Bilder, die früher ausschließlich aus Sammlungen bestehender Dokumente abgerufen wurden, können jetzt auf Anfrage synthetisiert werden. Aufgrund der jüngsten Fortschritte in der generativen KI im Allgemeinen und bei großen Sprachmodellen (LLMs) im Besonderen erwarten die Suchenden zunehmend, dass sie von der manuellen Aufgabe entlastet werden, die relevanten Teile der abgerufenen Dokumente zu identifizieren, und erwarten stattdessen Antworten in Form von Text- oder Multimediadokumenten. Dieser Umbruch verläuft parallel zu der wahrgenommenen Verschlechterung der Qualität der Ergebnisse traditioneller Web-Suchmaschinen. Seit Jahren beschweren sich die Nutzer/innen sozialer Medien über die geringe Relevanz der Suchergebnisse der großen Suchmaschinen. In dieser Hinsicht könnte generative KI eine Schlüsselrolle bei einer Renaissance der Informationsbeschaffung spielen. Dennoch lauern hier auch Risiken und es bedarf offener Daten und neuen Infrastrukturen, um diesen Herausforderung begegnen. |
|
Toggle Cloak | ||
---|---|---|
|
visible | true |
---|---|
id | @T8 |
Meine zentrale Hypothese ist, dass der wissenschaftliche Fortschritt nur gewährleistet werden kann, wenn (1) Daten in großem Maßstab verfügbar sind, (2) diese Daten sinnvoll repräsentiert und verknüpft sind und (3) die Besonderheiten der einzelnen Disziplinen sehr sorgfältig berücksichtigt werden.Im Vortrag konzentriere ich mich auf Forschungsdateninfrastrukturen und deren Bedeutung für moderne Forschung. Es wird ein Überblick über aktuelle technische Entwicklungen gegeben, wobei der Schwerpunkt auf der Repräsentation und Verknüpfung von digitalen Artefakten wie Publikationen, Forschungsdaten und Forschungssoftware liegt.
Session 3
Recht und Ressourcen
|
Toggle Cloak | ||
---|---|---|
|
Cloak | ||||
---|---|---|---|---|
| ||||
|
Dr. Thomas Fricke • Consultant
Toggle Cloak | ||
---|---|---|
|
visible | true |
---|---|
id | @T7 |
Even before the AI hype the energy and water consumption of data centers has grown exponentially. With the arrival of Large Language Models LLMs the problem has grown dramatically.
The talk will raise questions about how to handle the unprecedented hype and try to give responses. Is the public discussion about ethical AI really necessary or just a distraction from the real problems? Can we improve the models and the usage of AI in a way to answer useful questions?Freitag •
0830.
Dezember 2023Januar 2026
Session 4
Technologien und Initiativen
Anwendungen für die Erschließung
|
Prof. Dr. Felix Sasaki • SAP SE
Toggle Cloak | ||
---|---|---|
|
Cloak | ||||
---|---|---|---|---|
|
Info | ||
---|---|---|
| ||
Englische Version der Präsentation |
Hans Ole Hatzel • Universität Hamburg, Department of Informatics, Language Technology Group
Toggle Cloak | ||
---|---|---|
|
Cloak | ||||
---|---|---|---|---|
| ||||
Traditionell wird in den digitalen Literaturwissenschaften oft explorativ mit unterschiedlichen Eigenschaften von Texten, wie etwa Worthäufigkeiten, gearbeitet. Zusätzlich wird auch Forschung auf Grundlage von Annotationen komplizierterer Konzepte betrieben. Spätestens seit dem Aufkommen von Sprachmodellen wie BERT lassen sich viele Annotationsschemata automatisiert umsetzen, sodass Analysen der entsprechenden Konzepte auf großen Korpora ermöglicht werden. In diesem Vortrag wird der Stand der Techniken im Feld der digitalen Literaturwissenschaften dargelegt. Daraufhin werden die Herausforderungen diskutiert vor denen das Feld auch unter der Zuhilfenahme von LLMs weiterhin steht, insbesondere in Bezug auf die semantische Erschließung von Texten. |
|
Christoph Schuhmann, Jenia Jitsev • Laion gemeinnütziger Verein e.V.
Toggle Cloak | ||
---|---|---|
|
Cloak | ||
---|---|---|
| ||
Session 5
Fairness und Erklärbarkeit
Felix Friedrich • Technische Universität Darmstadt, Computer Science Department, Hessian.AI and AI/ML Group
Toggle Cloak | ||
---|---|---|
|
visible | true |
---|---|
id | @T9 |
Andererseits sehen wir, dass aktuelle Modelle stark verzerrt (biased) sind. Dies ist nicht sonderlich überraschend, da sie self-supervised auf riesigen Mengen ungefilterter Daten aus dem Internet trainiert werden. Sie laufen daher Gefahr diese (Internet-)Vorurteile widerzuspiegeln. Entsprechend ist eine weitere Herausforderung, die erlernten Darstellungen in diesen Modellen besser zu verstehen und sie in beliebige Richtungen verändern zu können, um den Weg für fairere KI-Modelle zu ebnen.
Hans-Jörg Schäuble • Aleph Alpha GmbH
Toggle Cloak | ||
---|---|---|
|
Cloak | ||
---|---|---|
| ||