Im Rahmen des → Netzwerks maschinelle Verfahren in der Erschließung führt die Deutsche Nationalbibliothek hat am 03. und 04. November 2022 einen ein Workshop durchstattgefunden, der den Einsatz von KI und DH in Bibliotheken zum Schwerpunkt hathatte. Teilnehmende aus der Staatsbibliothek zu Berlin, der Bayerischen Staatsbibliothek, der TIB – Leibniz-Informationszentrum Technik und Naturwissenschaften, der ZBW – Leibniz-Informationszentrum Wirtschaft und der Deutschen Nationalbibliothek stellen ihre Ziele und Untersuchungsergebnisse vor und tauschen tauschten sich auf Arbeitsebene über ihre Erfahrungen und Erkenntnisse aus.
Eine Teilnahme ist nur auf Einladung möglich.
Donnerstag • 03. November 2022
Der diesjährige Workshop beschäftigte sich mit Themen, die im Rahmen der maschinellen Aufbereitung und Analyse von Texten oder Bildern zu bearbeiten sind. Die beteiligten Bibliotheken arbeiten an ähnlichen Aufgaben und haben sich auf eine vertiefte Zusammenarbeit verständigt. Vorgestellt wurden Methoden und Services, die in den Bibliotheken entwickelt, evaluiert oder genutzt werden, um die inhaltlichen Konzepte von Texten oder Bildern maschinell zu erfassen, sie thematisch richtig zu klassifizieren oder Ähnlichkeiten zu erkennen. Vielfach kommen Open Source-Entwicklungen zum Einsatz, teils werden auch Dienste kommerzieller Anbieter erprobt. Einige der Algorithmen erfordern enorme Rechenleistungen, so dass auch die Zusammenarbeit mit Hochleistungsrechenzentren in Betracht gezogen wird. Im Forschungsprojekt „Automatisches Erschließungssystem – Inhaltliche Erschließung von Publikationen mit KI"will die Deutsche Nationalbibliothek verschiedene methodische Ansätze systematisch evaluieren. Dafür wird ein professionelles Datenmanagement benötigt. Hinzu kommen neuartige rechtliche Fragen, die im Zusammenhang mit Open Source-Entwicklungen und kooperativ organisierten Forschungsarbeiten zu klären sind. Und nicht zuletzt sind die zentralen Fragen der Qualität zu nennen, die alle Institutionen intensiv beschäftigen. Wann sind die Ergebnisse der maschinellen Verfahren gut genug und wie kann Qualität gemessen werden?
Die Präsentationen stellen wir hier zum Download bereit (CC BY-SA 3.0). Auf der Website der Deutschen Nationalbibliothek finden Sie diesen Blogbeitrag.
...
I - Berichte zu Projekten der teilnehmenden Institutionen
...
...
Session_1
...
...
- der DNB
Maximilian Kähler • Deutsche Nationalbibliothek, Leipzig Christa Schöning-Walter • Deutsche Nationalbibliothek, Frankfurt
|
Column |
---|
| View file |
---|
name | DNB_Projekte_Aktivitaeten_2022-11-03.pdf |
---|
height | 150 |
---|
|
|
|
Section |
---|
Column |
---|
| - Methoden der Digital Humanities in Anwendung für den Aufbau und die Nutzung von Webarchiven
Katharina Schmid • Bayerische Staatsbibliothek, München
|
Column |
---|
| View file |
---|
name | BSB_Webarchiv_DH_Workshop.pdf |
---|
height | 150 |
---|
|
|
|
Section |
---|
Column |
---|
| View file |
---|
name | BSB_KI_DH BÄ.pdf |
---|
height | 150 |
---|
|
|
|
Section |
---|
Column |
---|
| - Yewno Discover & Yewno Unearth: Nutzung von Yewno Unearth zur automatischen Inhaltserschließung von Grauer Literatur aus Südosteuropa - Projektziele und Workflow
Dr. Arnost Stanzel • Bayerische Staatsbibliothek, München Ronny Sternecker • Bayerische Staatsbibliothek, München
|
Column |
---|
| View file |
---|
name | 2022-11-03_Yewno-v0-5.pdf |
---|
height | 150 |
---|
|
|
|
|
...
...
Column |
---|
| View file |
---|
name | KI@SBB@DNB.pdf |
---|
height | 150 |
---|
|
|
|
Section |
---|
Column |
---|
| View file |
---|
name | AutoSE_NMVE2022.pdf |
---|
height | 150 |
---|
|
|
|
Section |
---|
Column |
---|
| - Fächerklassifikation mit Annif für die Fachfacetten des TIB-Portals
Dr. Holger Israel • TIB – Leibniz-Informationszentrum Technik und Naturwissenschaften, Hannover
|
|
|
...
Session_2
...
Erfahrungsaustausch zu den Schwerpunktthemen - I
Column |
---|
| View file |
---|
name | TIB_Faecherklassifikation_annif.pdf |
---|
height | 150 |
---|
|
|
|
|
...
II - Erfahrungsaustausch zu Schwerpunktthemen
...
Panel |
---|
title | Thema 1 - INFRASTRUKTUR |
---|
|
|
...
Thema 1: Infrastruktur
...
Thema 2: Thematische Suche und Präsentation
...
| - Infrastruktur für KI-Verfahren in der DNB
Christoph Poley • Deutsche Nationalbibliothek, Leipzig
|
|
Section |
---|
Column |
---|
| - GPUs – Kosten, Skalierung, Betrieb & Wartung, Virtualisierung, On-Premise vs. Cloud
Clemens Neudecker • Staatsbibliothek zu Berlin - Preußischer Kulturbesitz
|
|
Section |
---|
Column |
---|
| - Erstellung und Betrieb eines Kubernetes-Clusters zur Ausführung von AutoSE-Core
Christopher Bartz • ZBW – Leibniz-Informationszentrum, Hamburg
|
|
|
...
Column |
---|
| View file |
---|
name | AutoSE_NMVE2022_k8s.pdf |
---|
height | 150 |
---|
|
|
|
|
Panel |
---|
title | Thema 2 - THEMATISCHE SUCHE UND PRÄSENTATION |
---|
|
|
...
| - Yewno Discover und Yewno Unearth
Dr. Arnost
|
|
|
...
- Stanzel • Bayerische Staatsbibliothek, München
Ronny
|
|
|
...
- Sternecker • Bayerische Staatsbibliothek, München
|
|
|
...
Freitag • 04. November 2022
...
Session_3
...
Erfahrungsaustausch zu den Schwerpunktthemen - II
...
Thema 3: Daten
...
...
Impulsvortrag
- Datenmanagement mit DVC
Nico Wagner • Deutsche Nationalbibliothek, Leipzig
...
...
Session_4
...
Erfahrungsaustausch zu den Schwerpunktthemen - III
Thema 5: Terminologie / Vokabular
...
Panel |
---|
|
Section |
---|
Column |
---|
| - Datenmanagement mit DVC
Maximilian Kähler • Deutsche Nationalbibliothek, Leipzig Nico Wagner • Deutsche Nationalbibliothek, Leipzig
|
Column |
---|
| View file |
---|
name | 20221104 Datenmanagement mit DVC_final.pdf |
---|
height | 150 |
---|
|
|
|
|
Panel |
---|
title | Thema 4 - TOOLS PROGRAMMIEREN |
---|
|
Section |
---|
Column |
---|
| - Open-Source-Software - ein kurzer Aufriss und viele Fragen
Christoph Poley • Deutsche Nationalbibliothek, Leipzig
|
|
|
Panel |
---|
title | Thema 5 - TERMINOLOGIE / Vokabular |
---|
|
|
...
| - Aufbereitung der GND für KI-Verfahren
Jan-Helge Jacobs • Deutsche Nationalbibliothek, Leipzig Nico Wagner • Deutsche Nationalbibliothek, Leipzig
|
|
|
...
Impulsvortrag
...
Session_5
...
Erfahrungsaustausch zu den Schwerpunktthemen - IV
Column |
---|
| View file |
---|
name | 20221104_Aufbereitung der GND für KI-Verfahren.pdf |
---|
height | 150 |
---|
|
|
|
|
Panel |
---|
title | Thema 6 - QUALITÄTSGESICHERTE TEXTEXTRAKTION UND TEXTERKENNUNG |
---|
|
Section |
---|
Column |
---|
| - Herausforderungen der Textextraktion im Produktivbetrieb der DNB
Christa Schöning-Walter • Deutsche Nationalbibliothek, Frankfurt Sandro Uhlmann • Deutsche Nationalbibliothek, Leipzig
|
Column |
---|
| View file |
---|
name | 20221104_Textextraktion_Texterkennung.pdf |
---|
height | 150 |
---|
|
|
|
|
...
Thema 7: Qualität
...
| - Evaluation im DNB-KI-Projekt
Maximilian Kähler • Deutsche Nationalbibliothek, Leipzig
|
Column |
---|
| View file |
---|
name | 2022-11-04_evaluation-im-dnb-ki-projekt.pdf |
---|
height | 150 |
---|
|
|
|
Section |
---|
Column |
---|
| - Qualitätsmaßnahmen in AutoSE an der ZBW
Dr. Anna
|
|
|
...
- Kasprzik • ZBW – Leibniz-Informationszentrum, Hamburg
Christopher Bartz
|
|
|
...
...
- – Leibniz-Informationszentrum, Hamburg
- Teil 2: Maschinell gelernte
|
|
|
...
Column |
---|
| View file |
---|
name | AutoSE_NMVE2022_human.pdf |
---|
height | 150 |
---|
|
|
|
Section |
---|
Column |
---|
| View file |
---|
name | AutoSE_NMVE2022_qualle.pdf |
---|
height | 150 |
---|
|
|
|
|