Versionen im Vergleich

Schlüssel

  • Diese Zeile wurde hinzugefügt.
  • Diese Zeile wurde entfernt.
  • Formatierung wurde geändert.

Im Rahmen des → Netzwerks maschinelle Verfahren in der Erschließung führt die Deutsche Nationalbibliothek hat am 03. und 04. November 2022 einen ein Workshop durchstattgefunden, der den Einsatz von KI und DH in Bibliotheken zum Schwerpunkt hathatte. Teilnehmende aus der Staatsbibliothek zu Berlin, der Bayerischen Staatsbibliothek, der TIB – Leibniz-Informationszentrum Technik und Naturwissenschaften, der ZBW – Leibniz-Informationszentrum Wirtschaft und der Deutschen Nationalbibliothek stellen ihre Ziele und Untersuchungsergebnisse vor und tauschen tauschten sich auf Arbeitsebene über ihre Erfahrungen und Erkenntnisse aus.

Eine Teilnahme ist nur auf Einladung möglich.

Donnerstag • 03. November 2022

Der diesjährige Workshop beschäftigte sich mit Themen, die im Rahmen der maschinellen Aufbereitung und Analyse von Texten oder Bildern zu bearbeiten sind. Die beteiligten Bibliotheken arbeiten an ähnlichen Aufgaben und haben sich auf eine vertiefte Zusammenarbeit verständigt. Vorgestellt wurden Methoden und Services, die in den Bibliotheken entwickelt, evaluiert oder genutzt werden, um die inhaltlichen Konzepte von Texten oder Bildern maschinell zu erfassen, sie thematisch richtig zu klassifizieren oder Ähnlichkeiten zu erkennen. Vielfach kommen Open Source-Entwicklungen zum Einsatz, teils werden auch Dienste kommerzieller Anbieter erprobt. Einige der Algorithmen erfordern enorme Rechenleistungen, so dass auch die Zusammenarbeit mit Hochleistungsrechenzentren in Betracht gezogen wird. Im Forschungsprojekt „Automatisches Erschließungssystem – Inhaltliche Erschließung von Publikationen mit KI"will die Deutsche Nationalbibliothek verschiedene methodische Ansätze systematisch evaluieren. Dafür wird ein professionelles Datenmanagement benötigt. Hinzu kommen neuartige rechtliche Fragen, die im Zusammenhang mit Open Source-Entwicklungen und kooperativ organisierten Forschungsarbeiten zu klären sind. Und nicht zuletzt sind die zentralen Fragen der Qualität zu nennen, die alle Institutionen intensiv beschäftigen. Wann sind die Ergebnisse der maschinellen Verfahren gut genug und wie kann Qualität gemessen werden?

Die Präsentationen stellen wir hier zum Download bereit (CC BY-SA 3.0). Auf der Website der Deutschen Nationalbibliothek finden Sie diesen Blogbeitrag.

...

I - Berichte zu Projekten der teilnehmenden Institutionen

...

Panel


Section


Column
width70%

...

Session_1

...

...

  •  der DNB
    Maximilian Kähler • Deutsche Nationalbibliothek, Leipzig  
    Christa Schöning-Walter • Deutsche Nationalbibliothek, Frankfurt


Column
width25%

View file
nameDNB_Projekte_Aktivitaeten_2022-11-03.pdf
height150




Section


Column
width70%
  • Methoden der Digital Humanities in Anwendung für den Aufbau und die Nutzung von Webarchiven
    Katharina Schmid • Bayerische Staatsbibliothek, München


Column
width25%

View file
nameBSB_Webarchiv_DH_Workshop.pdf
height150




Section


Column
width70%


Column
width25%

View file
nameBSB_KI_DH BÄ.pdf
height150




Section


Column
width70%
  • Yewno Discover & Yewno Unearth: Nutzung von Yewno Unearth zur automatischen Inhaltserschließung von Grauer Literatur aus Südosteuropa - Projektziele und Workflow
    Dr. Arnost Stanzel • Bayerische Staatsbibliothek, München
    Ronny Sternecker • Bayerische Staatsbibliothek, München


Column
width25%

View file
name2022-11-03_Yewno-v0-5.pdf
height150




Section


Column
width70%

...

...


Column
width25%

View file
nameKI@SBB@DNB.pdf
height150




Section


Column
width70%


Column
width25%

View file
nameAutoSE_NMVE2022.pdf
height150




Section


Column
width70%
  • Fächerklassifikation mit Annif für die Fachfacetten des TIB-Portals
    Dr. Holger Israel • TIB – Leibniz-Informationszentrum Technik und Naturwissenschaften, Hannover


Column
width25%

View file
nameTIB_Faecherklassifikation_annif.pdf
height150

...

Session_2



...

II - Erfahrungsaustausch zu

...

Schwerpunktthemen

...

Panel
titleThema 1

...

Thema 2: Thematische Suche und Präsentation

...

- INFRASTRUKTUR


Section


Column
width70%
  • Infrastruktur für KI-Verfahren in der DNB
    Christoph Poley • Deutsche Nationalbibliothek, Leipzig  


Column
width25%






Section


Column
width70%
  • GPUs – Kosten, Skalierung, Betrieb & Wartung, Virtualisierung, On-Premise vs. Cloud
    Clemens Neudecker • Staatsbibliothek zu Berlin - Preußischer Kulturbesitz





Section


Column
width70%
  • Erstellung und Betrieb eines Kubernetes-Clusters zur Ausführung von AutoSE-Core
    Christopher BartzZBW – Leibniz-Informationszentrum, Hamburg

...


Column
width25%

View file
nameAutoSE_NMVE2022_k8s.pdf
height150




Panel
titleThema 2 - THEMATISCHE SUCHE UND PRÄSENTATION


Section


Column
width70%

...

  • Yewno Discover und Yewno Unearth
    Dr. Arnost

...

  • Stanzel • Bayerische Staatsbibliothek, München
    Ronny

...

  • Sternecker • Bayerische Staatsbibliothek, München

...

Freitag • 04. November 2022

...

Session_3

...

Erfahrungsaustausch zu den Schwerpunktthemen - II


Column
width25%





Panel
titleThema 3 - DATEN


Section


Column
width70%

...

Thema 3: Daten

...

Thema 4: Tools programmieren

...

  • Datenmanagement mit DVC
    Maximilian Kähler • Deutsche Nationalbibliothek, Leipzig
    Nico Wagner • Deutsche Nationalbibliothek, Leipzig

...

...

Session_4

...

Erfahrungsaustausch zu den Schwerpunktthemen - III

Thema 5: Terminologie / Vokabular

...

Thema 6: Methoden und Metriken für eine qualitätsgesicherte Textextraktion und Texterkennung


Column
width25%

View file
name20221104 Datenmanagement mit DVC_final.pdf
height150




Panel
titleThema 4 - TOOLS PROGRAMMIEREN


Section


Column
width70%
  • Open-Source-Software - ein kurzer Aufriss und viele Fragen
    Christoph Poley • Deutsche Nationalbibliothek, Leipzig


Column
width25%





Panel
titleThema 5 - TERMINOLOGIE / Vokabular


Section


Column
width70%

...

  • Aufbereitung der GND für KI-Verfahren
    Jan-Helge Jacobs • Deutsche Nationalbibliothek, Leipzig
    Nico Wagner • Deutsche Nationalbibliothek, Leipzig

...

Impulsvortrag

...


Column
width25%

View file
name20221104_Aufbereitung der GND für KI-Verfahren.pdf
height150




Panel
titleThema 6 - QUALITÄTSGESICHERTE TEXTEXTRAKTION UND TEXTERKENNUNG


Section


Column
width70%
  • Herausforderungen der Textextraktion im Produktivbetrieb der DNB
    Christa Schöning-Walter • Deutsche Nationalbibliothek, Frankfurt
    Sandro Uhlmann
     • Deutsche Nationalbibliothek, Leipzig

...

Session_5

...

Erfahrungsaustausch zu den Schwerpunktthemen - IV


Column
width25%

View file
name20221104_Textextraktion_Texterkennung.pdf
height150




Panel
titleThema 7 - QUALITÄT


Section


Column
width70%

...

Thema 7: Qualität

...

  • Evaluation im DNB-KI-Projekt
    Maximilian Kähler • Deutsche Nationalbibliothek, Leipzig  


Column
width25%

View file
name2022-11-04_evaluation-im-dnb-ki-projekt.pdf
height150





Section


Column
width70%
  • Qualitätsmaßnahmen in AutoSE an der ZBW
    Dr. Anna

...

  • Kasprzik • ZBW – Leibniz-Informationszentrum, Hamburg
    Christopher Bartz

...

  •  • ZBW

...

...


Column
width25%

View file
nameAutoSE_NMVE2022_human.pdf
height150



Section


Column
width70%



Column
width25%

View file
nameAutoSE_NMVE2022_qualle.pdf
height150