Am 27. September 2024 war es wieder so weit: Im Rahmen des → Netzwerks maschinelle Verfahren in der Erschließung fand ein digitaler Workshop statt.

Ziel des Workshops war der Wissenstransfer  zwischen den Kolleg*innen der Finnischen Nationalbibliothek (NLF) und der Deutschen Nationalbibliothek (DNB). Im Mittelpunkt standen folgende Fragen: Welche Erkenntnisse konnte die DNB mit der Erschließungsmaschine (EMA) und in ihrem KI-Projekt sammeln? Und welche aktuellen Entwicklungen gibt es in der Finnischen Nationalbibliothek in Bezug auf Annif und Finto AI? Beide Nationalbibliotheken nutzten diese Möglichkeit zu einem intensiven Austausch über aktuelle und zukünftige Entwicklungen.

Bereits seit 2012 setzt die DNB automatische Erschließungsverfahren ein. Mit dem aktuellen System, der Erschließungsmaschine EMa, werden DDC-Sachgruppen, Schlagwörter aus der Gemeinsamen Normdatei (GND) für deutschsprachige Medienwerke sowie DDC-Kurznotationen für insgesamt 54 von104 Sachgruppen vergeben. Ein wichtiger Bestandteil der EMa ist die an der NLF entwickelte Open-Source-Software Annif

Während die Kolleg*innen der DNB die aktuellen Themen der EMa, des KI-Projekts sowie die Herausforderungen und kontinuierlichen Entwicklungen skizzierten, berichtete die NLF über aktuelle Entwicklungen aus dem Annif-Entwicklungslabor. Dabei wurden Themen wie die zukünftige Integration von Xtransformer als optionales Annif-Backend sowie die Annif-Version 1.2.0 angesprochen. 

Ein weiteres Thema waren verschiedene Experimente mit entsprechenden Ergebnissen, wie z.B. die Nutzung großer Sprachmodelle oder die Zusammenführung von Erschließungsergebnissen. Die NLF berichtete außerdem über ihre Erfahrungen aus einem Formalerschließungs-Projekt zur Extraktion bibliographischer Metadaten aus PDFs mit Hilfe von LLMs.

Die Präsentationen stehen hier zum Download zur Verfügung (wenn nicht anderweitig gekennzeichnet: CC BY-SA 3.0). 

I - Current and future work


  • Automatic subject cataloguing at the DNB
    Christoph Poley | Deutsche Nationalbibliothek, Leipzig

  • Some Lessons Learned in DNB's AI Project: Evaluation, Existing Methods, New Methods
    Maximilian Kähler | Deutsche Nationalbibliothek, Leipzig


  • Current development of Annif and Finto AI at NLF 
    Osma Suominen | National Library of Finland, Helsinki

II - Special themes


  • Testing Open-Source LLMs for automated indexing
    Lisa Kluge | Deutsche Nationalbibliothek, Frankfurt

  • Experiments with fusion and ensemble methods
    Sandro Uhlmann | Deutsche Nationalbibliothek, Leipzig
    Jan-Helge Jacobs | Deutsche Nationalbibliothek, Leipzig
    Maximilian Kähler | Deutsche Nationalbibliothek, Leipzig

  • Extracting bibliographic metadata from grey literature using LLMs
    Osma Suominen | National Library of Finland, Helsinki

  • Keine Stichwörter