Am 27. September 2024 war es wieder so weit: Im Rahmen des → Netzwerks maschinelle Verfahren in der Erschließung fand ein digitaler Workshop statt.
Ziel des Workshops war der Wissenstransfer zwischen den Kolleg*innen der Finnischen Nationalbibliothek (NLF) und der Deutschen Nationalbibliothek (DNB). Im Mittelpunkt standen folgende Fragen: Welche Erkenntnisse konnte die DNB mit der Erschließungsmaschine (EMA) und in ihrem KI-Projekt sammeln? Und welche aktuellen Entwicklungen gibt es in der Finnischen Nationalbibliothek in Bezug auf Annif und Finto AI? Beide Nationalbibliotheken nutzten diese Möglichkeit zu einem intensiven Austausch über aktuelle und zukünftige Entwicklungen.
Bereits seit 2012 setzt die DNB automatische Erschließungsverfahren ein. Mit dem aktuellen System, der Erschließungsmaschine EMa, werden DDC-Sachgruppen, Schlagwörter aus der Gemeinsamen Normdatei (GND) für deutschsprachige Medienwerke sowie DDC-Kurznotationen für insgesamt 54 von104 Sachgruppen vergeben. Ein wichtiger Bestandteil der EMa ist die an der NLF entwickelte Open-Source-Software Annif.
Während die Kolleg*innen der DNB die aktuellen Themen der EMa, des KI-Projekts sowie die Herausforderungen und kontinuierlichen Entwicklungen skizzierten, berichtete die NLF über aktuelle Entwicklungen aus dem Annif-Entwicklungslabor. Dabei wurden Themen wie die zukünftige Integration von Xtransformer als optionales Annif-Backend sowie die Annif-Version 1.2.0 angesprochen.
Ein weiteres Thema waren verschiedene Experimente mit entsprechenden Ergebnissen, wie z.B. die Nutzung großer Sprachmodelle oder die Zusammenführung von Erschließungsergebnissen. Die NLF berichtete außerdem über ihre Erfahrungen aus einem Formalerschließungs-Projekt zur Extraktion bibliographischer Metadaten aus PDFs mit Hilfe von LLMs.
Die Präsentationen stehen hier zum Download zur Verfügung (wenn nicht anderweitig gekennzeichnet: CC BY-SA 3.0).
I - Current and future work
| |
| |
|
II - Special themes
| |
| |
|