Über uns

Die Deutsche Nationalbibliothek (DNB) nutzt seit mehr als zehn Jahren Technologien des Maschinellen Lernens und Natural Language Processing für die inhaltliche Erschließung von Medienwerken. Erschließung bedeutet in diesem Zusammenhang, den Inhalt der Medienwerke in den bibliografischen Metadaten präzise zusammenzufassen, damit Literaturrecherchen zu guten Ergebnissen führen.  

Die Grundlage unserer maschinellen Analyseprozesse sind unstrukturierte Texte, beispielsweise die Volltexte oder Inhaltsverzeichnisse gesammelter Publikationen. Soweit vorhanden fließen auch Metadaten in die Analysen mit ein. Für die thematische Einordnung der Medienwerke verwenden wir Sachgruppen und Kurznotationen der Dewey-Dezimalklassifikation (DDC). Die verbale Erschließung führen wir mit dem Vokabular der Gemeinsamen Normdatei (GND) durch. Das heißt: Es entstehen semantische Verknüpfungen der Medienwerke mit den Entitäten dieser Normdatei.

Vor diesem Hintergrund arbeiten wir fortlaufend daran, die Analyseprozesse weiterzuentwickeln, zu optimieren oder zu erneuern, um die Qualität der Erschließungsresultate zu verbessern und die Anwendungsbereiche der maschinellen Analysen auszuweiten.

Im Rahmen der nationalen Strategie der Bundesregierung zur Künstlichen Intelligenz (KI-Strategie) haben wir 2021 das Forschungsprojekt "Automatisches Erschließungssystem – Inhaltliche Erschließung von Publikationen mit KI" gestartet. Darin wollen wir einige der bisher noch nicht gelösten Herausforderungen der maschinellen Erschließung grundlegend neu angehen. Das Projekt zielt insbesondere darauf, eine qualitätsgesicherte, semantische Verknüpfung der Medienwerke mit Schlagwörtern der GND zu erreichen. Vielversprechende Entwicklungen aus dem Bereich der KI, die sich für die Erschließung textbasierter Medienwerke mit einem hochgradig differenzierten Vokabular eignen, sollen untersucht, ausgewählt, kombiniert und adaptiert werden. So sollen flexibel nachnutzbare Werkzeuge entstehen, die in die Erschließungsrozesse der DNB  und in Anwendungen anderer Institutionen eingebunden werden können. Unser Projekt wird von der Beauftragten der Bundesregierung für Kultur und Medien (BKM) über einen Zeitraum von drei Jahren gefördert.

Der Informations- und Erfahrungsaustausch mit forschenden, entwickelnden und anwendenden Institutionen, die übergreifende Zusammenarbeit und der Transfer geeigneter Technologien spielen in diesem Zusammenhang eine wichtige Rolle.

Das Netzwerk maschinelle Verfahren in der Erschließung bildet dafür seit 2019 einen Rahmen. In Abstimmung mit dem Standardisierungsausschuss wollen wir den Dialog, die Zusammenarbeit und den Ergebnistransfer fördern.



Bisherige Fachtagungen und Workshops im Rahmen des Netzwerks maschinelle Verfahren in der Erschließung


  • No labels