Sie zeigen eine alte Version dieser Seite an. Zeigen Sie die aktuelle Version an.

Unterschiede anzeigen Seitenhistorie anzeigen

« Vorherige Version anzeigen Version 84 Nächste Version anzeigen »



Die Deutsche Nationalbibliothek (DNB) nutzt seit etwa zehn Jahren Technologien aus den Bereichen Natural Language Processing (NLP), Computerlinguistik und Machine Learning für die inhaltliche Erschließung von Medienwerken. Erschließung bedeutet in diesem Zusammenhang, den Inhalt der Medienwerke in den bibliografischen Metadaten präzise zusammenzufassen, damit Literaturrecherchen zu guten Ergebnissen führen.  

Die Grundlage unserer maschinellen Analyseprozesse sind unstrukturierte Texte, die digital vorliegen, beispielsweise die Volltexte oder Inhaltsverzeichnisse gesammelter Publikationen. Soweit vorhanden fließen auch Metadaten in die Analysen mit ein. Für die thematische Einordnung der Medienwerke verwenden wir Sachgruppen und Kurznotationen der Dewey-Dezimalklassifikation (DDC). Die verbale Erschließung führen wir mit dem Vokabular der Gemeinsamen Normdatei (GND) oder den Library of Congress Subject Headings (LCSH) durch. Das heißt: Es entstehen semantische Verknüpfungen der Medienwerke mit den Entitäten dieser Normdateien.

Vor diesem Hintergrund arbeiten wir fortlaufend daran, die Analyseprozesse weiterzuentwickeln, zu optimieren oder zu erneuern, um die Qualität der Erschließungsresultate zu verbessern und die Anwendungsbereiche der maschinellen Analysen auszuweiten.

Im Rahmen der nationalen Strategie der Bundesregierung zur Künstlichen Intelligenz (KI-Strategie) haben wir im April 2021 das Forschungsprojekt "Automatisches Erschließungssystem – Inhaltliche Erschließung von Publikationen mit KI" gestartet. Darin wollen wir einige der bisher noch nicht gelösten Herausforderungen der maschinellen Erschließung grundlegend neu angehen. Das Projekt zielt insbesondere darauf, eine qualitätsgesicherte, semantische Verknüpfung der Medienwerke mit Schlagwörtern der GND zu erreichen. Vielversprechende Entwicklungen aus dem Bereich der KI, die sich für die Erschließung textbasierter Medienwerke mit einem hochgradig differenzierten Vokabular eignen, sollen untersucht, ausgewählt, kombiniert und adaptiert werden. So sollen flexibel nachnutzbare Werkzeuge entstehen, die in die Erschließungsrozesse der DNB  und in Anwendungen anderer Institutionen eingebunden werden können. Unser Projekt wird von der Beauftragten der Bundesregierung für Kultur und Medien (BKM) über einen Zeitraum von drei Jahren gefördert.

Der Informations- und Erfahrungsaustausch mit forschenden, entwickelnden und anwendenden Institutionen, die übergreifende Zusammenarbeit und der Transfer geeigneter Technologien spielen in diesem Zusammenhang eine wichtige Rolle.

Das Netzwerk maschinelle Verfahren in der Erschließung bildet dafür seit 2019 einen Rahmen. In Abstimmung mit dem Standardisierungsausschuss wollen wir den Dialog, die Zusammenarbeit und den Ergebnistransfer fördern.

Bisherige Fachtagungen und Workshops


Save the date

Die nächste Fachtagung findet am 17. und 19. November 2021 online statt.

Kontakt

Mail:  ki-ee@dnb.de  

  • Keine Stichwörter