Versionen im Vergleich

Schlüssel

  • Diese Zeile wurde hinzugefügt.
  • Diese Zeile wurde entfernt.
  • Formatierung wurde geändert.

UI Button
newWindowtrue
titleFachtagung 2019
urlhttps://wiki.dnb.de/x/HQfmC
UI Button
newWindowtrue
titleWorkshop 2020
urlhttps://wiki.dnb.de/x/XE7VCg
UI Button
newWindowtrue
titleFachtagung 2021
urlhttps://wiki.dnb.de/x/kmv3D
UI Button
newWindowtrue
titleWorkshop 2022
urlhttps://wiki.dnb.de/x/7qZ5Dw
UI Button
colororange
newWindowtrue
titleFachtagung 2023
urlhttps://wiki.dnb.de/x/eog-Eg


Info
titleKI in Bibliotheken - Neue Wege mit großen Sprachmodellen?

Programm und Präsentationen zur Fachtagung am 7. und 8. Dezember 2023

UI Button
colororange
newWindowtrue
titleFachtagung 2023
urlhttps://wiki.dnb.de/x/eog-Eg


Über uns

Die Deutsche Nationalbibliothek (DNB) nutzt seit mehr als zehn Jahren Technologien des Maschinellen Lernens und Natural Language Processing für die inhaltliche Erschließung von Medienwerken. Erschließung bedeutet in diesem Zusammenhang, den Inhalt der Medienwerke in den bibliografischen Metadaten präzise zusammenzufassen, damit Literaturrecherchen zu guten Ergebnissen führen.  

Die Grundlage unserer maschinellen Analyseprozesse sind unstrukturierte Texte, beispielsweise die Volltexte oder Inhaltsverzeichnisse gesammelter Publikationen. Soweit vorhanden fließen auch Metadaten in die Analysen mit ein. Für die thematische Einordnung der Medienwerke verwenden wir Sachgruppen und Kurznotationen der Dewey-Dezimalklassifikation (DDC). Die verbale Erschließung führen wir mit dem Vokabular der Gemeinsamen Normdatei (GND) durch. Das heißt: Es entstehen semantische Verknüpfungen der Medienwerke mit den Entitäten dieser Normdatei.

Vor diesem Hintergrund arbeiten wir fortlaufend daran, die Analyseprozesse weiterzuentwickeln, zu optimieren oder zu erneuern, um die Qualität der Erschließungsresultate zu verbessern und die Anwendungsbereiche der maschinellen Analysen auszuweiten.

Im Rahmen der nationalen Strategie der Bundesregierung zur Künstlichen Intelligenz (KI-Strategie) haben wir 2021 das Forschungsprojekt "Automatisches Erschließungssystem – Inhaltliche Erschließung von Publikationen mit KI" gestartet. Darin wollen wir einige der bisher noch nicht gelösten Herausforderungen der maschinellen Erschließung grundlegend neu angehen. Das Projekt zielt insbesondere darauf, eine qualitätsgesicherte, semantische Verknüpfung der Medienwerke mit Schlagwörtern der GND zu erreichen. Vielversprechende Entwicklungen aus dem Bereich der KI, die sich für die Erschließung textbasierter Medienwerke mit einem hochgradig differenzierten Vokabular eignen, sollen untersucht, ausgewählt, kombiniert und adaptiert werden. So sollen flexibel nachnutzbare Werkzeuge entstehen, die in die Erschließungsrozesse der DNB  und in Anwendungen anderer Institutionen eingebunden werden können. Unser Projekt wird von der Beauftragten der Bundesregierung für Kultur und Medien (BKM) über einen Zeitraum von drei Jahren gefördert.

Der Informations- und Erfahrungsaustausch mit forschenden, entwickelnden und anwendenden Institutionen, die übergreifende Zusammenarbeit und der Transfer geeigneter Technologien spielen in diesem Zusammenhang eine wichtige Rolle.

Das Netzwerk maschinelle Verfahren in der Erschließung bildet dafür seit 2019 einen Rahmen. In Abstimmung mit dem Standardisierungsausschuss wollen wir den Dialog, die Zusammenarbeit und den Ergebnistransfer fördern.

Image Added


UI Button
colorblue
newWindowtrue
sizelarge
displayblock
titleDie DNB auf GitHub
urlhttps://github.com/deutsche-nationalbibliothek

Panel
titleKontakt

Mail:  ki-ee@dnb.de  


Panel
titleÜber das KI-Projekt der DNB

Kurzbeschreibung zum Projekt "Automatisches Erschließungssystem"

→ Blogbeitrag "Texte erschließen mit KI"


Panel
titleÜber die DNB

Die Deutsche Nationalbibliothek im Porträt

Unser Sammelauftrag

Erschließung von Medienwerken

Gemeinsame Normdatei (GND)




Bisherige Fachtagungen und Workshops im Rahmen des Netzwerks maschinelle Verfahren in der Erschließung


Unsere Fachtagung zum Thema „Netzwerk maschinelle Verfahren in der Erschließung“ mit etwa 50 – 80 Teilnehmern ist für den 10. und 11. Oktober 2019 in unseren Räumen in Frankfurt am Main geplant. Die zweitägige Veranstaltung beginnt mittags und umfasst mehrere Vorträge sowie einige Workshops. Mit der Betrachtung unterschiedlicher Anwendungsbereiche maschineller Textanalyse möchten wir einen Dialog initiieren, welche Ansätze Erfolg versprechen und welche Schwierigkeiten zu überwinden sind. Die Veranstaltung soll auch dazu beitragen, Kontakte für einen fachlichen Austausch zu knüpfen, um ggf. in Projekten gemeinsam weiter an den Herausforderungen zu arbeiten. 

Teilnehmen werden  Vertreter aus Kultureinrichtungen (Bibliotheken, Fachinformationszentren und Archive). Experten aus Wissenschaft, Wirtschaft und Praxis sind eingeladen, Methoden, Dienste und Anwendungen vorzustellen. Ansätze aus den Bereichen Text Analytics, Machine Learning und Deep Learning stehen im Fokus. Welche Technologien stehen heute für die semantische Erschließung großer Textmengen zur Verfügung? Welche Fragestellungen werden in den Anwendungen bearbeitet? Und welche praktischen Erfahrungen liegen vor? Ein Blick in den Nutzungskontext anderer Branchen ist gewünscht und vielleicht Impulsgeber für neue Ideen. 

 

Motivation für die Fachtagung ist die Weiterentwicklung maschineller Verfahren für die inhaltliche Erschließung maschinenlesbarer Publikationen in der Deutschen Nationalbibliothek. Unser Sammelauftrag umfasst alle Publikationen, die seit 1913 in Deutschland, in deutscher Sprache, als Übersetzung aus der deutschen Sprache oder über Deutschland veröffentlicht wurden. Neben Veröffentlichungen in körperlicher Form wie beispielsweise Bücher, Zeitschriften, Zeitungen, Karten, Musikalien, Normen, Musiktonträger oder Hörbücher schließt unser Sammelauftrag seit 2006 auch die Veröffentlichungen ohne körperlichen Träger ein, wie beispielsweise E-Books, E-Journals, E-Paper, digitale Hörbücher, Musikveröffentlichungen oder Websites. Etwa 2 Millionen Medienwerke wurden 2018 neu in den Bestand der Bibliothek aufgenommen. Seit mehreren Jahren nutzen wir statistische und linguistische Methoden für die inhaltliche Analyse ausgewählter Publikationsgruppen, um die Veröffentlichungen thematisch zu klassifizieren und sie mit Schlagwörtern aus dem kontrollierten Vokabular von GND (Gemeinsame Normdatei) und LCSH (Library of Congress Subject Headings) anzureichern. Nun beginnen wir, die eingeführten Prozesse und Methoden weiter zu optimieren und ggf. zu erneuern.

 

Neuigkeiten

Blog-Einträge
reversetrue
contenttitles

Image Removed

Panel
titleNavigation
Panel
titleKontakt
LoremIpsum11