Versionen im Vergleich

Schlüssel

  • Diese Zeile wurde hinzugefügt.
  • Diese Zeile wurde entfernt.
  • Formatierung wurde geändert.

...


Thema
Session_1_____




Begrüßung und Einführung in die Tagung, Tagung • Ute Schwens • Deutsche Nationalbibliothek, Leipzig und Frankfurt am Main 

Toggle Cloak
id@T1
Können Wissensgraphen die Kommunikation in der Wissenschaft verändern?,  • Dr. Markus Stocker • Technische Informationsbibliothek (TIB), Hannover

Cloak
id@T1

Der Open Research Knowledge Graph (ORKG) ist ein Wissensgraph, der im Besonderen wissenschaftliche Information, die in der wissenschaftlichen Literatur veröffentlicht und kommuniziert wird, enthält – und zwar so, dass die Information maschinenlesbar ist. Maschinenlesbarkeit ist der zentrale Aspekt, denn in der Form wie heute wissenschaftliche Information kommuniziert wird – mittels natürlicher Sprache, Daten in Tabellen und Bildern als digitale PDF-Dokumente –, unterstützen uns Maschinen in der Informationssuche und -exploration nur sehr bedingt. Der ORKG setzt sich zum Ziel, mehr wissenschaftliche Information Maschinen besser zugänglich zu machen, und setzt somit neue Möglichkeiten und Maßstäbe für die Wissenschaftskommunikation im 21. Jahrhundert.


Toggle Cloak
id@T5
Kuratierungstechnologien für die automatische Erschließung: Semantische Verfahren, Verfahren • Peter Bourgonje • Deutsches Forschungszentrum für Künstliche Intelligenz GmbH (DKFI), Projektbüro Berlin  

Cloak
id@T5

Dieser Vortrag gibt einen Überblick über Projekte des Forschungsbereichs “Speech and Language Technology” des DFKI, in denen Werkzeuge, Services und Infrastrukturen für die semantische Verarbeitung von Content entwickelt werden. Wir bezeichnen diese als Kuratierungstechnologien. Diese Plattformen integrieren verschiedene sprachtechnologische Komponenten (Natural Language Processing, NLP) und beschäftigen sich u.a. mit Herausforderungen wie Low-Resource-Settings, Domain-Transfer, Interoperabilität, Workflows und Workflow-Orchestrierung. In den Projekten wurden und werden Prototypen für verschiedene Dimensionen entwickelt, von kleinen und sehr spezifischen historischen Archiven (z.B. Briefwechsel) über neuere Datensammlungen aus dem politischen Bereich hin zur Analyse großer Mengen von Nachrichtenartikeln zur Erkennung von Falschnachrichten. Neben diesen Aktivitäten werden wir auch kurz das European Language Grid vorstellen. Dieses vom DFKI koordinierte EU-Projekt entwickelt derzeit die größte Plattform für Sprachtechnologien in Europa – für Forschung und Industrie und für alle europäischen Sprachen.

--- Vortrag entfällt ---


Toggle Cloak
id@T6
Digitalisate kuratieren mit KI - von unstrukturierten Daten zu strukturierten Inhalten,Inhalten • Clemens Neudecker • Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, Berlin

Cloak
id@T6
 

Der Vortrag bietet einen Überblick über die Forschung und Entwicklung zu KI-basierten Verfahren für die automatisierte Kuratierung des digitalisierten kulturellen Erbes der Staatsbibliothek zu Berlin - Preußischer Kulturbesitz im Rahmen des BMBF-Verbundprojekts QURATOR - Curation Technologies (https://qurator.ai/). Ausgehend von Digitalisaten und Metadaten werden hierfür maschinelle Lernverfahren für die Analyse von Metadaten und Volltexten (OCR) sowie deren Nachkorrektur, für die Layoutanalyse und logische Strukturierung von Dokumenten sowie für die semantische Anreicherung von Volltexten mit Named Entity Recognition erarbeitet. Zu jedem der genannten Arbeitsbereiche werden die Herausforderungen, verwendeten Methoden sowie erste Ergebnisse vorgestellt.


Toggle Cloak
id@T3
Textanalyse im Kontext der Rundfunkanstalten, Rundfunkanstalten • Dr. Jens Fisseler und Dr. Joachim Köhler • Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS, Sankt Augustin

Cloak
id@T3
 


Session 2

Toggle Cloak
id@T4
Die Vermessung der Welt – Maschinelle Erschließung des deutschsprachigen WWW, WWW • Joachim Feist • mindUp Web + Intelligence GmbH , Konstanz

Cloak
id@T4

In diesem Vortrag wird die Klassifikation von Webseiten mit dem contentDetection-System der mindUp + Intelligence GmbH in Beziehung gesetzt zur Inhaltserschließung im Bibliotheksbereich. Könnten die Lösungsansätze  übertragen werden? Welche spannenden Aufgabenstellungen im Bibliotheksbereich könnten mit den Methoden bearbeitet werden?


Toggle Cloak
id@T9
Maschinelle Erschließungsverfahren versus Volltextsuche, Volltextsuche • Prof. Dr. Christian Wartena • Hochschule Hannover

Cloak
id@T9

Ist die automatische Inhaltserschließung ein krampfhaftes Festhalten an überlebte Verfahren, die man durch eine moderne Technologie zu retten versucht? Sind die alten Argumente für die Inhaltserschließung, wie die der Synonymie und Homonymie in einem Zeitalter, in dem Query Expansion, Relevance Feedback und viele weitere Technologien längst Bestandteil jeder Suchmaschine sind, nicht längst hinfällig? Können die Suchmaschinen nicht alles, was man mit maschinellen Erschließungsverfahren erreichen kann, und gibt es daher keinen Platz für diese Verfahren zwischen der Volltextsuche und der intellektuellen Erschließung?


...


Thema
Workshops___

Toggle Cloak
id@T10
Einführung in die Programmierung mit Python,Python • Dr. Ramon Leon Voges, Nico Wagner • Deutsche Nationalbibliothek, Leipzig und Frankfurt am Main

 

Cloak
id@T10

Python ist eine einfach zu erlernende Programmiersprache, die auch für Anwendungsfälle aus der Computerlinguistik und des maschinellen Lernens Popularität erlangt hat. Einerseits erleichtert die klare Syntax die Lesbarkeit und ermöglicht es, bereits mit wenig Code anspruchsvolle Aufgaben zu lösen. Andererseits ist Python durch die Erweiterbarkeit um viele spezifische Funktionen ein universelles Werkzeug, das für ganz unterschiedliche Zwecke genutzt werden kann.

In diesem Workshop möchten wir eine Einführung in die Programmierung mit Python geben. Nach einer theoretischen Einführung in die Grundlagen der Sprache, entwickeln wir gemeinsam ein Programm, das einen Text entgegennimmt und einfache, quantitative Analysen darauf durchführt. Unser Angebot richtet sich an Teilnehmerinnen und Teilnehmer, die über keine oder nur sehr wenig Programmierkenntnisse verfügen und an den praktischen Grundlagen von Textstatistik und natürlicher Sprachverarbeitung interessiert sind.

Eine Liste weiterer Materialien finden Sie an dieser Stelle

Toggle Cloak
id@T11
Vom Text zum Inhalt, Inhalt • Matthias Nagelschmidt, Christoph Poley • Deutsche Nationalbibliothek, Leipzig und Frankfurt am Main


Cloak
id@T11

In der Deutschen Nationalbibliothek wenden wir seit einigen Jahren maschinelle Verfahren für die inhaltliche Erschließung ausgewählter Publikationsgruppen an. Prozessketten zur Verarbeitung von Volltexten, digitalisierten Inhaltsverzeichnissen und bibliografischen Metadaten sind in produktivem Einsatz. Darin eingebunden sind diverse Tools, teils Open Source, teils von kommerziellen Anbietern.

Im Workshop möchten wir uns diesem Thema schrittweise und mit dem Ziel nähern, exemplarisch einen Prototypen für die maschinelle Indexierung des Englischen zu bauen. An einem einfachen Beispiel zeigen wir, wie mit Hilfe von Python nltk (Natural Language Toolkit) unstrukturierte Texte so aufbereitet werden können, dass sie sich mit inhaltlich korrespondierenden Entitäten anreichern lassen.

Der Workshop besteht aus einem theoretischen und einem praktischem Teil.

Bitte bringen Sie Ihr eigenes Notebook mit.

Für den Workshop wird eine vorkonfigurierte Arbeitsumgebung in Form einer virtuellen Maschine bereitgestellt, die die benötigte Software enthält. Um die virtuelle Maschine starten und nutzen zu können, wird die Virtualisierungssoftware Oracle Virtual Box (ab Version 6.0) benötigt. Oracle Virtual Box ist kostenlos erhältlich für Windows, Linux oder Mac unter: https://www.oracle.com/de/virtualization/virtualBox.

Eine Liste weiterer Materialien finden Sie an dieser Stelle

Toggle Cloak
id@T12
Knowledge-Café: Inhaltserschließung im digitalen Zeitalter für die Wissenschaft von heute und morgen, morgen • Moderation: Elisabeth Mödden • Deutsche Nationalbibliothek, Leipzig und Frankfurt am Main / Leibniz-Zentrum Wirtschaft (ZBW), Kiel und Hamburg / Staats- und Universitätsbibliothek (SUB), Hamburg   

Cloak
id@T12


Moderne Technologien für Text Mining und Information Retrieval sind als Instrumente für eine zeitgemäße inhaltliche Erschließung nicht mehr wegzudenken. Das hat Konsequenzen für den Umgang mit Normdaten, Standards und Regelwerken, die aktuell noch eine starke Prägung durch die bisher etablierten Formen der intellektuellen Erschließung erkennen lassen. Wie können diese Elemente so weiterentwickelt werden, dass sie auch den neuen Gegebenheiten gerecht werden?

Neue Technologien eröffnen zahlreiche Möglichkeiten der Strukturierung und Vernetzung von Daten. Wie können diese zukünftig noch besser genutzt werden? Und was können neue Verfahren zur Aktualisierung und Generierung neuer Daten beitragen?

In diesem Spannungsfeld stellt sich immer wieder die Frage nach der Erschließungsqualität. Welche Kriterien für Qualität lassen sich überhaupt identifizieren, und welche davon sind auch tatsächlich relevant?

Die hier angesprochenen Fragen möchten wir mit Ihnen im Rahmen eines Knowledge Cafés erörtern, das von Experten aus verschiedenen Einrichtungen (u. a. ZBW, DNB und SUB Hamburg) vorbereitet wurde. Den Einstieg hierzu liefert der Vortrag „Maschinelle Erschließungsverfahren versus Volltextsuche“ von Prof. Dr. Christian Wartena. Ziel ist es, ein Forum für diejenigen zu schaffen, die an Entwicklungsfragen im Bereich der inhaltlichen Erschließung und ihrer Automatisierung interessiert sind und sich miteinander vernetzen wollen. 


Lightning Talks:


Eine Liste weiterer Materialien finden Sie an dieser Stelle

Toggle Cloak
id@T13
Werkstattgespräche maschinelle Erschließung, Erschließung • Moderation: Christa Schöning-Walter  •  Deutsche Nationalbibliothek, Leipzig und Frankfurt am Main / Leibniz-Zentrum Wirtschaft (ZBW), Kiel und Hamburg

Cloak
id@T13

Das Leibniz-Zentrum Wirtschaft (ZBW) und die Deutsche Nationalbibliothek (DNB) beschäftigen sich schon seit einigen Jahren mit dem Einsatz maschineller Verfahren zur inhaltlichen Erschließung von Publikationen. Dabei sind die Bedürfnisse der Zielgruppen und entsprechend auch die Herangehensweisen in den beiden Institutionen recht unterschiedlich. 

In Lightning Talks möchten wir über den aktuellen Stand der Verfahren und Prozesse in unseren Institutionen berichten und anschließend mit Ihnen ins Gespräch kommen, Erfahrungen austauschen und neue Ideen diskutieren.


Beiträge:

Session 3

Toggle Cloak
id@T14
Ein Skateboard für den Papst - oder Warum es maschinelles Lernen ohne Semantik so schwer hat, hat • Prof. Dr. Harald Sack • FIZ Karlsruhe – Leibniz-Institut für Informationsinfrastruktur, Eggenstein-Leopoldshafen

Cloak
id@T14

Künstliche Intelligenz (KI) durchdringt immer mehr Lebensbereiche und ist schon heute ein wichtiger Faktor für Forschung, wirtschaftliche Entwicklung und Arbeitswelt. Selbst die Bundesregierung hat die Erforschung, Entwicklung und Anwendung von KI als strategisches Ziel erkannt. Doch werden mit jeder neuen Erfolgsmeldung auch immer wieder falsche Erwartungen geweckt, und dies folgt einer langen Tradition. Als KI wird heute meist maschinelles Lernen verstanden, insbesondere Deep Learning, dessen Erfolge in den vergangenen Jahren verantwortlich für die aktuelle Popularität dieses Begriffs sind. Aber oft werden aufgrund einer einzigartigen, auf einen eng fokussierten Anwendungsbereich beschränkten Fähigkeit eines KI Systems unzulässige Verallgemeinerungen über dessen tatsächliche „Intelligenz“ getroffen, die sich aus dem vermeintlich intelligenten Verhalten der Maschine schließen lässt. Im Rahmen dieses Vortrags werfen wir ein kritisches Licht auf aktuelle Entwicklungen aus dem Bereich der KI, auf ihre Möglichkeiten, inhärente Probleme und potenzielle Grenzen. Ein besonderer Aspekt ist dabei die Kombination subsymbolischer maschineller Lernverfahren (Deep Learning) mit symbolischen Wissensrepräsentationen (Semantik) zur Einbeziehung von Kontext, Pragmatik und Erfahrungswissen in den Prozess der automatisierten Klassifikation und Erschließung.


Resümee und Abschluss, Abschluss • Ulrike Junger •  Deutsche Nationalbibliothek, Leipzig und Frankfurt am Main

...