Seitenhistorie

...

Welche Technologien stehen heute für die semantische Erschließung großer Textmengen zur Verfügung? Fachleute aus Wissenschaft, Wirtschaft und Praxis präsentieren und diskutieren Methoden, Dienste und Anwendungen aus den Bereichen Text Analytics, Machine Learning und Deep Learning.

10. Oktober 2019

Die Vermessung der Welt – Maschinelle Erschließung des deutschsprachigen WWW, Joachim Feist • mindUp Web + Intelligence GmbH , Konstanz

Thema

Session 1

13:00 - 15:15

Toggle Cloak

id	@T2

Begrüßung und Einführung in die Tagung • Deutsche Nationalbibliothek, Leipzig und Frankfurt am Main

Cloak

id	@T2

Toggle Cloak

id	@T1

Können Wissensgraphen die Kommunikation in der Wissenschaft verändern?, Dr. Marcus Stocker • Technische Informationsbibliothek (TIB), Hannover

Toggle Cloak

id	@T3

Textanalyse im Kontext der Rundfunkanstalten, Dr.-Ing

Cloak

id	@T1

Der Open Research Knowledge Graph (ORKG) ist ein Wissensgraph, der im Besonderen wissenschaftliche Information, die in der wissenschaftlichen Literatur veröffentlicht und kommuniziert wird, enthält – und zwar so, dass die Information maschinenlesbar ist. Maschinenlesbarkeit ist der zentrale Aspekt, denn in der Form wie heute wissenschaftliche Information kommuniziert wird – mittels natürlicher Sprache, Daten in Tabellen und Bildern als digitale PDF-Dokumente –, unterstützen uns Maschinen in der Informationssuche und -exploration nur sehr bedingt. Der ORKG setzt sich zum Ziel, mehr wissenschaftliche Information Maschinen besser zugänglich zu machen, und setzt somit neue Möglichkeiten und Maßstäbe für die Wissenschaftskommunikation im 21. Jahrhundert.

Toggle Cloak

id	@T2

Begrüßung und Einführung in die Tagung • Deutsche Nationalbibliothek, Leipzig und Frankfurt am Main

Cloak

id	@T2

.

Joachim Köhler • Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS, Sankt Augustin cloak

id	@T3

Session 2

15:45 - 17:45

Toggle Cloak

id

toggle-

cloak

id	@T4

Cloak

id

@T4

In diesem Vortrag wird die Klassifikation von Webseiten mit dem contentDetection-System der mindUp + Intelligence GmbH in Beziehung gesetzt zur Inhaltserschließung im Bibliotheksbereich. Könnten die Lösungsansätze übertragen werden? Welche spannenden Aufgabenstellungen im Bibliotheksbereich könnten mit den Methoden bearbeitet werden?

Pause

15:15 - 15:45

@T5

Kuratierungstechnologien für die automatische Erschließung: Semantische Verfahren, Peter Bourgonje • Deutsches Forschungszentrum für Künstliche Intelligenz

GmbH

GmbH (DKFI), Projektbüro Berlin

Cloak

id	@T5

Dieser Vortrag gibt einen Überblick über Projekte des Forschungsbereichs “Speech and Language Technology” des DFKI, in denen Werkzeuge, Services und Infrastrukturen für die semantische Verarbeitung von Content entwickelt werden. Wir bezeichnen diese als Kuratierungstechnologien. Diese Plattformen integrieren verschiedene sprachtechnologische Komponenten (Natural Language Processing, NLP) und beschäftigen sich u.a. mit Herausforderungen wie Low-Resource-Settings, Domain-Transfer, Interoperabilität, Workflows und Workflow-Orchestrierung. In den Projekten wurden und werden Prototypen für verschiedene Dimensionen entwickelt, von kleinen und sehr spezifischen historischen Archiven (z.B. Briefwechsel) über neuere Datensammlungen aus dem politischen Bereich hin zur Analyse großer Mengen von Nachrichtenartikeln zur Erkennung von Falschnachrichten. Neben diesen Aktivitäten werden wir auch kurz das European Language Grid vorstellen. Dieses vom DFKI koordinierte EU-Projekt entwickelt derzeit die größte Plattform für Sprachtechnologien in Europa – für Forschung und Industrie und für alle europäischen Sprachen.

Toggle Cloak

id	@T6

Digitalisate kuratieren mit KI - von unstrukturierten Daten zu strukturierten Inhalten, Clemens Neudecker • Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, Berlin

Cloak

id	@T6

Toggle Cloak

id	@T3

Textanalyse im Kontext der Rundfunkanstalten, Dr.-Ing. Joachim Köhler • Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS, Sankt Augustin

Cloak

id	@T3

Pause

15:15 - 15:45

Session 2

15:45 - 17:45

toggle-cloak

id	@T4

Die Vermessung der Welt – Maschinelle Erschließung des deutschsprachigen WWW, Joachim Feist • mindUp Web + Intelligence GmbH , Konstanz

Cloak

id	@T4

In diesem Vortrag wird die Klassifikation von Webseiten mit dem contentDetection-System der mindUp + Intelligence GmbH in Beziehung gesetzt zur Inhaltserschließung im Bibliotheksbereich. Könnten die Lösungsansätze übertragen werden? Welche spannenden Aufgabenstellungen im Bibliotheksbereich könnten mit den Methoden bearbeitet werden?

Toggle Cloak

id	@T7

Patentsuche und -überwachung mit Methoden der Künstlichen Intelligenz in Theorie und Praxis - Teil 1: Maschinelles Lernen für Patentklassifizierung, Dr. Kornél Markó • Averbis GmbH, Freiburg

Cloak

id	@T7

Toggle Cloak

id	@T8

Patentsuche und -überwachung mit Methoden der Künstlichen Intelligenz in Theorie und Praxis - Teil 2: Praxisbericht, Dr. Jochen Spuck • EconSight, Basel

Cloak

id	@T8

Toggle Cloak

id	@T9

Maschinelle Erschließungsverfahren versus Volltextsuche, Prof. Dr. Christian Wartena • Hochschule Hannover

Cloak

id	@T9

Ist die automatische Inhaltserschließung ein krampfhaftes Festhalten an überlebte Verfahren, die man durch eine moderne Technologie zu retten versucht? Sind die alten Argumente für die Inhaltserschließung, wie die der Synonymie und Homonymie in einem Zeitalter, in dem Query Expansion, Relevance Feedback und viele weitere Technologien längst Bestandteil jeder Suchmaschine sind, nicht längst hinfällig? Können die Suchmaschinen nicht alles, was man mit maschinellen Erschließungsverfahren erreichen kann, und gibt es daher keinen Platz für diese Verfahren zwischen der Volltextsuche und der intellektuellen Erschließung?

Wir wollen im Vortrag schauen, wie das Zusammenspiel von Suchmaschinen und automatische Erschließung funktionieren kann. Automatische Erschließungsverfahren scheinen insbesondere dann einen Mehrwert zu haben, wenn sie auf zusätzliche Informationsquellen zurückgreifen. Ein optimaler Nutzen kann aber nur dann erzielt werden, wenn die Einbindung der Erschließungsergebnisse in der Suche gut durchdacht ist.

Abendessen

ab 19:15

Abendessen auf Selbstzahlerbasis im Restaurant der Deutschen Nationalbibliothek

11. Oktober 2019

...

Thema

Parallele Angebote

9:00 - 11:30

Toggle Cloak

id	@T10

Einführung in die Programmierung mit Python, Dr. Ramon Leon Voges, Nico Wagner • Deutsche Nationalbibliothek, Leipzig und Frankfurt am Main

Status

subtle	true
colour	Yellow
title	Hands-On Tutorial

Anzahl der Plätze: 15

Cloak

id	@T10

Toggle Cloak

id	@T11

Vom Text zum Inhalt, Matthias Nagelschmidt, Christoph Poley • Deutsche Nationalbibliothek, Leipzig und Frankfurt am Main

Status

subtle	true
colour	Yellow
title	Hands-On Tutorial

Anzahl der Plätze: 15

Cloak

id	@T11

In der Deutschen Nationalbibliothek wenden wir seit einigen Jahren maschinelle Verfahren für die inhaltliche Erschließung ausgewählter Publikationsgruppen an. Prozessketten zur Verarbeitung von Volltexten, digitalisierten Inhaltsverzeichnissen und bibliografischen Metadaten sind in produktivem Einsatz. Darin eingebunden sind diverse Tools, teils Open Source, teils von kommerziellen Anbietern.

Im Workshop möchten wir uns diesem Thema schrittweise und mit dem Ziel nähern, exemplarisch einen Prototypen für die maschinelle Indexierung des Englischen zu bauen. An einem einfachen Beispiel zeigen wir, wie mit Hilfe von Python nltk (Natural Language Toolkit) unstrukturierte Texte so aufbereitet werden können, dass sie sich mit inhaltlich korrespondierenden Entitäten anreichern lassen.

Der Workshop besteht aus einem theoretischen und einem praktischem Teil.

Toggle Cloak

id	@T12

Knowledge-Café, Elisabeth Mödden • Deutsche Nationalbibliothek, Leipzig und Frankfurt am Main

Anzahl der Plätze: 36

Cloak

id	@T12

Thema A - Maschinelle Inhaltserschließungsverfahren versus Volltextsuche

Thema B - Inhaltserschließung, Wie gut ist gut genug?

Toggle Cloak

id	@T13

Werkstattgespräche - Lightning Talks zu Methoden und Erfahrungen / Herausforderungen und Lösungen, Moderation: NN • Deutsche Nationalbibliothek, Leipzig und Frankfurt am Main

Anzahl der Plätze: 20

Cloak

id	@T13

Hier können Experten einen Blick auf die Verfahren werfen und durch Kurzvorträge angeregt werden in die Diskussion über die Herausforderungen und über neue Ansätze zu sprechen.

Talk 1, NN • DNB

Talk 2, NN • ZBW

Talk 3, NN • DNB

Pause

11:30 - 12:00

Session 3

12:30 - 13:00

Toggle Cloak

id	@T14

TBD, Prof. Dr. Harald Sack • FIZ Karlsruhe

Cloak

id	@T14

Bereichsverknüpfungen

Seitenhierarchie

Versionen im Vergleich

Alte Version 60

Neue Version 61

Schlüssel

Session 2

15:45 - 17:45

Pause

15:15 - 15:45

Pause

15:15 - 15:45

Session 2

15:45 - 17:45

Abendessen

ab 19:15

11. Oktober 2019

Parallele Angebote

9:00 - 11:30

Pause

11:30 - 12:00

Session 3

12:30 - 13:00