Versionen im Vergleich

Schlüssel

  • Diese Zeile wurde hinzugefügt.
  • Diese Zeile wurde entfernt.
  • Formatierung wurde geändert.

...

Welche Technologien stehen heute für die semantische Erschließung großer Textmengen zur Verfügung? Fachleute aus Wissenschaft, Wirtschaft und Praxis präsentieren und diskutieren Methoden, Dienste und Anwendungen aus den Bereichen Text Analytics, Machine Learning und Deep Learning.
 

10. Oktober 2019

 

Die Vermessung der Welt – Maschinelle Erschließung des deutschsprachigen WWW, Joachim Feist  •  mindUp Web + Intelligence GmbH , Konstanz
 Thema

Session 1

 13:00 - 15:15

 

 

 

Toggle Cloak
id@T2
Begrüßung und Einführung in die Tagung  •  Deutsche Nationalbibliothek, Leipzig und Frankfurt am Main 

Cloak
id@T2
 

Toggle Cloak
id@T1
Können Wissensgraphen die Kommunikation in der Wissenschaft verändern?, Dr. Marcus Stocker  •  Technische Informationsbibliothek (TIB), Hannover

Toggle Cloak
id@T3
Textanalyse im Kontext der Rundfunkanstalten, Dr.-Ing
Cloak
id@T1
Der Open Research Knowledge Graph (ORKG) ist ein Wissensgraph, der im Besonderen wissenschaftliche Information, die in der wissenschaftlichen Literatur veröffentlicht und kommuniziert wird, enthält – und zwar so, dass die Information maschinenlesbar ist. Maschinenlesbarkeit ist der zentrale Aspekt, denn in der Form wie heute wissenschaftliche Information kommuniziert wird – mittels natürlicher Sprache, Daten in Tabellen und Bildern als digitale PDF-Dokumente –, unterstützen uns Maschinen in der Informationssuche und -exploration nur sehr bedingt. Der ORKG setzt sich zum Ziel, mehr wissenschaftliche Information Maschinen besser zugänglich zu machen, und setzt somit neue Möglichkeiten und Maßstäbe für die Wissenschaftskommunikation im 21. Jahrhundert.

Toggle Cloak
id@T2
Begrüßung und Einführung in die Tagung  •  Deutsche Nationalbibliothek, Leipzig und Frankfurt am Main 

Cloak
id@T2

 

.
Joachim Köhler  •  Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS, Sankt Augustin cloak
id@T3
 
Session 2
15:45 - 17:45
Toggle Cloak
id

toggle-
cloak
id@T4
Cloak
id

@T4

In diesem Vortrag wird die Klassifikation von Webseiten mit dem contentDetection-System der mindUp + Intelligence GmbH in Beziehung gesetzt zur Inhaltserschließung im Bibliotheksbereich. Könnten die Lösungsansätze  übertragen werden? Welche spannenden Aufgabenstellungen im Bibliotheksbereich könnten mit den Methoden bearbeitet werden?

Pause
15:15 - 15:45

@T5
Kuratierungstechnologien für die automatische Erschließung: Semantische Verfahren, Peter Bourgonje  •  Deutsches Forschungszentrum für Künstliche Intelligenz

GmbH 

GmbH (DKFI), Projektbüro Berlin 

Cloak
id@T5

Dieser Vortrag gibt einen Überblick über Projekte des Forschungsbereichs “Speech and Language Technology” des DFKI, in denen Werkzeuge, Services und Infrastrukturen für die semantische Verarbeitung von Content entwickelt werden. Wir bezeichnen diese als Kuratierungstechnologien. Diese Plattformen integrieren verschiedene sprachtechnologische Komponenten (Natural Language Processing, NLP) und beschäftigen sich u.a. mit Herausforderungen wie Low-Resource-Settings, Domain-Transfer, Interoperabilität, Workflows und Workflow-Orchestrierung. In den Projekten wurden und werden Prototypen für verschiedene Dimensionen entwickelt, von kleinen und sehr spezifischen historischen Archiven (z.B. Briefwechsel) über neuere Datensammlungen aus dem politischen Bereich hin zur Analyse großer Mengen von Nachrichtenartikeln zur Erkennung von Falschnachrichten. Neben diesen Aktivitäten werden wir auch kurz das European Language Grid vorstellen. Dieses vom DFKI koordinierte EU-Projekt entwickelt derzeit die größte Plattform für Sprachtechnologien in Europa – für Forschung und Industrie und für alle europäischen Sprachen.


 

Toggle Cloak
id@T6
  Digitalisate kuratieren mit KI - von unstrukturierten Daten zu strukturierten Inhalten, Clemens Neudecker  •  Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, Berlin

Cloak
id@T6
 

Toggle Cloak
id@T3
Textanalyse im Kontext der Rundfunkanstalten, Dr.-Ing. Joachim Köhler  •  Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS, Sankt Augustin  

Cloak
id@T3
 
Pause
15:15 - 15:45
Session 2
15:45 - 17:45

toggle-cloak
id@T4
Die Vermessung der Welt – Maschinelle Erschließung des deutschsprachigen WWW, Joachim Feist  •  mindUp Web + Intelligence GmbH , Konstanz  

Cloak
id@T4

In diesem Vortrag wird die Klassifikation von Webseiten mit dem contentDetection-System der mindUp + Intelligence GmbH in Beziehung gesetzt zur Inhaltserschließung im Bibliotheksbereich. Könnten die Lösungsansätze  übertragen werden? Welche spannenden Aufgabenstellungen im Bibliotheksbereich könnten mit den Methoden bearbeitet werden?

 

Toggle Cloak
id@T7
Patentsuche und -überwachung mit Methoden der Künstlichen Intelligenz in Theorie und Praxis - Teil 1: Maschinelles Lernen für Patentklassifizierung, Dr. Kornél Markó  •  Averbis GmbH, Freiburg

Cloak
id@T7
 
 

Toggle Cloak
id@T8
Patentsuche und -überwachung mit Methoden der Künstlichen Intelligenz in Theorie und Praxis - Teil 2: Praxisbericht, Dr. Jochen Spuck  •  EconSight, Basel

Cloak
id@T8
 
 

Toggle Cloak
id@T9
  Maschinelle Erschließungsverfahren versus Volltextsuche, Prof. Dr. Christian Wartena  •  Hochschule Hannover

Cloak
id@T9

Ist die automatische Inhaltserschließung ein krampfhaftes Festhalten an überlebte Verfahren, die man durch eine moderne Technologie zu retten versucht? Sind die alten Argumente für die Inhaltserschließung, wie die der Synonymie und Homonymie in einem Zeitalter, in dem Query Expansion, Relevance Feedback und viele weitere Technologien längst Bestandteil jeder Suchmaschine sind, nicht längst hinfällig? Können die Suchmaschinen nicht alles, was man mit maschinellen Erschließungsverfahren erreichen kann, und gibt es daher keinen Platz für diese Verfahren zwischen der Volltextsuche und der intellektuellen Erschließung?

Wir wollen im Vortrag schauen, wie das Zusammenspiel von Suchmaschinen und automatische Erschließung funktionieren kann. Automatische Erschließungsverfahren scheinen insbesondere dann einen Mehrwert zu haben, wenn sie auf zusätzliche Informationsquellen zurückgreifen. Ein optimaler Nutzen kann aber nur dann erzielt werden, wenn die Einbindung der Erschließungsergebnisse in der Suche gut durchdacht ist.

Abendessen
ab 19:15

Abendessen auf Selbstzahlerbasis im Restaurant der Deutschen Nationalbibliothek 


11. Oktober 2019

...

 Thema
Parallele Angebote
9:00 - 11:30

Toggle Cloak
id@T10
Einführung in die Programmierung mit Python, Dr. Ramon Leon Voges, Nico Wagner  •  Deutsche Nationalbibliothek, Leipzig und Frankfurt am Main

Status
subtletrue
colourYellow
titleHands-On Tutorial
 Anzahl der Plätze: 15

Cloak
id@T10
 

Toggle Cloak
id@T11
Vom Text zum Inhalt, Matthias Nagelschmidt, Christoph Poley  •  Deutsche Nationalbibliothek, Leipzig und Frankfurt am Main

Status
subtletrue
colourYellow
titleHands-On Tutorial
Anzahl der Plätze: 15

Cloak
id@T11

In der Deutschen Nationalbibliothek wenden wir seit einigen Jahren maschinelle Verfahren für die inhaltliche Erschließung ausgewählter Publikationsgruppen an. Prozessketten zur Verarbeitung von Volltexten, digitalisierten Inhaltsverzeichnissen und bibliografischen Metadaten sind in produktivem Einsatz. Darin eingebunden sind diverse Tools, teils Open Source, teils von kommerziellen Anbietern.

Im Workshop möchten wir uns diesem Thema schrittweise und mit dem Ziel nähern, exemplarisch einen Prototypen für die maschinelle Indexierung des Englischen zu bauen. An einem einfachen Beispiel zeigen wir, wie mit Hilfe von Python nltk (Natural Language Toolkit) unstrukturierte Texte so aufbereitet werden können, dass sie sich mit inhaltlich korrespondierenden Entitäten anreichern lassen.

Der Workshop besteht aus einem theoretischen und einem praktischem Teil.

Toggle Cloak
id@T12
Knowledge-Café, Elisabeth Mödden  •  Deutsche Nationalbibliothek, Leipzig und Frankfurt am Main

Anzahl der Plätze: 36

Cloak
id@T12

 

Thema A - Maschinelle Inhaltserschließungsverfahren versus Volltextsuche

 

Thema B - Inhaltserschließung,  Wie gut ist gut genug?

 

Toggle Cloak
id@T13
Werkstattgespräche - Lightning Talks zu Methoden und Erfahrungen / Herausforderungen und Lösungen, Moderation: NN  •  Deutsche Nationalbibliothek, Leipzig und Frankfurt am Main

Anzahl der Plätze: 20

Cloak
id@T13

Hier können Experten einen Blick auf die Verfahren werfen und durch Kurzvorträge angeregt werden in die Diskussion über die Herausforderungen und über neue Ansätze zu sprechen.

Talk 1, NN • DNB

 

Talk 2, NN • ZBW

 

 

Talk 3, NN • DNB

 

Pause
11:30 - 12:00
Session 3
12:30 - 13:00

Toggle Cloak
id@T14
TBD, Prof. Dr. Harald Sack • FIZ Karlsruhe

Cloak
id@T14