Der vierte Workshop zum Thema Computerunterstützte Inhaltserschließung – organisiert von der Universitätsbibliothek Stuttgart, der Staatsbibliothek zu Berlin -Preußischer Kulturbesitz und der Eurospider Information Technology AG in Zusammenarbeit mit dem Bibliotheksservicezentrum Baden-Württemberg und der Deutschen Nationalbibliothek – hat am 11. und 12. November als Videokonferenz stattgefunden. Angemeldet waren 230 Teilnehmerinnen und Teilnehmer.
Die Präsentationen stellen wir hier zum Download bereit
...
. Die Veröffentlichungen unterliegen der CC BY-SA 3.0-Lizenz.
10. Oktober 2019
Die Materialien der früheren Workshops finden Sie → hier. Weitere Informationen zum Netzwerk maschinelle Verfahren in der Erschließung finden Sie → hier.
Stand: 20. November 2020
Mittwoch • 11. November 2020
...
Thema | Session_1_____ | 13:00 - 15Technische Durchführung: Bibliotheksservice-Zentrum Baden-Württemberg Moderation: Helge Steenweg • Universitätsbibliothek Stuttgart Ι Peter Schäuble •Eurospider Information Technology AG | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
14:15 | Begrüßung und Einführung in die Tagung, Ute Schwens Frank Scholze • Deutsche Nationalbibliothek, Leipzig und Frankfurt am Main
| Session 215:45 - 17:45 |
Toggle Cloak | ||
---|---|---|
|
Cloak | ||
---|---|---|
| ||
In diesem Vortrag wird die Klassifikation von Webseiten mit dem contentDetection-System der mindUp + Intelligence GmbH in Beziehung gesetzt zur Inhaltserschließung im Bibliotheksbereich. Könnten die Lösungsansätze übertragen werden? Welche spannenden Aufgabenstellungen im Bibliotheksbereich könnten mit den Methoden bearbeitet werden? |
Toggle Cloak | ||
---|---|---|
|
Cloak | ||
---|---|---|
| ||
Toggle Cloak | ||
---|---|---|
|
Cloak | ||
---|---|---|
| ||
Toggle Cloak | ||
---|---|---|
|
Cloak | ||
---|---|---|
| ||
Ist die automatische Inhaltserschließung ein krampfhaftes Festhalten an überlebte Verfahren, die man durch eine moderne Technologie zu retten versucht? Sind die alten Argumente für die Inhaltserschließung, wie die der Synonymie und Homonymie in einem Zeitalter, in dem Query Expansion, Relevance Feedback und viele weitere Technologien längst Bestandteil jeder Suchmaschine sind, nicht längst hinfällig? Können die Suchmaschinen nicht alles, was man mit maschinellen Erschließungsverfahren erreichen kann, und gibt es daher keinen Platz für diese Verfahren zwischen der Volltextsuche und der intellektuellen Erschließung? |
11. Oktober 2019
14:25 | Organisatorische Hinweise Volker Conradt • Bibliotheksservice-Zentrum Baden-Württemberg |
14:30 | Organisation und Kommunikation rund um den Digitalen Assistenten DA-3 Regine Beckmann • Staatsbibliothek zu Berlin – Preußischer Kulturbesitz Ι Imma Hinrichs • Universitätsbibliothek Stuttgart Ι → Präsentation |
15:00 | Artikelerschliessung und multilinguale Volltextsuche im IxTheo Martin Faßnacht • Universitätsbibliothek Tübingen Ι → Präsentation |
15:30 | Synergien nutzen - Maschinelle Unterstützung der intellektuellen Inhaltserschließung Helga Karg Ι Hans-Jürgen Becker Ι Angela Vorndran • Deutsche Nationalbibliothek Ι → Präsentation |
16:00 | Geplante Inhaltserschliessung im FIV mit dem DA-3 und dem EuroThesaurus Susanne Baron • Fachinformationsverbund FIV / Stiftung Wissenschaft und Politik Ι → Präsentation |
16:30 | Technik des DA-3: Anschluss an K10plus Armin Kühn • Bibliotheksservice-Zentrum Baden-Württemberg Ι Andreas Krausz • Verbundzentrale des Gemeinsamen Bibliotheksverbunds Ι → Präsentation |
Donnerstag • 12. November 2020
...
_____ | Technische Durchführung: Bibliotheksservice-Zentrum Baden-Württemberg Moderation: Helge Steenweg • Universitätsbibliothek Stuttgart Ι Peter Schäuble • Eurospider Information Technology AG |
---|---|
09:00 | Spezielle Herausforderungen bei der Evaluation der Inhaltserschliessung Martin Braschler • ZHAW Zürcher Hochschule für Angewandte Wissenschaften Ι → Präsentation |
09:30 | Evaluation von Annif für die maschinelle Inhaltserschließung an der Deutschen Nationalbibliothek Matthias Nagelschmidt • Deutsche NationalbibliothekΙ → Präsentation |
10:00 | Einsatz des DA-3 in der ZBW: Anpassungen und Stand der Umsetzung Susanne Schmucker • ZBW – Leibniz-Informationszentrum Wirtschaft Ι → Präsentation |
10:30 | DA-3 zu Corona-Zeiten & DA-3 Ticket-System Christoph Steiner • Österreichischer Bibliothekenverbund Ι → Präsentation |
11:00 | Bericht aus dem Lenkungsausschuss Helge Steenweg • Universitätsbibliothek Stuttgart Ι → Präsentation |
11:30 | DA-3 Anwendertreffen Regine Beckmann • Staatsbibliothek zu Berlin – Preußischer Kulturbesitz Ι Imma Hinrichs • Universitätsbibliothek Stuttgart |
Workshops___
9:00 - 11:30
Toggle Cloak | ||
---|---|---|
|
Status subtle true colour Yellow title Hands-On Tutorial
Cloak | ||
---|---|---|
| ||
Python ist eine einfach zu erlernende Programmiersprache, die auch für Anwendungsfälle aus der Computerlinguistik und des maschinellen Lernens Popularität erlangt hat. Einerseits erleichtert die klare Syntax die Lesbarkeit und ermöglicht es, bereits mit wenig Code anspruchsvolle Aufgaben zu lösen. Andererseits ist Python durch die Erweiterbarkeit um viele spezifische Funktionen ein universelles Werkzeug, das für ganz unterschiedliche Zwecke genutzt werden kann. In diesem Workshop möchten wir eine Einführung in die Programmierung mit Python geben. Nach einer theoretischen Einführung in die Grundlagen der Sprache, entwickeln wir gemeinsam ein Programm, das einen Text entgegennimmt und einfache, quantitative Analysen darauf durchführt. Unser Angebot richtet sich an Teilnehmerinnen und Teilnehmer, die über keine oder nur sehr wenig Programmierkenntnisse verfügen und an den praktischen Grundlagen von Textstatistik und natürlicher Sprachverarbeitung interessiert sind. |
Toggle Cloak | ||
---|---|---|
|
Status subtle true colour Yellow title Hands-On Tutorial
Cloak | ||
---|---|---|
| ||
In der Deutschen Nationalbibliothek wenden wir seit einigen Jahren maschinelle Verfahren für die inhaltliche Erschließung ausgewählter Publikationsgruppen an. Prozessketten zur Verarbeitung von Volltexten, digitalisierten Inhaltsverzeichnissen und bibliografischen Metadaten sind in produktivem Einsatz. Darin eingebunden sind diverse Tools, teils Open Source, teils von kommerziellen Anbietern. Im Workshop möchten wir uns diesem Thema schrittweise und mit dem Ziel nähern, exemplarisch einen Prototypen für die maschinelle Indexierung des Englischen zu bauen. An einem einfachen Beispiel zeigen wir, wie mit Hilfe von Python nltk (Natural Language Toolkit) unstrukturierte Texte so aufbereitet werden können, dass sie sich mit inhaltlich korrespondierenden Entitäten anreichern lassen. Der Workshop besteht aus einem theoretischen und einem praktischem Teil. Bitte bringen Sie Ihr eigenes Notebook mit. Für den Workshop wird eine vorkonfigurierte Arbeitsumgebung in Form einer virtuellen Maschine bereitgestellt, die die benötigte Software enthält. Um die virtuelle Maschine starten und nutzen zu können, wird die Virtualisierungssoftware Oracle Virtual Box (ab Version 6.0) benötigt. Oracle Virtual Box ist kostenlos erhältlich für Windows, Linux oder Mac unter: https://www.oracle.com/de/virtualization/virtualBox. |
Toggle Cloak | ||
---|---|---|
|
id | @T12 |
---|
Moderne Technologien für Text Mining und Information Retrieval sind als Instrumente für eine zeitgemäße inhaltliche Erschließung nicht mehr wegzudenken. Das hat Konsequenzen für den Umgang mit Normdaten, Standards und Regelwerken, die aktuell noch eine starke Prägung durch die bisher etablierten Formen der intellektuellen Erschließung erkennen lassen. Wie können diese Elemente so weiterentwickelt werden, dass sie auch den neuen Gegebenheiten gerecht werden?
Neue Technologien eröffnen zahlreiche Möglichkeiten der Strukturierung und Vernetzung von Daten. Wie können diese zukünftig noch besser genutzt werden? Und was können neue Verfahren zur Aktualisierung und Generierung neuer Daten beitragen?
In diesem Spannungsfeld stellt sich immer wieder die Frage nach der Erschließungsqualität. Welche Kriterien für Qualität lassen sich überhaupt identifizieren, und welche davon sind auch tatsächlich relevant?
Die hier angesprochenen Fragen möchten wir mit Ihnen im Rahmen eines Knowledge Cafés erörtern, das von Experten aus verschiedenen Einrichtungen (u. a. ZBW, DNB und SUB Hamburg) vorbereitet wurde. Den Einstieg hierzu liefert der Vortrag „Maschinelle Erschließungsverfahren versus Volltextsuche“ von Prof. Dr. Christian Wartena. Ziel ist es, ein Forum für diejenigen zu schaffen, die an Entwicklungsfragen im Bereich der inhaltlichen Erschließung und ihrer Automatisierung interessiert sind und sich miteinander vernetzen wollen.
Lightning Talks:
- Qualität • Michael Franke-Maier • Universitätsbibliothek der FU Berlin
- Erschließung für Discovery Systeme gestalten • Dr.-Ing. Jan Frederik Maas • SUB Hamburg
Toggle Cloak | ||
---|---|---|
|
id | @T13 |
---|
Das Leibniz-Zentrum Wirtschaft (ZBW) und die Deutsche Nationalbibliothek (DNB) beschäftigen sich schon seit einigen Jahren mit dem Einsatz maschineller Verfahren zur inhaltlichen Erschließung von Publikationen. Dabei sind die Bedürfnisse der Zielgruppen und entsprechend auch die Herangehensweisen in den beiden Institutionen recht unterschiedlich.
In Lightning Talks möchten wir über den aktuellen Stand der Verfahren und Prozesse in unseren Institutionen berichten und anschließend mit Ihnen ins Gespräch kommen, Erfahrungen austauschen und neue Ideen diskutieren.
Beiträge:
- Automatisierung der Sacherschließung (AutoSE) an der ZBW • Anna Kasprzik, Moritz Fürneisen • ZBW
Maschinelle Klassifizierung • Frank Busse • DNB
Maschinelle Beschlagwortung • Sandro Uhlmann • DNB
Wörterbucharbeit für die maschinelle Beschlagwortung • Jan-Helge Jacobs • DNB
Prozesse und Modularisierung für die maschinelle Erschließung • Claudia Grote • DNB
Session 3
12:00 - 13:00
Toggle Cloak | ||
---|---|---|
|
Cloak | ||
---|---|---|
| ||
Künstliche Intelligenz (KI) durchdringt immer mehr Lebensbereiche und ist schon heute ein wichtiger Faktor für Forschung, wirtschaftliche Entwicklung und Arbeitswelt. Selbst die Bundesregierung hat die Erforschung, Entwicklung und Anwendung von KI als strategisches Ziel erkannt. Doch werden mit jeder neuen Erfolgsmeldung auch immer wieder falsche Erwartungen geweckt, und dies folgt einer langen Tradition. Als KI wird heute meist maschinelles Lernen verstanden, insbesondere Deep Learning, dessen Erfolge in den vergangenen Jahren verantwortlich für die aktuelle Popularität dieses Begriffs sind. Aber oft werden aufgrund einer einzigartigen, auf einen eng fokussierten Anwendungsbereich beschränkten Fähigkeit eines KI Systems unzulässige Verallgemeinerungen über dessen tatsächliche „Intelligenz“ getroffen, die sich aus dem vermeintlich intelligenten Verhalten der Maschine schließen lässt. Im Rahmen dieses Vortrags werfen wir ein kritisches Licht auf aktuelle Entwicklungen aus dem Bereich der KI, auf ihre Möglichkeiten, inhärente Probleme und potenzielle Grenzen. Ein besonderer Aspekt ist dabei die Kombination subsymbolischer maschineller Lernverfahren (Deep Learning) mit symbolischen Wissensrepräsentationen (Semantik) zur Einbeziehung von Kontext, Pragmatik und Erfahrungswissen in den Prozess der automatisierten Klassifikation und Erschließung. |