Wann: | 28. und 39. Mai 20222023 |
Wo: | online Erfahrungsgemäß läuft BigBlueButton auch auf dem Mac reibungsloser mit Firefox oder Chrome. Außerdem hat sich gezeigt, dass es generell weniger technische Probleme gibt, wenn man sich nicht über VPN einwählt.Universität Mannheim, Fuchs-Petrolub-Festsaal (O 138), Anfahrt |
Veranstalter: | DINI-AG KIM, UB Mannheim |
Anmeldung: | Die Für die Teilnahme an der Veranstaltung ist kostenloseine Anmeldung erforderlich. Wenn man nur an einzelnen Programmpunkten teilnehmen kann oder möchte ist das natürlich auch möglich. In jedem Fall bitten wir aber um Anmeldung unter: https://dini.de/veranstaltungen/workshops/kim-workshop-20222023/anmeldeformular/ |
Teilnahmegebühr: | 40 Euro |
Programmkomitee+ Organisationsteam: | Tracy Arndt (DNB), Alex Jahnke (SUB Göttingen), Jana Hentschke (ZBW Hamburg), Sylvia Hulin (UB Mannheim), Letitia Mölck (DNB), Philipp Zumstein (UB Mannheim), Carloni Massimiliano (OEAWJakob Voß (VZG Göttingen), Karl Krägelin (SUB GöttingenPhú Tu (hbz) |
TwitterKurznachrichtendienste: Hashtag #kimws22 | Mastodon-Hashtag #kimws23, Twitter-Hashtag #kimws23 |
Kontakt: | kim-info@dini.de |
Teilnehmende: | https://dini.de/veranstaltungen/workshops/kim-workshop-2022/liste-der-teilnehmenden/ |
Programm
2023/teilnehmendenliste/ | |
Hoteloptionen: | Hinweis: In diesem Jahr findet in Mannheim die Bundesgartenschau statt, daher ist es sicher sinnvoll, sich möglichst frühzeitig um ein Hotel zu kümmern und ggf. auch den weiteren Umkreis (z.B. Ludwigshafen, Heidelberg) in die Suche mit einzubeziehen. |
Abendessen: | Montagabend, 19 Uhr besteht für alle Interessierten die Möglichkeit, den ersten Workshoptag auf Selbstzahlerbasis noch gemeinsam im Restaurant Ellin ("Original Greek", mit vegetarischen Optionen und auch Burgern im Programm), Adresse: E3,1 (Wegbeschreibung) ausklingen zu lassen. |
Programm
Inhalt | ||||||
---|---|---|---|---|---|---|
|
Montag,
...
8. Mai
...
2023
0911:45 30 - 1011:0045 | Begrüßung Sabine Gehrlein (UB Mannheim, Leitende Bibliotheksdirektorin) Tracy Andt (DNB), Alex Jahnke (SUB Göttingen), Letitia Mölck (DNB) (DINI-AG KIM AG-Sprecherin Sprecher und -SprecherSprecherin) | |||||||||||||||||||
1011:00 45 - 1012:30 Vortrag Péter Király (GWDG): Validating JSON, XML and CSV data with SHACL-like constraints (in englischer Sprache | Kennenlernrunde Metadaten im Alltag: Einsatz von Metadaten im beruflichen Kontext, Erfahrungen, Herausforderungen, Probleme | |||||||||||||||||||
12:30 - 13:30 | Mittagspause mit Verpflegung | |||||||||||||||||||
13:30 - 17:30 | Hands-on-Tutorials - Anmeldung erforderlich | |||||||||||||||||||
| ...||||||||||||||||||||
Metadata Quality Assessment Framework is a tool aiming to provide building blocks to analyse the quality of metadata records of cultural heritage organisations. It can read JSON, XML or CSV records and runs metrics of general quality dimensions, such as completeness, multilinguality, uniqueness, accuracy. It also provides a SHACL-like vocabulary to create specific validation rules for individual data elements. The tool can be used from the command line, and it can be built into a larger framework, and using it via its API. The presentation provides an overview of the rule set one can apply for metadata records, and also shows how it is use in practice at the Deutsche Digitale Bibliothek. DDB aggregates data in different metadata schemas (Dublin Core, EDM, LIDO, EAD, METS/MODS). The tool is used to check incoming records, and those records which are transformed for exporting to Europeana. The metadata team sets a uniform set of requirements, and a scoring system to detect issues and qualify individual records. | ||||||||||||||||||||
10:30 - 11:00 | Vortrag Adrian Pohl und Fabian Steeg (hbz): Datentransformation mit Metafacture – Aktuelle Entwicklungen
| |||||||||||||||||||
11:00 - 11:30 | Programmpause | |||||||||||||||||||
| 11:30 - 13:00 |
| ...||||||||||||||||||
In dieser 90-minütigen Session soll in der Runde aller KIM-Workshop-Teilnehmenden ein Good-Practice-Austausch stattfinden zu der Frage "Mit welchen unterstützenden Werkzeugen lassen sich Aufgaben effizient verwalten und Arbeitsabläufe ". Gegenstand müssen dabei nicht ausschließlich Aufgaben des Arbeitsbereich (Meta-)Datenverarbeitung sein soll aber Interessante Werkzeuge können sicherlich auch aus anderen Bereichen kommen, zum Beispiel der Softwareentwicklung oderdem Projektmanagement. Mögliche Beispiele: Git Issues, Trello, Jira, Alternativen zu Jira, Wikis, MS Outlook Features ... In der Session soll zunächst erhoben werden, welche Werkzeuge die Anwesenden bereits wie einsetzen. Dazu kann von allen Anwesenden spontan mündlich berichtet oder visuell demonstriert werden. Im weitere Verlauf können, ggf. in , Stärken und Schwächen der einzelnen Lösungen herausgearbeitet und gegeneinander gehalten werden. Ziel ist die gegenseitige Inspiration für den Arbeitsalltag und eine gemeinsame Vorstellung von der Bandbreite der Möglichkeiten. | ||||||||||||||||||||
13:00 - 14:00 | Programmpause | 14:00 - 15:00 |
Erweitern | ||
---|---|---|
| ||
Im ersten Teil wird gezeigt, wie wir aus den Daten im Rohformat (PICA+) die wesentlichen Daten extrahieren und so aufbereiten, dass sie im GND-Dashboard angezeigt werden können. Wir stellen das Tool „pica-rs“ [2] vor, das für die Datenextraktion verwendet wird und illustrieren an ausgewählten Beispielen wie die Datenaufbereitung mit der Programmiersprache Python umgesetzt ist. Abschließend wird das Setup vorgestellt, mit dem wir die Daten im Dashboard monatlich aktualisieren. |
Teil 2 André Wendler (DNB): Anzeige der Statistiken im Dashboard
Erweitern | ||
---|---|---|
| ||
Der zweite Teil erläutert, wie die Statistiken mit der Software Streamlit (siehe [3]) zu einem interaktiven, web-basierten Dashboard aufbereitet werden. Dabei wird es auch um den Wissenstransfer zwischen bibliothekarischen Fachleuten und den Data Sciences gehen. |
Lightning Talks & Open Space
- Wer einen Lightning Talk beitragen möchte, kann sich gerne hier dafür eintragen: https://data.bib.uni-mannheim.de/kimws22/pad
- Wer eine Diskussionsrunde zu einem (beliebigen) Thema im Open Space anregen möchte, kann sich gerne hier dafür eintragen: https://hackmd.io/pCDXbDZoRbegpodfHfcydw
Dienstag, 3. Mai 2022
| ||||||||||||||||
Für Interessierte: gemeinsamer Restaurantbesuch (Selbstzahler) Ab 19 Uhr sind Tische reserviert im Restaurant Ellin ("Original Greek", mit vegetarischen Optionen und auch Burgern im Programm), Adresse: E3,1 (Wegbeschreibung) |
Dienstag, 9. Mai 2023
Option 1:
Metadatenanalysen mit Python & Apache Superset
Option 2:
Hacky Morning - OpenAlex
Leitung: Karl-Ulrich Krägelin (SUB Göttingen)
Erweitern | ||
---|---|---|
| ||
In diesem Hands-On Workshop soll ein Ansatz ausprobiert werden, mit dem sich Metadaten in beliebigen Ausgangsformaten analysieren lassen. Dazu wird es im ersten Teil des Tutorials um die Datenextraktion mit Python gehen und im zweiten Teil werden die extrahierten Daten in eine bereitgestellte Apache Superset Instanz geladen und dort Queries definiert, aus denen sich dann ein Dashboard zur Datenvisualisierung gebaut wird. Zielgruppe: Personen, die schnelle Einsichten in heterogene (Meta)daten haben wollen, ohne sich auf proprietäre Systeme verlassen zu müssen. Vorkenntnisse: Interesse an Datenanalyse und -visualiserung, idealerweise Einsteiger-Kenntnisse in Python (Dateien lesen, For-Loops und lxml/pandas) Voraussetzungen: Es genügt ein Rechner mit Internetzugang und modernem Webbrowser und ein Account bei https://academiccloud.de/home bzw. bei der GWDG, um https://jupyter-cloud.gwdg.de/ (siehe auch https://www.gwdg.de/application-services/jupyter) nutzen zu können. Die maximale Anzahl an Teilnehmer/inne/n für dieses Tutorial ist leider schon erreicht. |
09:00 - 09:30 | Vortrag Renat Shigapov (UB Mannheim): Warum brauchen wir Wissensgraphen in NFDI?
| |||||
09:30 - 10:00 | Vortrag Roman Baum (ZB MED): Integration von Terminologiediensten in Wissensdomänen der NFDI |
|
OpenAlex (https://openalex.org/) aggregiert und standardisiert Daten aus vielen verschiedenen Quellen zu wissenschaftlichen Publikationen inkl. Artikel-Metadaten und stellt diese über eine API frei zur Verfügung.
Wir wollen uns OpenAlex innerhalb von 3 Stunden gemeinsam anschauen und ausprobieren. Nach einem kurzem Impulsvortrag, fangen wir an OpenAlex zu erkunden. Nach dem Motto "alles kann, nix muss”, bieten wir hier Raum, sich innerhalb der vorgegebenen Zeit mit OpenAlex zu beschäftigen, Kontakte mit ebenso Interessierten zu knüpfen oder gemeinsam Ideen oder Abfragen zu entwickeln.
Zeitplan:
09:30 Uhr Start mit Impulsvortrag
09:40 Uhr Gruppenfindung
10:00 Uhr Hacken
12:30 Uhr Zusammenkommen und kurze Auswertung
13:00 Uhr Ende
Zielgruppe: Personen, die Interesse an Daten zu wissenschaftlichen Publikationen inkl. Artikel-Metadaten haben
Vorkenntnisse: keine besonderen Vorkenntnisse erforderlich
Voraussetzungen: Es genügt ein Rechner mit Internetzugang und modernem Webbrowser.
Gruppennotizen
Gruppe 1 OpenAlex und (bibliographische Daten in) Wikidata
Gruppe 2 Evaluation / Datenqualität
Gruppe 4 Datenbestand entlang Tutorial erkunden
Gruppe 5 Datenabdeckung in OpenAlex
Gruppe 6 Concepts in OpenAlex - Vergleich mit anderen Inhaltserschließungssystemen
Vortrag
Julia Rössel (Foto Marburg) und Barbara Fichtl (SUB Göttingen): Auf dem Weg zu Linked Open Data – Verbesserung der Qualität von Forschungsdaten zu Objekten materieller Kultur am Beispiel des LIDO-Standards
Erweitern | ||
---|---|---|
| ||
Um Forschungsdaten als Linked Open Data (LOD) zur Verfügung stellen zu können und somit verknüpfbar und gut nachnutzbar zu machen, sind bestimmte Anforderungen an die Qualität der Daten zu erfüllen. Im BMBF-geförderten Projekt „KONDA - Kontinuierliches Qualitätsmanagement von dynamischen Forschungsdaten zu Objekten der materiellen Kultur unter Nutzung des LIDO-Standards“ wurde auf der Basis von Datenanalysen und in enger Zusammenarbeit mit der Cultural-Heritage-Community ein Katalog von gängigen Datenqualitätsproblemen im Kulturerbebereich erstellt. Aktuell wird ein Qualitätsmanagementprozess für strukturierte Forschungsdaten entwickelt, der alle Stationen des Datenlebenszyklus umfasst. Aufbauend auf der inzwischen veröffentlichten neuen LIDO-Version v1.1 und der in den letzten Jahren entwickelten LIDO-Terminologie werden im Projekt zudem domainspezifische LIDO-Profile und -Handbücher z. B. für Malerei und Skulptur sowie für Architektur entwickelt. Im Vortrag werden zum einen das Vorgehen und einige Ergebnisse des KONDA-Projekts vorgestellt, zum anderen wird am Beispiel des LIDO-Standards veranschaulicht, worauf bei der Erzeugung, Verarbeitung und Pflege von Forschungsdaten zu Objekten materieller Kultur zu achten ist, um sie Linked Open Data-fähig zu machen. |
Vortrag
Andreas Lüschow (SUB Göttingen): Netzwerke in Normdaten - Die Visualisierung impliziter Beziehungen im CERL Thesaurus
Erweitern | ||
---|---|---|
| ||
Mit rund 1,3 Millionen Einträgen zu Personen und knapp 37.000 erfassten Orten ist der CERL Thesaurus ein zentrales Instrument zur Identifizierung und Beschreibung von Entitäten rund um die Geschichte des Buches. Nicht nur die Verknüpfungen zu anderen Normdateien, auch die zahlreichen Verknüpfungen der Thesaurus-Daten untereinander machen ihn darüber hinaus zu einem umfangreichen Rechercheinstrument. Häufig sind es allerdings nicht die einzelnen Datensätze, sondern die "versteckten" Zusammenhänge, die für unterschiedliche Forschungsfragen von Bedeutung sind. Wie entwickelte sich die Bedeutung eines Ortes im Lauf der Zeit? Zwischen welchen Städten bestand ein Austausch von Wissen? Wo waren die Hotspots bestimmter Berufsgruppen oder Regionen? Der Vortrag beschreibt einen anpassungsfähigen Workflow zur Extraktion und Analyse solcher impliziter Beziehungen und beleuchtet die Mehrwerte einer Netzwerkperspektive auf die Daten am Beispiel des Wissenstransfers zwischen Städten. |
Abschluss
KIM Workshop 2022 - Wrap-Up
Tracy Arndt (DNB) Alex Jahnke (SUB Göttingen)
Veranstaltungsausblick
Mittwoch, 4. Mai 2022
| ||||||
10:00 - 10:30 | Kaffeepause | |||||
10:30 - 11:00 | Vortrag Uwe Sikora (SUB Göttingen): Ein Workflow zum Austausch von in digitalen Editionsprojekten erfassten Daten mit der GND
| |||||
11:00 - 11:30 | Vortrag Angela Vorndran und Stefan Grund (DNB Frankfurt am Main) : Personen in GND und Titeldaten – Vorschläge, Anreicherungen und Verknüpfungen
| |||||
11:30 - 12:00 | Vortrag Nicolas Bach (HdM Stuttgart): Integrität, Authentizität, höchstmögliche Datensouveränität? Potenziale und Risiken dezentraler Technologien als Tools für die Veröffentlichung von Forschungsoutput
Folien (IPFS CID: QmQsFwJGBtpyQkNxaAqM1aYbNUTxCoyPy7HG7KQYkyxMaj) | |||||
12:00 - 12:30 | Lightning Talks
| |||||
12:30 - 13:30 | Mittagspause mit Verpflegung | |||||
13:30 - 14:30 | Open Session
| |||||
14:30 - 14:40 | Abschluss KIM Workshop 2023 - Wrap-Up Alex Jahnke (SUB Göttingen), Letitia Mölck (DNB) | |||||
14:45 - 15:30 | Öffentliche Sitzung der DINI-AG KIM | |||||
15:30 | Gemeinsamer Abschluss in der Eismanufaktur Fontanella (die Erfinder des Spaghetti-Eis) |
10:00 - 11:30
14:00-15:30
Treffen der Selbsthilfegruppe Verlagsmetadaten
Öffentlich, alle Interessierten sind herzlich willkommen.