Sie zeigen eine alte Version dieser Seite an. Zeigen Sie die aktuelle Version an.

Unterschiede anzeigen Seitenhistorie anzeigen

« Vorherige Version anzeigen Version 9 Nächste Version anzeigen »


Wann: 

2. und 3. Mai 2022

Wo:

online (https://bbb.bib.uni-mannheim.de/b/jan-9cn-gde)

Veranstalter:

DINI-AG KIMUB Mannheim
Programmkomitee+
Organisationsteam:

Tracy Arndt (DNB), Alex Jahnke (SUB Göttingen), Jana Hentschke (ZBW Hamburg), Sylvia Hulin (UB Mannheim), Philipp Zumstein (UB Mannheim), Carloni Massimiliano (OEAW), Karl Krägelin (SUB Göttingen)

Twitter: 

Hashtag #kimws22
Kontakt:kim-info@dini.de

Programm

Montag, 2. Mai 2022

09:45 - 10:00

Begrüßung

Tracy Andt (DNB), Alex Jahnke (SUB Göttingen) (DINI-AG KIM AG-Sprecherin und -Sprecher)

10:00 - 10:30

Vortrag

Péter Király (GWDG): Validating JSON, XML and CSV data with SHACL-like constraints

(in englischer Sprache)

Metadata Quality Assessment Framework is a tool aiming to provide building blocks to analyse the quality of metadata records of cultural heritage organisations. It can read JSON, XML or CSV records and runs metrics of general quality dimensions, such as completeness, multilinguality, uniqueness, accuracy. It also provides a SHACL-like vocabulary to create specific validation rules for individual data elements. The tool can be used from the command line, and it can be built into a larger framework, and using it via its API.

The presentation provides an overview of the rule set one can apply for metadata records, and also shows how it is use in practice at the Deutsche Digitale Bibliothek. DDB aggregates data in different metadata schemas (Dublin Core, EDM, LIDO, EAD, METS/MODS). The tool is used to check incoming records, and those records which are transformed for exporting to Europeana. The metadata team sets a uniform set of requirements, and a scoring system to detect issues and qualify individual records.


10:30 - 11:00

Vortrag

Name: Titel

Abstract


11:00 - 11:30Programmpause
11:30 - 13:00

Interaktive Session

Arbeit strukturieren, planen und verteilen - Erfahrungsaustausch zu Werkzeugen

Moderation: Jana Hentschke (ZBW)

Abstract

13:00 - 14:00Programmpause
14:00 - 14:30

Vortrag

Name: Titel

Abstract



14:30 - 15:00

Vortrag

Name: Titel

Abstract



15:00 - 15:15Programmpause
15:15 - 17:00

Lightning Talks & Open Space


Dienstag, 3. Mai 2022

09:30 - 13:00

Hands-On Tutorials

(Info) Anmeldung erforderlich

Option 1:

Metadatenanalysen mit Python & Apache Superset

Option 2:

Titel

Option 3:

Titel

Leitung: Karl-Ulrich Krägelin

In diesem Hands-On Workshop soll ein Ansatz ausprobiert werden, mit dem sich Metadaten in beliebigen Ausgangsformaten analysieren lassen. Dazu wird es im ersten Teil des Tutorials um die Datenextraktion mit Python gehen und im zweiten Teil werden die extrahierten Daten in eine bereitgestellte Apache Superset Instanz geladen und dort Queries definiert, aus denen sich dann ein Dashboard zur Datenvisualisierung gebaut wird.

Zielgruppe: Personen, die schnelle Einsichten in heterogene (Meta)daten haben wollen, ohne sich auf proprietäre Systeme verlassen zu müssen.

Vorkenntnisse: Interesse an Datenanalyse und -visualiserung, idealerweise Einsteiger-Kenntnisse in Python (Dateien lesen, For-Loops und lxml/pandas)

Voraussetzungen: Es genügt ein Notebook mit Internetzugang und modernem Webbrowser und ein Account bei https://academiccloud.de/home bzw. bei der GWDG, um https://jupyter-cloud.gwdg.de/ (siehe auch https://www.gwdg.de/application-services/jupyter) nutzen zu können.

Leitung: Name

Abstract

Leitung: Name

Abstract

13:00 - 14:00Programmpause
14:00 - 14:30

Vortrag

Name: Titel

Abstract


14:30 - 15:00

Vortrag

Andreas Lüschow (SUB Göttingen):  Netzwerke in Normdaten - Die Visualisierung impliziter Beziehungen im CERL Thesaurus

Mit rund 1,3 Millionen Einträgen zu Personen und knapp 37.000 erfassten Orten ist der CERL Thesaurus ein zentrales Instrument zur Identifizierung und Beschreibung von Entitäten rund um die Geschichte des Buches. Nicht nur die Verknüpfungen zu anderen Normdateien, auch die zahlreichen Verknüpfungen der Thesaurus-Daten untereinander machen ihn darüber hinaus zu einem umfangreichen Rechercheinstrument. Häufig sind es allerdings nicht die einzelnen Datensätze, sondern die "versteckten" Zusammenhänge, die für unterschiedliche Forschungsfragen von Bedeutung sind. Wie entwickelte sich die Bedeutung eines Ortes im Lauf der Zeit? Zwischen welchen Städten bestand ein Austausch von Wissen? Wo waren die Hotspots bestimmter Berufsgruppen oder Regionen? Der Vortrag beschreibt einen anpassungsfähigen Workflow zur Extraktion und Analyse solcher impliziter Beziehungen und beleuchtet die Mehrwerte einer Netzwerkperspektive auf die Daten am Beispiel des Wissenstransfers zwischen Städten.


15:00 - 15:15

Abschluss

KIM Workshop 2021 - Wrap-Up

Tracy Arndt (DNB) Alex Jahnke (SUB Göttingen)

15:15 - 16:00Öffentliche Sitzung der DIN-AG KIM




  • Keine Stichwörter