Page tree

Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.
Comment: kleiner rechtschreibfehler

Etherpad: http://primarypad.com/dinikim

Arbeitstitel: Empfehlungen der DINI AG KIM für die Öffnung bibliothekarischer Daten

Präambel / Einleitung

Der Umgang mit Daten gehört zum alltäglichen Geschäft von Bibliotheken und anderen Informationseinrichtungen. Bibliothekarische Einrichtungen v.1.0 veröffentlicht am 31. Oktober 2011

1. Präambel

Bibliotheken und andere Informationseinrichtungen arbeiten täglich in vielfältiger Weise mit Daten unterschiedlicher Verwendungszwecke und Bestimmung. Sie agieren als Datenproduzenten, als Datenlieferanten, Datennutzer und als DatennutzerAggregatoren. Um den größtmöglichen Nutzen dieser der durch öffentliche Einrichtungen produzierten Daten zu gewährleisten, ist es geboten, sie offen im Internet zu publizieren.

Definitionen

"Offen"

"Offen" im Sinne dieser Empfehlungen umfasst drei Aspekte:

  1. offenen Zugang zu den Daten, d.h. Daten müssen offen als Gesamtheit im Web zugänglich sein
  2. offene Standards, d.h. die Daten sollten in einem offen dokumentierten und nicht-proprietären Format vorliegen
  3. offene Lizenzen, d.h. die Daten sollten (als Einzeldatum und als Sammlung) unter einer offenen Lizenz im Sinne der Open Definition publiziert werden.

"Bibliothekarische Daten"

2. Gegenstand

In Informationseinrichtungen werden verschiedene Formen von Daten produziert, die Gegenstand einer Datenfreigabe sein können. Es ist zu betonen, dass eine Datenfreigabe nur durchgeführt werden kann unter der Voraussetzung, dass

  1. es sich bei den jeweiligen Daten nicht um personenbezogene oder anderweitig sensible Daten handelnhandelt,
  2. die jeweilige Einrichtung im Besitz der Datenbankrechte bzw. ggf. der Urheberrechte ist, um die die Daten freizugeben.

Die von Unter bibliothekarischen Einrichtungen produzierten Daten können unterschieden werden in (1) bibliographische Daten im weiteren Sinne und (2) administrative Daten.

Bibliographische Daten

Im Anschluss an die Daten zu verstehen sind sowohl bibliographische Daten gemäß den "Prinzipien zu offenen bibliographischen Daten werden bibliographische Daten wie folgt definiert:

  • Bibliographische Kerndaten sind bibliographische Beschreibungen zum Zwecke (1) der Identifikation der beschriebenen Ressource, d.h. des Zeigens auf eine bestimmte Ressource in der Gesamtheit aller bibliographischer Ressourcen und (2) der Lokalisierung der beschriebenen Ressource, d.h. eines Hinweises, wo die beschriebene Ressource aufzufinden ist.
  • Zu den sekundären bibliographische Daten zählen insbesondere Daten, die sich in Bibliothekskatalogen befinden und über die rudimentäre Beschreibung einer bibliographischen Ressource hinausgehen, wie z.B. Nicht-Web-Identifikatoren (ISBN, LCCN, OCLC etc.), Angaben zum Urheberrechtsstatus, administrative Daten und kontrollierte Vokabulare (Thesauri, Klassifikationen).

Administrative Daten

" als auch darüber hinausgehende Daten, die in Ausübung bibliothekarischer Tätigkeit erstellt werden.

Zur Verwaltung der Dienstleistungen einer Bibliothek fällt eine Menge weiterer fallen zudem weitere Daten an, die - insofern es sich um nicht personenbezogene oder anderweitig sensible Daten handelt - ebenfalls freigegeben werden können. Zu diesen Daten zählen beispielsweise : Exemplardaten, Erwerbungsdaten, anonymisierte Ausleihdaten, statistische Daten.

...

3. Prinzipien

Die DINI-AG KIM (oder wer?) empfiehlt bibliothekarischen Einrichtungen im deutschsprachigen Raum und der gesamten Welt die Freigabe bibliothekarischer Daten unter Einhaltung der folgenden Prinzipien:

  1. Zugriff über Webserver
  2. Offene Lizenzen im Sinne der Open Definition
  3. Offene Standards
  4. Zugriff auf die Gesamtheit der Daten: APIs sind nicht genug.
  5. Rohdaten
  6. Aktualität
  7. Strukturiert
  8. Nicht-diskriminierend: JedeR hat Zugriff, keine Anmeldung erforderlich.

. Folgende Prinzipien sind dabei zwingend einzuhalten:

  • Offener Zugang zu den Daten, d.h. die Daten müssen offen und kostenlos als Gesamtheit im Web zugänglich sein.
  • Offene Standards, d.h. die Daten müssen in einem offen dokumentierten und nicht-proprietären Format vorliegen. Es sind Webstandards zu bevorzugen, die von einer möglichst breiten Anwenderbasis verstanden werden.
  • Offene Lizenzen, d.h. die Daten müssen (als Einzeldatum und als Sammlung) unter einer offenen Lizenz im Sinne der Open Definition publiziert werden. Dabei empfielt die DINI-AG KIM die Verwendung eines Public-Domain-Waivers wie der CC0 Public Domain Dedication oder der Public Domain Dedication and License (PDDL) um die bestmögliche rechtliche Interoperablität der Daten zu garantieren.

Darüber hinaus empfehlen wir die Berücksichtigung folgender Prinzipien:

  • Dokumentation: Eine strukturierte Beschreibung der Daten soll veröffentlicht werden. Bestenfalls sollen die Daten in einem zentralen Verzeichnis (wie z.B. thedatahub.org) nachgewiesen werden.
  • Rohdaten: Die Daten sollen möglichst so zugänglich gemacht werden, wie sie im Informationskreislauf der Bibliotheken anfallen. Jede weitere Filterung oder Aufbereitung wird auf diejenigen verlagert, die von den Informationen später Gebrauch machen.
  • Aktualität: Daten sollen innerhalb eines angemessenen Zeitraums nach ihrer Erstellung oder Änderung veröffentlicht werden. Was angemessen ist, kann je nach Art der Daten variieren.
  • Strukturiert: Die Daten sollen in einem strukturierten Format publiziert werden, das einfache maschinelle Verarbeitung ermöglicht.
  • Nicht-diskriminierend: Der Zugriff auf die Daten soll für alle möglich sein, einzige akzeptable Hürde ist der Zugang zum Internet. Das heißt, dass keine Registrierung erforderlich sein soll.
  • Nachhaltigkeit: Die Bereitstellung der Daten soll mit der Entwicklung eines Nachhaltigkeitskonzepts verbunden sein, das eine dauerhafte Archivierung und den Zugriff auf ältere Versionen der Daten sicherstellt.

Selten wird die Einhaltung sämtlicher Prinzipien von Anfang an gewährleistet sein, allerdings werden die Prinzipien 1 und 2 als notwendige Basis für alle weiteren Entwicklungen angesehen. Allerdings sind die ersten drei Prinzipien notwendige Bedingungen, um überhaupt von offenen bibliothekarischen Daten zu sprechen. Es wird ausdrücklich empfohlen, zunächst auch Rohdaten zu veröffentlichen, die womöglich nicht in einem öffentlich dokumentierten Format vorliegen und/oder nicht strukturiert oder regelmäßig aktualisiert werden.

Relevante Materialien

...

Gegenstand der Empfehlungen

Wir müssen auf jeden Fall klarmachen worüber wir reden:

  • Daten in lokalen Bibliothekskatalogen, in regionalen Verbundkatalogen und in nationalen Verbundkatalogen (Zeitschriftendatenbank, Sigelverzeichnis, GND)
  • Titeldaten, Normdaten, Klassifikationen, Thesauri
  • Ich (AP) denke, wir sollten auch Zirkulationsdaten, Erwerbungsdaten und andere für den Bestandsaufbau relevante statistische Daten mit einbeziehen. (Das könnte ein Alleinstellungsmerkmal der KIM-DINI-Empfehlungen im Vergleich zu bereits existierenden Prinzipien werden.)

Gliederung

Mittelfristig soll aber an der Einhaltung sämtlicher Prinzipien gearbeitet werden.

4. Verwandte Materialien

Entstanden im Rahmen der Gruppe Lizenzen der DINI-AG KIM.
Beitragende: Patrick Danowski, Kai Eckert, Christian Hauschke, Adrian Pohl und andere

Der Text dieser Empfehlungen ist unter der Creative Commons Lizenz CC0 veröffentlicht. Er ist somit gemeinfrei, d.h. er gehört allen und darf zu beliebigen Zwecken und ohne Auflagen genutzt werden. Bei Nachnutzung wird die Nennung der Quelle erbeten.