Sie zeigen eine alte Version dieser Seite an. Zeigen Sie die aktuelle Version an.

Unterschiede anzeigen Seitenhistorie anzeigen

« Vorherige Version anzeigen Version 14 Nächste Version anzeigen »

Introduction

Two worlds meet.

1) Integrated Authority File (GND) as other Authority Control systems were born in the librarian realm. In order to make them even more accessible and collaborative new infrastructure is needed.

2) Wikidata was created to support Wikipedia with structured data and Wikibase is the infrastructure of Wikidata.

In this working group, we debate whether Wikibase is suitable for the needs of existing authority files coming from libraries.

@ Kontakt

Your feed back is welcome! If you like to participate

please get in touch: #wikibase afs@dnb.de  

Barbara K Fischer, Deutsche Nationalbibliothek, AfS

Jens Ohlig, Wikimedia Deutschland e.V.

credit image: Wikimedia Deutschland CC BY SA

complete record: Das vorliegende Werk ist eine Bearbeitung der Werke „Books HD“ von Abhi Sharma, lizenziert unter  CC BY 2.0 und "Gravis UltraSound PnP Pro V1.0" von TMg, lizenziert unter CC BY-SA 2.0 DE, bearbeitet in Hinblick auf Überblenden der beiden Werke sowie anschließende Farbanpassung durch Matthias Wörle, lizenziert unter CC BY-SA 4.0.

Kann man Normdaten wikifizieren?

Wikibase wurde für die Gemeinsame Normdatei (GND) evaluiert

Wikimedia Deutschland e.V. und die Deutsche Nationalbibliothek (DNB) haben gemeinsam in den vergangenen Monaten die Eignung von Wikibase als Software für die Gemeinsame Normdatei (GND) evaluiert. Der proof of concept untersucht, ob Wikibase – die Software hinter Wikidata – die Zusammenarbeit mit Bibliotheken sowie diversen Communities vereinfachen würde. Barbara Fischer, liaison counsel an der Arbeitsstelle für Standardisierung (AfS) der Deutschen Nationalbibliothek und Jens Ohlig von Wikimedia Deutschland e.V. stellen  im Gespräch die Ergebnisse vor.


Jens Ohlig: Mit der digitalen Transformation wächst der Bedarf in wissenschaftlichen Forschungseinrichtungen, Museen und Archiven nach einer verbesserten Auffindbarkeit digitaler Kulturdaten im Netz. Lange nutzten nur Bibliotheken die Gemeinsame Normdatei (GND). In Bibliothekskatalogen werden primär Normdaten verwendet um z. B. Autoren, Publikationsorte oder Sachthemen eindeutig zu kennzeichnen. Das erleichtert die Erfassung neuer Medien, hilft aber auch unterschiedliche Medien miteinander über Normdaten als gemeinsame Knotenpunkte zu verknüpfen. 


Barbara Fischer: Im Zuge des digitalen Wandels steigt der Bedarf nach verlässlichen und interoperablen Normdaten. Die ursprünglich für Bibliotheken konzipierte GND weckt das Interesse der anderen Kulturgut bewahrenden Institutionen. Man möchte nicht nur die GND-Identifikatoren nutzen, sondern bei Bedarf neue GND-Datensätze anlegen und pflegen können, die Bezug nehmen auf museale Objekte, Archivalien und Forschungsdaten. Das DFG-geförderte Projekt GND für Kulturdaten (GND4C) verdeutlicht diesen Bedarf. Zugängliche Software und eine technisch überzeugende Plattform hilft, Regeln und Ausnahmen zur Modellierung festzulegen sowie,  relevante Eigenschaften und Relationen zu reflektieren, diskutieren und dokumentieren. Im Kontext von Linked Open Data wird Verlässlichkeit der Daten immer stärker an die Transparenz und Nachvollziehbarkeit ihrer Referenzierung geknüpft. Und das für jede einzelne Aussage. Zudem macht das Internet vor Sprachgrenzen nicht halt. Deshalb ist die Multilingualität der Benennungen erwünscht. . Wikidata erfüllt alle diese Kriterien und ist doch keine Normdatei. Jedoch basiert Wikidata auf der von Wikimedia Deutschland entwickelten Software Wikibase. In einem gemeinsamen Kooperationsprojekt mit Wikimedia Deutschland hat die Deutsche Nationalbibliothek daher die Leistungsfähigkeit von Wikibase für die GND untersucht und nach folgenden Kriterien getestet:


  • Wie könnte eine modulare GND "2.0" in Wikibase aussehen, die den Anforderungen der verschiedenen Sparten gerecht wird?

  • Wie lassen sich effektiv und überschaubar die Regeln zu den modellierten Eigenschaften der Entitätstypen abbilden?

  • Wie lässt sich eine stabile Synchronisierung zwischen einer GND-Wikibase-Instanz zur CBS-basierten Master-Instanz umsetzen?

Die Ergebnisse sind ermutigend. Wikibase ist eine  Brücke in die Welt der offenen, kooperativ und interdisziplinär erstellten Normdaten. Der proof of concept zeigt, dass diese Brücke tragfähig ist.

Could you wikify an authority file?

Wikibase has been evaluated for the Integrated Authority File (GND)

Wikimedia Deutschland e.V. and the German National Library (DNB) have jointly evaluated the suitability of Wikibase as software for the Integrated Authority File  (GND) in recent months. The proof of concept examines whether Wikibase – the software behind Wikidata – would simplify collaboration with libraries and various communities. Barbara Fischer, liaison counsel at the Office for Library Standards (AfS) der Deutschen Nationalbibliothek and Jens Ohlig of Wikimedia Deutschland e.V. present the results in a discussion:


Jens Ohlig: With the digital transformation, there is a growing need in scientific research institutions, museums and archives for improved retrieval of digital cultural data on the Internet. For a long time, only libraries used the Integrated Authority File , or German “Gemeinsame Normdatei” (GND). In library catalogues, authority control data are primarily used to unambiguously identify items such as authors, publication locations or subject areas. This facilitates the entry of new media, but also helps to link different media with each other via standardized data as common nodes.

Barbara Fischer: In the course of digital change, the demand for reliable and interoperable standardized data is increasing. The GND, originally designed for libraries, sparks the interest of other institutions that preserve cultural heritage. They want to be able to use not only the GND identifiers. But they also want to create and maintain new GND data sets, if necessary, which refer to museum objects, archival documents and research data. The DFG-funded project GND for Cultural Data (GND4C) illustrates this need. Accessible software and a technically convincing platform might help to define rules and exceptions for modelling and to reflect, discuss and document relevant properties and relations. 

In the context of Linked Open Data, data reliability is increasingly the connector to the transparency and traceability of its provenance. And this is requiredto be done for each individual statement. Moreover, the Internet does not stop at language borders. Therefore, the multilingualism of the terms is desirable. Wikidata meets all these criteria and yet is not an authority file. However, Wikidata is based on the software Wikibase developed by Wikimedia Deutschland. In a joint cooperation project with Wikimedia Deutschland, the German National Library has investigated the performance of Wikibase for the GND and tested it according to the following criteria:

  • How would a modular “GND 2.0" look like in Wikibase that meets the requirements of the different sectors?

  • How can the rules for the modeled properties of the entity types be mapped effectively and clearly?

  • How can a stable synchronization between a GND Wikibase instance and the CBS-based master instance be implemented?

The results are encouraging. Wikibase is a bridge to the world of open, cooperative and interdisciplinary authority control data. The proof of concept shows that this bridge is viable.

Was hat uns überzeugt?

Jens Ohlig: Wikimedia und die Deutsche Nationalbibliothek sind zwei Institutionen, die auf unterschiedliche Weise Wissen zur Verfügung stellen. Bibliotheken sind nicht nur starke Verbündete in Sachen Freies Wissen, sondern in gewisser Weise die älteren, institutionellen Wahlverwandten von Wikimedia. Die GND-IDs sind mit den Q-Nummern von Wikidata durchaus zu vergleichen. Viel Überzeugungsarbeit war da für das Projekt nicht mehr nötig. Hinzu kommt, dass die Deutsche Nationalbibliothek und die GND als Leuchtturm quasi über das gesamte Feld der Bibliotheksmetadaten strahlt – daher weckte die  Evaluation auch international Interesse an Wikibase. Auf einem Treffen von Nationalbibliotheken in Stockholm im Sommer 2019 war das Interesse an Wikibase deutlich zu sehen: denn ohne eine Strategie zu Linked Open Data und Wikibase geht es heutzutage nicht mehr.

Barbara Fischer: Aus der Perspektive der Deutschen Nationalbibliothek hat die Leichtigkeit überzeugt, mit der wir Instanzen anlegen und modellieren konnten. Wir brauchten in unserem gemischten Team aus Softwareentwickler*innen und Bibliothekar*innen keine langwierigen Schulungen, um mit der Software arbeiten zu können. Die Instanzen liefen einmal eingerichtet stabil und waren auch leicht zu klonen. Für uns als Betreiber einer Normdatei ist es wichtig, die Verlässlichkeit der Daten unter anderem über die Transparenz ihrer Herkunft herzustellen. Daher gefällt uns, dass es sich jederzeit und für jede Aussage zu einer Entität  nachverfolgen lässt, wer etwas verändert hat, und was verändert wurde. Ganz wie man es auch von Wikipedia kennt. 

What convinced us?

Jens Ohlig: Wikimedia and the German National Library are two institutions that make knowledge available in different ways. Libraries are not only strong allies in terms of Free Knowledge, but in a way they are the older, institutional congenial relatives of Wikimedia. The GND-IDs are quite comparable to the Q-numbers of Wikidata. Much more of persuasion was not needed to start the project. In addition, the German National Library and the GND as a lighthouse shines virtually across the entire field of library metadata - therefore the evaluation also aroused international interest in Wikibase. At a meeting of national libraries in Stockholm last summer, the interest in Wikibase was obvious: because without a strategy for Linked Open Data and Wikibase, it will no longer work.

Barbara Fischer: From the perspective of the German National Library, the ease with which we could create and model instances was convincing. In our mixed team of software developers* and librarians* we didn't need any lengthy training to be able to work with the software. Once set up, the instances were stable and easy to clone. For us, as operators of authority files, it is important to ensure the reliability of the data, among other things, through the transparency of its provenance. That's why we like the fact that it can be traced at any time and for any statement on an entity, who changed something and what was changed. Just like you know it from Wikipedia.

Was hat uns überrascht?

Jens Ohlig: Wikibase ist als Software für Wikidata entstanden, um Datenbestände zu ordnen und zu verknüpfen. Die damit abbildbaren Datenmodelle sind nicht explizit auf Bibliotheken und ihre speziellen Bedürfnisse ausgerichtet: Wikibase ist keine Bibliothekssoftware. Trotzdem passt das flexible Datenmodell sehr gut zur GND, alle Beziehungen und Eigenschaften lassen sich hier abbilden und ausdrücken. Sowohl die Genauigkeit der Evaluation - zum Beispiel wurde genau gemessen, wie lange der Import von Daten dauerte -  als auch das Ergebnis, nach dem Wikibase den Anforderungen entspricht, waren für Wikimedia eine positive Überraschung. Dass Wikibase als Software-Paket für Linked Open Data “out of the box” für eine Institution wie die Deutsche Nationalbibliothek und das Projekt GND so passgenau ist, war überraschend. 

Barbara Fischer: Wir von der Deutschen Nationalbibliothek hatten uns vieles leichter vorgestellt. Gerade weil Wikidata selbst ja eine sehr mächtige Datenbank ist, hätten wir gedacht, dass der Import von größeren Datenmengen bereits zu den Standardumsetzungen gehört. Vielleicht war es unsere Perspektive als Kulturinstitution und unsere mangelnde Erfahrung mit einer  offenen Anwendung wie Wikibase mit ihrer engen Verflechtung mit der Mediawiki-Software zunächst ungewöhnlich erschien. Eine so enge, auch im Code eingeschriebene Verbindung ist für die Wikipedia und viele anderen Wikis normal, doch unerwartet wenn man mit einer Datenbanksoftware rechnet. Die Entwicklung ist sehr unmittelbar von einer freiwilligen Community getrieben, was  auch erklärt , warum nach wie vor viele der attraktiven Ergänzungen Wikidata-affin sind und für eine generische Nachnutzung durch alle Wikibase-Anwenderinnen und Anwender erst adaptiert werden müssten. Aber im Großen und Ganzen bietet Wikibase ein für uns nutzbares Arbeitsambiente. 

Wirklich positiv überrascht hat uns das Potenzial einer offenen GND - einer GND 2.0 - in bezug auf die Möglichkeit, das ganze Beziehungsgeflecht der Eigenschaften und Beziehungen, sowie wie diese definiert sind, abbilden zu können. Die Regelwerke, die notwendig sind, um tatsächlich verbindliche und verlässliche Normdaten kreieren zu können, lassen sich in eine Wikibase Instanz übertragen. Nach unseren bisherigen Tests glauben wir, dass wir damit die in Wikibase modellierten Regelwerke nutzen könnten, um intelligente und sich dynamisch anpassende Eingabemasken steuern zu können. Das verspricht, die Zusammenarbeit mit Nicht-Bibliothekar*innen erheblich zu vereinfachen. Die Zukunft wird zeigen, ob sich dieses Versprechen einlösen lässt.

What surprised us?

Jens OhligWikibase was created as software for Wikidata to organize and link data stocks. The data models that can be mapped with it are not explicitly geared towards libraries and their special needs. Wikibase is not library software in the first place. Nevertheless, the flexible data model fits very well with GND, all relationships and properties can be mapped and expressed here. Both the accuracy of the evaluation – for example, the time taken to import data was measured exactly – and the result that Wikibase meets the requirements were a positive surprise for Wikimedia. It was surprising that Wikibase, as a software package for Linked Open Data, is so nicely suited "out of the box" for an institution like the German National Library and the GND project.

Barbara FischerWe at the German National Library had imagined many things to be easier. Precisely because Wikidata itself is a very powerful database, we would have thought that importing large amounts of data was already part of the standard implementation. Perhaps it was our perspective as a cultural institution and our lack of experience with an open application such as Wikibase with its close integration with the Mediawiki software that initially seemed unusual. Such a close connection, also inscribed in the code, is normal for Wikipedia and many other wikis, but it is unexpected when one reckons with database software. The development is directly driven by a voluntary community, which also explains why many of the attractive additions are still Wikidata-affine and would first have to be adapted for generic re-use by all Wikibase users. But on the whole, Wikibase offers a useful working environment for us.

We were really surprised positively by the potential of an open GND - a GND 2.0 - with regard to the possibility of being able to map the entire network of properties and relationships, as well as how these are defined. The sets of rules that are necessary to create truly binding and reliable authority control data can be transferred to a Wikibase instance. Based on our tests so far, we believe that we could use the rule sets modeled in Wikibase to control intelligent and dynamically adapting input masks. This promises to greatly simplify collaboration with non-librarians. The future will show whether this promise can be kept.

Und was bringt die Zukunft?

Barbara Fischer: Da die GND eingebunden ist in ein ganzes System von Diensten für den nationalen Bibliothekssektor, werden wir die Normdatenbank auch in dem bisherigen System fortführen. Aber wir möchten mit einer vollständigen GND-Wikibase-Instanz den Normdaten ein zweites Zuhause geben und Außenposten für Erweiterungen einrichten, die in der bisherigen Umgebung nur schwer umzusetzen sind. Wir wollen mit Wikibase einen erweiterten Zugang zur GND schaffen für Interessengruppen, für die die bibliothekarischen Redaktionsoberflächen nicht geeignet sind. 

Die nächsten Schritte sind daher der vollständige Import der circa acht Millionen GND-Einträge, die Modellierung der Eigenschaften gemäß des GND-Datenmodells, die Dokumentation der Regeln, nach denen die Entitäten erfasst werden und schließlich eine belastbare Synchronisierung der Wikibase-Instanz mit dem “Master” im traditionellen CBS-System.

Jens Ohlig: Da liegt noch ein ganzes Stück Arbeit vor uns. Wikibase ist ein Speicher für strukturierte Daten. Vieles, was Bibliothekar*innen bei der täglichen Arbeit benötigen, fehlt noch: von der Konvertierung von Standardformaten wie die bibliographischen Datenformate MARC21 oder PICA+ hin zu spezialisierten Interfaces zur Dateneingabe in intelligenten Formularen.  All dies muss jetzt entwickelt und an die Software angepasst werden. 

Im Verlauf des Jahres 2020 liegt jetzt die konkrete Planung für den Einsatz von Wikibase bei der GND vor uns. Die Partnerschaft von Wikimedia und der Deutschen Nationalbibliothek hat sich bewährt. Zusammen wollen wir eine Wikibase-basierte GND weiterentwickeln und zum Einsatz bringen. Mit der GND auf der Grundlage von Wikibase wächst im Ökosystem der freien verlinkten Daten eine starke Grundlage heran, die das Interesse von vielen anderen Institutionen weckt: z. B. die französische Nationalbibliothek Bibliothèque Nationale de France (BNF) und der Hochschulbibliotheksverbund ABES in Frankreich arbeiten bereits an ihrem eigenen Prototypen mit Wikibase. Grund genug für die Deutsche Nationalbibliothek und Wikimedia mit der BNF und ABES in den kommenden Wochen den Austausch bei einem gemeinsamen Treffen in Paris zu suchen. Wir sind zuversichtlich, dass Wikibase nicht nur eine Heimstatt für Normdaten werden kann, sondern dass diese sich mit der Zeit im Sinne eines Linked-Open-Data-Ökosystems wikifizieren.

And what bears the future?

Barbara Fischer: Since the GND is integrated into a whole system of services for the national library sector, we will continue the authority file in the current system. But with a complete GND Wikibase instance, we want to give the GND a second home and set up outposts for extensions that are difficult to implement in the current environment. With Wikibase we want to create an extended access to the GND for interest groups for whom the librarian editorial interfaces are not suitable.

The next steps are therefore the complete import of the approximately eight million GND entities, the modeling of the properties according to the GND data model, the documentation of the rules according to which the entities are captured and finally a resilient synchronization of the Wikibase instance with the "master" in the traditional CBS system.

 

Jens OhligThere is still a lot of work ahead of us. Wikibase is a storage for structured data. Much of what librarians need in their daily work is still missing: from the conversion of standard formats like the bibliographic data formats MARC21 or PICA+ to specialized interfaces for data entry in intelligent forms. All this must now be developed and adapted to the software.

In the course of the year 2020, concrete plans for the use of Wikibase at GND are now before us. The partnership between Wikimedia and the German National Library has proven successful. Together we want to further develop a Wikibase-based GND and put it into use. With the GND based on Wikibase, a strong foundation is growing in the ecosystem of free linked data, which is attracting the interest of many other institutions. For example, the French national library Bibliothèque Nationale de France (BNF) and the university library association ABES in France are already working on their own prototype with Wikibase. Reason enough for the Deutsche Nationalbibliothek and Wikimedia with the BNF and ABES to seek an exchange at a joint meeting in Paris in the coming weeks. We are confident that Wikibase will not only become a home for authority files, but that it will evolve over time into a linked open data ecosystem.

How it started: blog post: GND meets Wikibase 1

"Es geht um das Ordnen von Dingen in der Welt" Jens Ohlig über strukturierte Daten.

wordcloud based on this article in German empowered by https://www.wortwolken.com/  under CC BY SA

Eine Bundesbehörde geht auf Expedition im Wikiversum

Ein neues Testfeld für Wikibase

Ein Gemeinschaftswerk von Ohlig, Jens (WMDE) und Fischer, Barbara (DNB)

A federal agency goes on an expedition in the Wikiverse

A new testing ground for Wikibase

Co-authors: Jens Ohlig (WMDE) and Barbara K. Fischer (DNB)

Die Deutsche Nationalbibliothek und Wikimedia Deutschland e.V. gehen zusammen neue Wege. Jahrelang haben Freiwillige der Wikipedia geholfen, Einträge der deutschen Nationalbibliographie mit Wikipedia-Einträgen zu verknüpfen und dabei auch Fehler korrigiert. Jetzt haben die beiden Einrichtungen vereinbart, gemeinsam die Potenziale von Wikibase, der Software mit der die freie Datenbank Wikidata betrieben wird, für den Einsatz in der größten Normdatenbank für Kulturdaten im deutschsprachigen Raum, der Gemeinsamen Normdatei (GND), intensiv zu testen. Die Bedeutung des Evaluationsvorhabens für die Welt der offenen Daten, den GLAM-Bereich und Bibliotheken insbesondere wollen wir hier beschreiben.

The German National Library and Wikimedia Deutschland are breaking new ground together. For years, Wikipedia volunteers have helped to link entries of the German national bibliography with Wikipedia entries and to correct mistakes. The two institutions have now agreed to jointly test the potential of Wikibase, the software used to run the free database Wikidata, for use in the largest authority file for cultural data in German-speaking countries, the Integrated Authority File (Gemeinsame Normdatei, GND). The significance of the evaluation project for the world of open data, the GLAM area and libraries, in particular, is described here.

Laut Statistik verbringt der Mensch in Deutschland 196 Minuten täglich im Netz. Tendenz steigend. Die meisten von uns sind dort auf der Suche. Wir suchen Konsumangebote, Medien, Informationen oder schlichtweg Daten. Immer mehr Daten sind im Netz. Im Alltag verlassen wir uns auf die Algorithmen von Suchmaschinen. Doch für tiefergehende Recherchen in der Wissenschaft oder für solche von den Kundenwünschen der Suchmaschinenbetreiber unabhängigere braucht es alternative Angebote. Hier kommen kodifizierte Daten in den Fokus. Der Bedarf an der sicheren Identifikation von Objekten, Personen, Ereignissen und Orten im Netz steigt mit der Anzahl der Suchanfragen und der Menge der im Netz befindlichen Daten. Wikidata ist eine Antwort auf diesen Bedarf. Eine andere Antwort liegt in dem über die Fachgrenzen der deutschsprachigen Bibliotheken hinausgehenden Interesse an den Normdaten der Deutschen Nationalbibliothek, der GND. Normdaten, wie die von Wikidata und der GND, unterstützen den Prozess von Linked Data und den Aufbau eines semantischen Webs, das Dinge nach ihrer Bedeutung sinnvoll miteinander verknüpft.

According to statistics, people in Germany spend 196 minutes a day on the Internet. And rising. Most of us search the internet; we are looking for consumer offers, media, information or simply data. More and more data is on the net. In everyday life, we rely on the algorithms of search engines. But for more in-depth research in science or for those more independent of the customer wishes of search engine operators, alternative offers are needed. This is where codified data comes into focus. The need for the precise identification of objects, persons, events and locations online increases with the number of search queries and the amount of data. Wikidata is an answer to this need. Another answer lies in the interest in the standards of the German authority file, the GND, which goes beyond the subject boundaries of German-language libraries. Authority Control, as practised by Wikidata and GND, support the process of linked data and the construction of a semantic web that links items according to their meaning.


Was sind Normdaten und wozu braucht man sie?

What is Authority Control and why do you need it?

Normdaten belegen eine Benennung, einen Namen für ein Objekt zweifelsfrei mit einer Codenummer und bieten mittels einem dauerhaften Internetlink einen verlässlichen Knotenpunkt im Netz an. In der Regel wird zur Herstellung der Unverwechselbarkeit noch mindestens eine Eigenschaft des Objektes verknüpft. Im Fall einer Person treten zu ihrem Namen meist die Lebensdaten hinzu. Bei Orten die Geo-Koordinaten. Bei Ereignissen deren zeitliche Dauer. Ob noch weitere Eigenschaften und Beziehungen dieser zu anderen Normdatensätzen erfasst werden, hängt letztlich von dem zugrundeliegenden Datenmodell ab. Im Fall von Wikidata, des Freiwilligenprojekts zur strukturierten und maschinenlesbaren Beschreibung der Welt, ist die Liste der Eigenschaften und Relationen eines Datenobjektes im Prinzip unendlich. Die Gemeinschaft der Beitragenden der GND pflegt ein deutlich engeres Regelwerk und Verständnis von Normdaten.

Authority files dedicate a name or label for an object to an identifying code number and offer a reliable node in the network by means of a permanent Internet link. As a rule, at least one property of the object is linked in order to achieve disambiguation. In the case of a person, biographic dates are usually added to their name. For locations, the geo-coordinates. In the case of events, their duration. Whether other properties and relationships of these to other authority files are recorded depends ultimately on the underlying data model. In the case of Wikidata, the volunteer project for the structured and machine-readable description of the world, the list of properties and relations of a data object is basically infinite. The community of GND contributors maintains a much tighter set of rules and understanding of authority control.


Normdatensysteme unterliegen wie alle Artefakte, die über einen längeren Zeitraum von einer Gruppe von Menschen erstellt werden, den Gesetzmäßigkeiten von sozialen Systemen. Zur Sicherung der Qualität, zur Vereinfachung von Entscheidungs- und Arbeitsprozessen und zur Abgrenzung gegenüber anderen Systemen bilden sie oft mit der Zeit komplexer werdende Konventionen und Regelwerke aus. Dies passiert in Wikidata genauso wie in der GND trotz der grundverschiedenen Rahmenbedingungen. Zusätzlich zu den Regeln treten Bedingungen, die durch die jeweilige technischen Voraussetzungen gesetzt werden. Datenbanken werden in ihrer Funktionsweise durch die ihnen zugrunde liegende Software definiert. Die Kommunikation zwischen zwei verschiedenen Datenbanken, die zudem unterschiedliche Software verwenden, ist schwierig. Der Datenaustausch, ob im Kleinen oder im Großen kann nicht automatisch erfolgen. Die Verknüpfung und Föderation von Daten, die gemeinschaftliche Pflege von Daten über die Systemgrenzen hinaus ist zwar nicht gänzlich unmöglich, aber doch schwerfällig und mühselig.

Like all artefacts created over a longer period of time by a group of people, authority controls are subject to the laws of social systems. In order to ensure quality, to simplify decision-making and work processes and to set them apart from other systems, they often develop increasingly complex conventions and rules over time. This happens in Wikidata as well as in the GND despite the fundamentally different framework conditions. In addition to the rules, there are conditions that are set by the respective technical prerequisites. Databases are defined in their functionality by the underlying software. Communication between two different databases, which also use different software, is difficult. Data exchange, whether small or large, cannot take place automatically. The linking and federation of data, the joint maintenance of data across system boundaries is not entirely impossible, but it is cumbersome.


Die Deutsche Nationalbibliothek und Wikimedia Deutschland e. V. möchten beide auch unabhängig voneinander das Semantic Web mittels Linked-Data-Angeboten fördern. Daher versuchen sie bereits seit geraumer Zeit ihre jeweiligen Rahmenbedingungen dergestalt zu verändern, dass die Öffnung des jeweiligen Systems für weitere Beitragende attraktiver wird. Und unabhängig voneinander haben sie die Erfahrung gemacht, dass es nicht reicht, eine Tür zu öffnen. Jetzt schlagen sie eine Brücke, um gemeinsam ihre Ziele zu erreichen.

The German National Library and Wikimedia Deutschland e. V. each want to promote the Semantic Web by means of Linked Data projects. Therefore, we have been trying for some time to change our respective frameworks in such a way that the opening of the respective system becomes more attractive for further contributors. And independently of each other, we have experienced that it is not enough to open a door. Now we are building a bridge to achieve our goals together.

Was wir wollen und wie wir vorgehen

What we want and how we will proceed

Zusammen bauen wir eine Testlandschaft von mehreren Normdatenbanken als Wikibase-Instanzen auf. Das heißt, das Team der Deutschen Nationalbibliothek legt in der Software Wikibase Strukturen an, um möglichst vollumfänglich die GND aus unterschiedlichen Perspektiven dort abbilden zu können. Die erste Datenbank bildet die GND ab, wie sie heute von Bibliotheken eingesetzt und bearbeitet wird. Ein zweite Datenbank modelliert die GND erweitert um die zusätzlichen Bedarfe aus den kulturbewahrenden Institutionen, wie Museen und Archiven. Und schließlich die dritte Datenbank, Factgrid, legt auf der Grundlage von GND-Datensätzen eine Forschungsdatenbank für historische Personen und Körperschaften an, die keine eigentliche Normdatenbank mehr sein wird. Sie alle benutzen die Software Wikibase und die GND-Entitäten. In dieser Testlandschaft werden wir die Leistungsfähigkeit und Nutzerfreundlichkeit von Wikibase testen und evaluieren. Wir wollen wissen, wie leicht sich Daten zwischen den Instanzen synchronisieren lassen. Welche Möglichkeiten der Föderation aus Wikidata lassen sich auf die GND-Wikibase Instanzen übertragen? Vereinfacht Wikibase technisch die Zusammenarbeit über institutionelle Grenzen hinweg? Kann Wikibase über die Rollenmodelle von Wikidata, die Verlässlichkeit von bibliothekarischen Normdaten durch ein komplexes Rechtehandling gewährleisten? Wie steht es mit dem Nachnutzungspotenzial vieler praktischer Anwendertools, die für Wikidata entwickelt wurden, für andere Wikibase Instanzen? Wikidata wird zum Beispiel benutzt, um mit Histropedia Zeitleisten zu visualisieren — von ABBA-Alben bis zu Zulu-Königen. Oder Wikidata liefert die Technik hinter Crotos, einem Visualisierungs- und Entdeckungswerkzeug für Kunstwerke. Wenn Wikidata diese Möglichkeiten zum Bau von Anwendertools bietet, weil es die enzyklopädischen Daten zum menschlichen Wissen sammelt, was ist dann erst an spannenden Anwendungen denkbar, die auf spezialisierten Daten eigener Wikibase-Instanzen basieren?

Together we are building a testing ground of several authority files databases as Wikibase instances. This means that the team of the German National Library creates structures in the Wikibase software in order to be able to map the GND as fully as possible from different perspectives. The first database represents the GND as used and processed by libraries today. A second database models the GND extended by the additional needs of cultural institutions such as museums and archives. And finally, the third database, Factgrid, creates a research database for historical persons and corporations on the basis of GND data records, which will no longer be an actual authority file. They all use the Wikibase software and the GND entities. In this testing landscape, we will test and evaluate the performance and usability of Wikibase. We want to know how easy it is to synchronize data between instances. Which possibilities of the federation from Wikidata can be transferred to the GND Wikibase instances? Does Wikibase technically simplify cooperation across institutional boundaries? Can Wikibase guarantee the reliability of library authority control via the role models of Wikidata through complex rights handling? What about the post-use potential of many practical user tools developed for Wikidata for other Wikibase instances? Wikidata is used, for example, to visualize timelines with Histropedia - from ABBA albums to Zulu kings. Or Wikidata provides the technology behind Crotos, a visualization and discovery tool for artworks. If Wikidata offers these possibilities for building user tools because it collects the encyclopedic data on human knowledge, what exciting applications are conceivable based on specialized data from own Wikibase instances?


Im ersten Schritt haben wir jetzt gemeinsam drei Wikibase-Instanzen, also Datenbanken, angelegt und modellieren hier die Eigenschaften und Beziehungen, die in den jeweiligen Instanzen gelten sollen. Gerade hatten wir ein gemeinsames Projekttreffen in Frankfurt, zu dem die Kolleginnen und Kollegen von Wikimedia Deutschland e. V. und der Deutschen Nationalbibliothek gemeinsam Arbeitsprozesse für den Datenimport aus der bestehenden GND in die neuen Strukturen abstimmten. In den kommenden Wochen werden wir sukzessive aus der bestehenden GND ausgewählte Entitätstypen, wie zum Beispiel alle Daten zu Personen und Geografika, in die neuen Instanzen importieren. Dies sollte bis zum Sommer einen Stand erreicht haben, der es uns erlaubt, dann mit weiteren Tests zur Benutzerfreundlichkeit (Usability) und der Synchronisierung zu beginnen.

In the first step, we have now created three Wikibase instances, i.e. databases, and model the properties and relationships that are to apply in the respective instances. We just had a joint project meeting in Frankfurt, where the colleagues from Wikimedia Deutschland e. V. and the German National Library jointly coordinated work processes for importing data from the existing GND into the new structures. In the coming weeks, we will successively import entity types selected from the existing GND, such as all data on persons and geography, into the new instances. This should have reached a level by summer that will allow us to begin further usability and synchronization testing.


Da die GND als Normdatenbank unbedingt verlässlich sein muss, muss sichergestellt sein, dass die Anwender- oder Editorinnen und Editoren die Verantwortung für die Korrektheit der von ihnen eingegebenen Daten dauerhaft übernehmen. Zwar ist es in Wikibase um einiges leichter als in der starren Softwarestruktur des bestehenden Systems, in der die jetzige GND geführt wird,  jeder Aussage einen Beleg zuzuordnen, auch die Provenienz der Daten lässt sich in Wikibase leichter dokumentieren, dennoch muss in der GND dauerhaft sichergestellt sein, dass die Pflege, die Aktualisierung, die Rechtssicherheit der Daten und möglicherweise erforderliche Korrekturen zügig erfolgen. Daher wird die GND auch in Zukunft stets nur für einen geschlossenen unter Vertrag stehenden Anwenderkreis für die Mitwirkung offen sein, auch wenn dieser durch neue Gruppen von Mitwirkenden erweitert wird. Dies ist einer der wesentlichen Unterschiede zu Wikidata, wo alle eingeladen sind mitzumachen und man einerseits erfolgreich auf die Eigenverantwortung der Beitragenden setzt und andererseits die Autorengemeinschaft die Kontrolle über die Qualität der Daten gemeinschaftlich übernimmt.

Since the GND as an authority control must be absolutely reliable, it must be ensured that the users or editors assume permanent responsibility for the correctness of the data they enter. Although it is much easier in Wikibase than in the rigid software structure of the existing system, in which the current GND is maintained, to assign a document to each statement, and the provenance of the data can also be more easily documented in Wikibase, it must nevertheless be ensured in the GND that the maintenance, updating, legal security of the data and any necessary corrections are carried out quickly. For this reason, GND will continue to be open to participation only by a closed group of users under contract, even if this group is expanded by new groups of participants. This is one of the main differences to Wikidata, where everyone is invited to participate and where on the one hand contributors must take on responsibility for the data entered and on the other hand the community of authors takes on overarching control over the quality of the data.


Auch Wikidata kennt unterschiedliche Rollen innerhalb der Community. Jede dieser Rollen ist mit unterschiedlichen Rechten und Verantwortlichkeiten ausgestattet. Von den Benutzerinnen und Benutzern, die Daten eingeben, über die Admins mit erweiterteten Befugnissen bis hin zu speziellen Rechtegruppen wie denjenigen, die neue Eigenschaften anlegen können, entspricht das oft auch den Spezialisierungen und Hierarchien in Bibliotheken — und ist doch an einigen Stellen ganz anders und eher dem Wiki-Prinzip als der Bibliothekswissenschaft verbunden. Eine unserer kommenden Aufgaben wird es sein, zu prüfen, ob die bestehenden Möglichkeiten zur Rollendefinition in Wikibase ausreichen, um den Ansprüchen des Rechtemanagements der GND gerecht zu werden, oder ob und wenn ja, welche Anpassungen der Software erforderlich wären.

Wikidata also knows different roles within the community. Each of these roles has different rights and responsibilities. From the users who enter data to the admins with extended permissions to special permission groups such as those who can create new properties, this often corresponds to the specializations and hierarchies in libraries – and yet in some places, it is quite different and more linked to the wiki principle than to library science. One of our upcoming tasks will be to check whether the existing possibilities for role definition in Wikibase are sufficient to meet the requirements of GND's rights management, or whether and if so, which adaptations of the software would be necessary.


Bis zur WikidataCon Ende Oktober planen wir, einen ersten Evaluationsbericht vorlegen zu können, der für alle die Chancen, Probleme und erste Ideen für Lösungen im Einsatz von Wikibase für die GND aufzeigen wird. Schließlich möchten wir alle die GND leichter für einen größeren Anwenderkreis zugänglich machen und die Nachnutzung der Normdaten für Wikidata sowie die Einbindung der GND in neue Anwendungen so attraktiv wie möglich machen. Wir sind gespannt, in welchem Umfang Wikibase diesen Erwartungen gerecht wird.


Until WikidataCon at the end of October, we plan to present a first evaluation report, which will show the opportunities, challenges and first ideas for solutions in the use of Wikibase for the GND. After all, we all want to make GND more accessible to a larger group of users and make the subsequent use of authority control for Wikidata and the integration of GND into new applications as attractive as possible. We are curious to see to what extent Wikibase will meet these expectations. Follow our updates if you are curious about the results.


Kommentieren Sie bitte diesen Beitrag und teilen Sie Ihre Fragen und Anregungen mit uns.

Please comment on this article and do not hesitate to share your questions and suggestions with us.


 

 

The GND perspective on Wikibase


The aim of the strategical GND work program is to foster cooperation across all fields in arts, culture and scientific data and to reach out to communities such as Wikidata and Wikipedia. To reach the goals many efforts are needed. First of all, finding solutions related to organization and content and secondly a focus on the operational infrastructure and its development. We look for solutions that will support data hosting and maintenance across domains. Collaboration will be the core idea. Therefore, Wikibase appears to be an ideal candidate to enlarge the GND environment. Wikibase could become a second home for GND in order to offer applications for access and contribution to new target groups, that cannot be served by the specific interfaces which are currently offered.

 GND-Entwicklungsprogramm  (strategy)

 

  

The Wikibase perspective on GND


As Wikibase has set itself the goal of achieving reuse of its software beyond the main application Wikidata it aims to empower the spread of open knowledge to further education and culture, just as the Wikimedia Foundation itself.

To use GND as a point of reference could be convenient in many ways to Wikibase:

  • The GND is the Authority File used in German-speaking countries in a growing community beyond libraries
  • The GND is available under the Creative Commons Zero (CC0) license.
  • The GND stands for similar authority file databases in other regions and languages and links to them. Thus a solution that works for GND could become a mold to others and get easily spread.
  • The way the GND is driven today is typical in the world of libraries. It is based on international standards such as RDA, MARC21, SRU, OAI-PMH and is used in all common library systems as OCLC CBS, Aleph or Alma. Solutions found via Wikibase could, therefore, be introduced to the entire library community.

 

 

 

 

  • Keine Stichwörter