Blog-Eintrag

In der Redaktionsarbeit ist wiederholt aufgefallen, dass bei neu erfassten Sachbegriffen als Katalogisierungsquelle in Feld 040, Unterfeld $e „rda“ eingegeben wurde. Dies ist nicht zulässig, da Sachbegriffe gemäß RSWK erfasst werden. Bitte beachten Sie, dass die Katalogisierungsquelle für die Satzart Ts wie folgt zu belegen ist: 040 $frswk. Bei Aufgreifen sollten Datensätze entsprechend korrigiert werden.

Die GND-Systematik wurde in die englische Sprache übersetzt sowie verschiedene Präzisierungen bei den Benennungen vorgenommen und steht im öffentlichen ILTIS-Wiki https://wiki.dnb.de/x/SBSwE zur Verfügung.

1. An wen ist dieses Dokument gerichtet?

Dieses Dokument richtet sich an Mitarbeiter:innen von Institutionen, die Daten zu zeitgenössischen Personen in der GND erfassen wollen. Ergänzend zu den geltenden Regeln und bestehenden Erfassungshilfen will es darauf aufmerksam machen, dass mit der (Neu-)Erfassung von zeitgenössischen Personen eine besondere Verantwortung verbunden ist.

2. Warum ist der verantwortungsvolle Umgang wichtig?

Der Schutz der Privatsphäre und der Persönlichkeitsrechte ist ein hohes Gut, das im digitalen Zeitalter, mit den immer größer werdenden Möglichkeiten der Datenaggregation und -auswertung, von Tag zu Tag wichtiger wird. Bei noch lebenden Personen (sog. Betroffenen) ist beim Speichern und Veröffentlichen von personenbezogenen Daten mit besonderer Vorsicht vorzugehen. Dies fängt schon bei der Auswahl der zu speichernden Daten an.

Die GND ist keine Enzyklopädie und kein biografisches Lexikon. Grundsätzlich sollten Normdatensätze zwei zentrale Funktionen erfüllen: Eine Entität identifizierend beschreiben und die Vernetzung von unterschiedlichen Ressourcen mit dem identifizierenden Datensatz dieser Entität ermöglichen. Es gibt zwar Fälle, in denen Autoren darum bitten, dass weitere Informationen über sie gespeichert werden sollen – sie geben auch selbst an, was sie gerne gespeichert hätten – aber auch in diesen Fällen ist mit Vorsicht vorzugehen: Einerseits um die GND nicht unnötig aufzublähen, andererseits aber auch, um den redaktionellen Aufwand zu verringern, für den Fall, dass die Person ihr Einverständnis zur Datenspeicherung zurückziehen sollten.

Somit ist – jedenfalls bei zeitgenössischen Personen – immer zu überlegen, ob ein Merkmal unbedingt für die Individualisierung notwendig ist. Das hängt u. U. auch davon ab, wie häufig ein Name ist und welche Angaben sinnvoll sind, um zwei gleichnamige Personen zu unterscheiden. Für einige Merkmale existieren genaue Vorgaben. So hat z. B. die Expertengruppe Normdaten 2014 festgelegt, dass bei noch lebenden Personen das exakte Geburtsdatum nicht in der GND erfasst werden soll (vgl. Erfassungsleitfaden 548). Für die meisten Merkmale gibt es aber keine so genauen Vorgaben - hier müssen die Katalogisierenden nach ihrem Ermessen vorgehen.

Die GND ist eine kooperativ gepflegte Datenbank mit weitgehenden Schreibrechten für alle beteiligten Mitglieder. Dadurch, dass sämtliche Inhalte der Datenbank sofort nach der Erfassung nicht nur allen Mitgliedern der GND-Kooperative zur Verfügung stehen, sondern über die Maschinenschnittstellen durch jedermann übergreifend sofort recherchierbar sind und z. B. in den Katalogen der Deutschen Nationalbibliothek und den deutschen Bibliotheksverbünden sowie international in der Virtual International Authority File (VIAF) gleich veröffentlicht werden, wird deutlich, welche Auswirkung das Anlegen und Redigieren eines Personensatzes in der GND haben kann.

Zusammenfassend fragen Sie sich bei der Erfassung der Daten „Benötige ich diese Daten wirklich?" Denken Sie an den Grundsatz der Datenminimierung (also: nicht mehr personenbezogene Daten, als unbedingt nötig) und dass die Richtigkeit der Daten dann auch belastbar sein muss.

3. Welche Daten sind besonders sensibel?

Als besonders sensible Daten nennt Art. 9 DSGVO Angaben, aus denen "die rassische und ethnische Herkunft, politische Meinungen, religiöse oder weltanschauliche Überzeugungen oder die Gewerkschaftszugehörigkeit hervorgehen", sowie genetische Daten, biometrische Daten zur eindeutigen Identifizierung einer natürlichen Person, Gesundheitsdaten oder Daten zum Sexualleben oder der sexuellen Orientierung. Die Verarbeitung dieser Art Daten ist grundsätzlich untersagt, es sei denn, dass die betroffene Person selbst diese Angaben veröffentlicht hat (Art. 9, Abs. 2 Lit. e). Weiter sollten Daten wie das genaue Geburtsdatum, Herkunftsort, Geschlecht bzw. sexuelle Identität und Angaben zu dem persönlichen Umfeld nur dann erfasst werden, wenn sie für die Individualisierung unbedingt notwendig sind.

Weniger kritisch sind Angaben wie Wirkungsdaten, Ländercode (Pflichtangabe), akademischer Grad, thematischer Schwerpunkt, Adelstitel, zugeordnete Titelangaben.

4. Wie sieht der rechtliche Rahmen aus?

Die Verarbeitung personenbezogener Daten regelt seit 2018 die Datenschutz-Grundverordnung (DSGVO).

Die DSGVO legt fest, dass die Hoheit über die eigenen Daten grundsätzlich bei der lebenden Person bleibt, und dass diese Daten auf Wunsch geändert oder gar gelöscht werden müssen. Hiervon können nur vereinzelt Ausnahmen gemacht werden, etwa wenn eine Verarbeitung im Rahmen einer gesetzlichen Pflicht oder hoheitlichen Aufgabe erfolgt.

Die DSGVO definiert personenbezogene Daten als “alle Informationen, die sich auf eine identifizierte oder identifizierbare natürliche Person (im Folgenden „betroffene Person“) beziehen; als identifizierbar wird eine natürliche Person angesehen, die direkt oder indirekt, insbesondere mittels Zuordnung zu einer Kennung wie einem Namen, zu einer Kennnummer, zu Standortdaten, zu einer Online-Kennung oder zu einem oder mehreren besonderen Merkmalen, die Ausdruck der physischen, physiologischen, genetischen, psychischen, wirtschaftlichen, kulturellen oder sozialen Identität dieser natürlichen Person sind, identifiziert werden kann” (Art. 4 Absatz 1).

Eine Verarbeitung dieser Daten (d.h. jede Art von Umgang einschließlich des erstmaligen Erfassens und des Löschens, Art. 4 Nr. 2 DSGVO) bedarf in jedem Fall einer Rechtsgrundlage. Die GND als Ganzes kann sich dabei auf die Rechtsgrundlage des berechtigten Interesses (Art. 6 Abs. 1 lit. f DSGVO) stützen. Als kooperativ gepflegte Datenbank gilt für die GND eine gemeinsame Verantwortlichkeit im Sinne von DSGVO Art 26. Das heißt, dass grundsätzlich alle Teilnehmer:innen für die von ihnen eingetragenen Angaben haften, und auch, dass für die sonstigen Daten eine Mithaftung gegeben ist. Hierzu wird es eine besondere datenschutzrechtliche Vereinbarung geben, die die Einzelheiten der Verarbeitung und der Verantwortlichkeiten klärt. Im Übrigen muss jede zur GND beitragende Stelle selbst prüfen, ob sie die vorliegenden Daten erfassen und in die GND einspeisen darf. Beispielsweise lässt sich die Befugnis für die Deutsche Nationalbibliothek aus dem gesetzlichen Auftrags zur bibliografischen Erfassung und der Zusammenarbeit in nationalen Fachorganisationen ableiten (Art. 6 Abs. 1 lit. e DSGVO in Verbindung mit § 2 Nr. 1 u. 3 DNBG).

Vor diesem Hintergrund ist es notwendig, bei der Erfassung personenbezogener Daten die Grundsätze der Verarbeitung einzuhalten, die in Art. 5 DSGVO dargestellt sind: dabei sind für die GND insbesondere der Grundsatz der Datenminimierung (nicht mehr personenbezogene Daten, als unbedingt nötig sowie der Grundsatz der belastbaren Richtigkeit zu beachten (Art. 5 Abs. 1 lit. c und d DSGVO)).

Seit Herbst 2023 wird das Praxis-Update RDA DACH vermittelt (siehe https://sta.dnb.de/doc/STA-HILFE-TRM); teilweise ist die Erfassung von Normdaten betroffen (Abschnitt 2.3).

Für alle, die bereits am Praxis-Update RDA-DACH teilgenommen haben, gelten die Vereinbarungen aus dem Update.

Für folgende Erfassungshilfen ergaben sich durch die Einführung von RDA DACH inhaltliche Änderungen: Personen: EH-P-15 - Körperschaften: EH-K-15; EH-K-16; EH-K-17
Die Erfassungshilfen geben derzeit noch den alten Stand vor.

Im Rahmen des Projekts „GND-Dokumentation“ werden die GND-Erfassungshilfen und weitere GND-Dokumente ebenfalls in die STA-Dokumentationsplattform überführt und in diesem Zusammenhang an den gültigen Regelwerksstand angepasst.

 Für die Vergabe von Relationscodes ($4) in den Feldern 500, 510 und 550 sind seit Ende August neue Validationen eingeführt werden. Es werden inzwischen nur die Relationscodes erlaubt, die in dem jeweiligen Erfassungsleitfaden aufgeführt sind.

Somit werden die Relationscodes jetzt in allen 5XX-Feldern validiert, außer im Feld 551: Hier müssen wir erst die Daten bereinigen. Eine vollständige Liste aller Validationen gibt es auf den ILTIS-Seiten.

Immer wieder ist zu beobachten, dass bei Level-1-Datensätzen, die von Level-3-Redaktionen bearbeitet werden, das Level auf Level 3 heruntergestuft wird (z.B. idn 118722123). Bitte achten Sie darauf, dass Sie durch Ergänzungen die Level der Datensätze nicht herunterstufen.

Zu der Mitteilung aus dem April, Erschließung von Medienwerken, die durch KI-Software erstellt worden sind, gibt es einen neuen vorläufigen Stand.

Der Umgang mit KI-generierten Medienwerken in der Titeldaten- und Normdatenerschließung wurde in verschiedenen Runden besprochen (GND-Jira-Telko, 4.4.2023, Fachgruppe Erschließung, 25.4.2023). Es wird als sinnvoll erachtet und nun darauf hingearbeitet, das Thema auf internationaler Ebene zur Diskussion und Klärung zu bringen - etwa über die European RDA Interest Group (EURIG) an das RDA Steering Committee (RSC).

Bis zur endgültigen Entscheidung empfiehlt die Fachgruppe Erschließung die folgende vorläufige Vorgehensweise:

  • Medienwerke, die von KI-Software erstellt worden sind, bekommen keinen geistigen Schöpfer, sondern werden als anonyme Werke erschlossen.
  • Titeldatensätze für Medienwerke, die von KI-Software erstellt worden sind, sollen in einem geeigneten Hinweisfeld eine Kennzeichnung bekommen, dass es sich um ein von der Software XY erstelltes Werk handelt. Damit können die betreffenden Datensätze später leichter gefunden und angepasst werden, sobald über den Umgang mit solchen Werken entschieden worden ist.
  • Es werden keine GND-Sätze für KI-Software als geistiger Schöpfer erstellt (Tp oder Tb). Sollte es für die Verschlagwortung notwendig sein, können selbstverständlich Ts-Sätze angelegt werden.


Der Text der Veröffentlichung Ein Pferd verdurstet im Erdbeerland ist durch eine textgenerierende Software namens Doombot erstellt. Diese Software wird seit März 2020 von Julia Knass und Thomas Hainscho geschrieben. Doombot generiert Kurztexte, u.a. für den Twitteraccount @deardoombot und auf der Website https://www.doomscrolling.at. Die Frage ist, ob Doombot hier als geistiger Schöpfer eingetragen werden soll und ob es daher einen Normsatz für Doombot geben soll (und falls ja, ob Tb oder Tp).

Wie damit in Titeldaten- und Normdatenerschließung umzugehen ist, wird in Kürze in der Fachgruppe Erschließung diskutiert. Wir informieren Sie an dieser Stelle über Neuigkeiten.

Im GND-Redaktionswiki ist eine Unterseite mit Definitionen (Deutsch/Englisch) zu den Entitätencodes eingehängt. Die Definitionen wurden Ende 2021 der FG E vorgelegt; der Wunsch nach einem neuen Platzhaltercode (Abstimmungen in 2021 und 2022 in den Gremien) konnte noch nicht umgesetzt werden. 

In der Redaktionsarbeit fiel auf, dass bei dem Herauslösen von Spitzenorganen bei Gebietskörperschaften nicht zwischen dem „Stadtrat“ - eine gewählte Vertretung -, und dem „Rat der Stadt“ - nur in der DDR; ein kollektiv arbeitendes Organ, das heutzutage der Stadtverwaltung entspricht (vgl. https://de.wikipedia.org/w/index.php?title=Rat_der_Stadt_(DDR)&oldid=227537884) - unterschieden wurde. Es sind verschiedene Sachverhalte und bedürfen bei Bedarf unterschiedlicher Datensätze. In der ehemaligen DDR gab es auch „Rat des Kreises“, „Rat des Bezirkes“ und „Rat der Gemeinde“, ebenfalls reine Verwaltungsabteilungen, keine gewählten Vertretungen. Für diese gilt der gleiche Hinweis.

Dieses Organ hieß damals offiziell einfach „Rat der Stadt“ und soll als „Rat der Stadt“ (oder „Rat des Kreises“ / „Rat des Bezirkes“ / „Rat der Gemeinde“) unter dem Namen der entsprechenden Stadt (bzw. zutreffenden Gebietskörperschaft) erfasst werden. Weitere abweichende Namen sollen in Feld 410 erfasst werden. Um zu vermeiden, dass die Datensätze für den "Rat der Stadt" und den "Stadtrat usw., die sehr ähnlich lauten, zusammengeführt werden, soll beim Datensatz für den "Rat der Stadt" usw. ein Feld 667 eingefügt werden mit: „DDR-Organ“ bzw. „DDR-Organ; nicht identisch mit …“ Beim Datensatz für den "Stadtrat" usw. soll ggf. ein Feld 667 eingefügt werden mit: "Nicht identisch mit ..." 

Alle diese Datensätze sollen als instantiellen Oberbegriff "Örtlicher Rat" (nid 1289567409) bekommen.

Beispiele:

nid 1086912063, Erfurt / Rat der Stadt

nid 1269706993, Kreis Borna / Rat des Kreises

nid 1226161367, Bezirk Frankfurt (Oder) / Rat des Bezirkes

nid 1227135327, Zeuthen / Rat der Gemeinde


Jeder Verbund ist für die Korrektur ihrer betroffenen Datensätze verantwortlich.

Nach RDA 11.2.2.14.5 werden Institute von Universitäten untergeordnet erfasst, wenn der Name nur ein bestimmtes Studienfach umfasst. RDA 11.2.2.14.5 gilt für alle Arten von Hochschulen, die der Lehre dienen.

Akademien der Wissenschaften sind keine allgemeine Hochschulen. Hochschulen sind Lehreinrichtungen, Akademien nicht. Für Institute von Akademien gilt deshalb in der Regel RDA 11.2.2.14.6. Institute von Akademien tragen meistens den Namen ihrer Akademie in ihrem eigenen Namen.

Es muss immer inhaltlich festgestellt werden, ob eine Körperschaft, die sich "Akademie" nennt, eine Lehreinrichtung ist oder nicht. Wenn es keine ist, gilt, RDA 11.2.2.14.6, wenn es eine ist dagegen RDA 11.2.2.14.5.

Seit ca. 6 Monaten gibt es einen neuen Indexschlüssel in der WinIBW: BAF (oder baf)

Mit diesem Schüssel lassen sich in den 5XX-Feldern das Literal der verknüpften Entität und ihr $4-Code gemeinsam suchen, z.B. f baf köln ortg = alle Datensätze mit Köln als Geburtsort. Es lassen sich so auch gut Fehler aufspüren, z.B. das Sachschlagwort „Adel“ soll bei Personen nur mit dem Code „obin“ vergeben werden. Mit f baf adel beru kann man fehlerhafte Datensätze finden und korrigieren.

Im Juli hatten wir Sie über die Vorschlagsdatensätze für Personen in der GND informiert. 


Nun gibt es ein Update:

Bisher konnten Sie bei der Suche via WinIBW nach Personendatensätzen in der GND auf die Vorschlagsdatensätze (Satzart "TX", Pica3-Feld 005) stoßen. Diese sollten ignoriert werden, da die Datensätze aktuell lediglich von DNB-Kolleg*innen zu GND-Datensätzen aufgearbeitet werden. Nun werden die Vorschlagsdatensätze für alle GND-Anwender*innen - außer für die DNB-Kolleg*innen - ausgeblendet.

In der Rangfolge zur Liste der fachlichen Nachschlagewerke steht folgender Hinweis:
„E) Namen von Personen, deren ursprüngliche Form nicht in lateinischer Schrift geschrieben wird
1.GND
2.Nationalbibliografie bzw. Nationalenzyklopädie
3.LCAuth (unter Beachtung der abweichenden Transliterationsregeln), VIAF
4.Sonstige Nachschlagewerke“

Nach Diskussion in der GND-Jira-Telko vom4.10.22 bleibt die Form in LCAuth maßgeblich für die Bestimmung des bevorzugten Namen (z.B. abgekürzter Vorname vs. ausgeschriebener Vorname).

Allerdings kann die Transliteration der LCAuth nicht 1:1 übernommen werden; es soll an die Sprachredaktion weitergegeben werden.

Zu RAK-Zeiten durften Konferenz-Datensätze mit springenden oder zusammengefassten Zählungen erfasst werden. Das ist mit dem Umstieg auf RDA nicht mehr zulässig; die alten Datensätze sollen auch nicht mehr verwendet werden. Solche Datensätze wie nid 2052148-0 oder nid 5562547-2 sollen in der 667 folgenden Hinweis bekommen: Mit dem RDA-Vollumstieg 2016 nicht mehr verwenden.