Im Rahmen des Vorhabens "Vorschlagssteuerung Personen“ wurde nun DNB-intern ein Verfahren zur maschinellen Generierung von Vorschlägen für neue GND-Personen-Datensätze (Tp) entwickelt und soll nun DNB-intern getestet werden. Die generierten Vorschlagsdatensätze sind nicht Bestandteil der GND und werden nicht ausgeliefert. Die Vorschlagsdatensätze und der Workflow sollen zunächst ausführlich produktiv innerhalb der DNB getestet werden. Dabei wird das bereits bestehende Verfahren der Auswertung der DNB-ORCID-Claiming-Logs ausgeweitet.
Der Vorschlagsdatensatz enthält neben dem bevorzugten und gegebenenfalls abweichenden Namen und der ORCID iD weitere Angaben aus dem ORCID-Record, beispielsweise Affiliationen und Wirkungsdaten, und aus dem Titeldatensatz, beispielsweise Titelangaben. Claimt eine Person mehrere Titel, werden diese im bereits bestehenden Vorschlagsdatensatz ergänzt. Die Anzahl der in einem Vorschlagsdatensatz enthaltenen Titelangaben ist ein wichtiger Indikator für die Aufarbeitung eines Vorschlagsdatensatzes zu einem GND-Datensatz.Seit dem 4. Februar 2022 wird bei der Auswertung immer dann, wenn im DNB-Titeldatensatz keine Tp-Verknüpfung vorhanden ist und es keinen Datensatz mit dem Personennamen gibt, ein Vorschlagsdatensatz angelegt. Außerdem hat ein Retrolauf über die bereits geclaimten Titel stattgefunden, bei dem 3.440 Vorschlagsdatensätze erstellt wurden.
Die Vorschlagsdatensätze sind, nicht Bestandteil der GND und werden nicht ausgeliefert. Bei der Suche nach Personendatensätzen via WinIBW in der GND könnten Sie allerdings auf die entsprechenden Vorschlagsdatensätze stoßen. Sie erkennen Vorschlagsdatensätze an der Satzart TX im Pica3-Feld 005 (Pica+Feld 002@). Wenn Sie auf einen Vorschlagsdatensatz treffen, ignorieren Sie diesen bitte. Sie werden intellektuell von DNB-Kolleg*innen zu GND-Datensätzen aufgearbeitet. In der Testphase ist die Anzahl der Vorschlagsdatensätze sehr gering (aktuell ca. 100 Datensätze im Monat).