PICA3 | PICA+ / UF | W | Inhalt | MARC 21 / UF / Pos. |
---|---|---|---|---|
5540 | 044H | J | Automatisch vergebene Schlagwörter | MARC-PICA-Konkordanzen |
"[…]" | $b | N | Kennung für Art des Schlagworts / Quelle | |
entweder | ||||
"!...!" | $9 | N | Verknüpfungsnummer zur GND | |
oder strukturierte textliche Angaben: | ||||
-ohne- | $a | N | Schlagwort | |
zusätzlich | ||||
"$L" | $L | N | LCSH-Identifier (Library of Congress Subject Headings) | |
"$u" | $u | N | LCSH-URI | |
"$E" | $E | N | Kennzeichnung der Erfassungsart (Code) | |
"$H" | $H | N | Herkunft (Code) | |
"$K" | $K | N | Konfidenzwert (1,000 - 0,000) | |
"$D" | $D | N | Datum der automatisierten Erstellung (JJJJ-MM-TT) | |
"$R" | $R | N | Relevanzbewertung | |
"$T" | $T | N | Datum der Relevanzbewertung (JJJJ-MM-TT) |
Indextyp/Schlüsseltyp | UF | Indexierungsroutine |
---|---|---|
BSW/TSW | $9 | (W) "wortweise" |
MSW/MSW | $9 | (Ph) "Phrase" |
BSW/FSW | $a | (W) "wortweise" |
BSW/FAS (wenn $b = "FA") | $a | (W) "wortweise" |
BSW/DSW | $D | (W) "wortweise" |
BSW/ASW | $E | (W) "wortweise" |
BSW/HSW | $H | (W) "wortweise" |
BSW/KSW | $K | (W) "wortweise" |
BSW/RSW | $R | (W) "wortweise" |
BSW/RBD | $T | (W) "wortweise" |
Die Felder werden seit April 2014 durch die maschinelle Beschlagwortung besetzt.
In Feld 5051 wird die verwendete Konfigurationskennung in $L angegeben.
Das Feld wird im ZDB-Format nicht belegt.
Im Feld wird durch die maschinelle Beschlagwortung immer eine IDN-Verknüpfung zu einem Schlagwort- bzw. Normdatensatz der Gemeinsamen Normdatei (GND) erstellt.
Durch die maschinelle Beschlagwortung englischsprachiger Netzpublikationen werden ID-Verknüpfungen zu den jeweiligen Deskriptoren der Library of Congress Subject Headings (LCSH) im Unterfeld $L bzw. zu den dazugehörigen URI im Unterfeld $u erstellt.
Das Feld enthält zudem Informationen über die Metadatenherkunft in den Unterfeldern $H (Herkunft) und $E (Kennzeichnung der Erfassungsart).
Im Unterfeld $E wird der Standard-Wert "m" für "maschinell" eingespielt. Wenn die Feldinhalte aus einer Parallelausgabe (Petrus-Routine Parallelabgleich) übernommen wurden, wird im Unterfeld $H der Code für die Herkunftsangabe durch den String "-pa" ergänzt (= aus paralleler Ausgabe übernommen).
Im Unterfeld $H werden die Werte "emagnd" für ein "maschinell ermitteltes GND-Schlagwort durch eine Software der DNB" eingetragen, oder "aepgnd" für ein "durch die DNB vergebenes GND-Schlagwort aus dem Wörterbuch der Averbis-Software" bzw. "aeplcsh" für ein "durch die DNB vergebenes LCSH-Schlagwort aus dem Wörterbuch der Averbis-Software".
Im Rahmen des Qualitätsmanagements können fehlende Aspekte hinzugefügt werden. Diese werden in $b mit [FA] gekennzeichnet. Hier kann sowohl eine GND-Verknüpfung als auch Freitext eingetragen werden.
Zur Beurteilung der Qualität bewertet die Abteilung Inhaltserschließung stichprobenweise die einzelnen Schlagwörter. Hierbei werden weitere Informationen in den Unterfeldern $R (Relevanzbewertung) und $T (Datum der Relevanzbewertung) abgelegt.
Seit 2014 werden ausgewählte Objektgruppen mit GND- und LCSH-Schlagwörtern mittels eines maschinellen Verfahren beschlagwortet. In den Unterfeldern $E, $H, $K und $D wird die Herkunft der Daten sowie der Prozess gekennzeichnet. Im Rahmen des Qualitätsmanagements werden die Schlagwörter durch die Abteilung Inhaltserschließung stichprobenartig intellektuell geprüft und bewertet, wie oben beschrieben.
$R | Relevanzbewertung |
---|---|
0 | Falsch |
1 | Wenig nützlich |
2 | Nützlich |
3 | Sehr nützlich |
Metadatenherkunft
Codes für die Unterfelder $E, $H, $K und $D siehe MDH | Gekennzeichnete Prozesse
Beispiele für die maschinelle Beschlagwortung an einem Datensatz:
5540 [GND]!040702677!Dekalog [Tu1]$Em$Hemagnd$K0,33478$D2022-02-15
5540 [GND]!040118827! $Em$Hemagnd$K0,24131$D2022-02-15
5540 [GND]!040425703! $Em$Hemagnd$K0,20589$D2022-02-15
5540 [GND]!041665759! $Em$Hemagnd$K0,15559$D2022-02-15
5540 [GND]!041251865! $Em$Hemagnd$K0,10931$D2022-02-15
5540 [GND]!041975499! $Em$Hemagnd$K0,06673$D2022-02-15
5540 [GND]!042036534! $Em$Hemagnd$K0,05638$D2022-02-15
5540 [LCSH]Microglia$Lsh85084845$uhttp://id.loc.gov/authorities/subjects/sh85084845$Em$Haeplcsh$K0,088$D2016-11-17
5540 [LCSH]Cells$Lsh85021678$uhttp://id.loc.gov/authorities/subjects/sh85021678$Em$Haeplcsh$K0,075$D2016-11-17
5540 [LCSH]LSD (Drug)$Lsh85079185$uhttp://id.loc.gov/authorities/subjects/sh85079185$Em$Haeplcsh$K0,075$D2016-11-17
5540 [LCSH]Families$Lsh85047009$uhttp://id.loc.gov/authorities/subjects/sh85047009$Em$Haeplcsh$K0,039$D2016-11-17
5540 [GND]!964751038!Assistenzsystem [Ts1]$Em$Haepgnd-pa$K0,60895$D2019-02-16
5540 [GND]!966493974!Mensch-Maschine-Schnittstelle [Ts1]$Em$Haepgnd-pa$K0,18995$D2019-02-16
Im Rahmen von Wiederholungsläufen können in unregelmäßigen Abständen Dokumente neu prozessiert werden. Dabei werden alle Informationen (auch die Relevanzbeurteilung) in 5540 überschrieben. Beispiel für die maschinelle Beschlagwortung an einem Datensatz ohne Angabe der Metadatenherkunft: |