Versionen im Vergleich

Schlüssel

  • Diese Zeile wurde hinzugefügt.
  • Diese Zeile wurde entfernt.
  • Formatierung wurde geändert.

Datum des CBS-Abzugs: 2023-0203-01

Dieser Bericht wurde automatisiert mit R Markdown erstellt. Der pica-rs-Code für die Abfrage aller Tc-Sätze und der R-Code für die Berechnung der Ausgabetabelle können durch Aufklappen der Codeblöcke eingesehen werden.

...

Codeblock
languagebash
collapsetrue
#!/bin/bash

set -euo pipefail
# set -x

# https://wiki.dnb.de/pages/viewpage.action?pageId=263851158

dnb_dump=/srv/aen-data/pica/T.dat

# Tc-Sätze "f bbg Tc NOT rdb GND-kein-Schlagwort*"
pica filter -s "002@.0 == 'Tc'" --not "050C.a =^ 'GND-kein-Schlagwort'" $dnb_dump -o Tc.dat

# 028P (700) - "p" - Person
# 029P (710) - "b" - Körperschaft
# 030P (711) - "f" - Konferenz
# 022P (730) - "u" - Einheitstitel
# 041P (750) - "s" - Sachbegriff
# 065P (751) - "g" - Geografikum

pica filter -s "028P.4?" Tc.dat |
pica select -H "IDN, Feld, Thesaurus, Relation" \
"003@.0, '028P', 028P{2, 4}" \
--where "028P.4?" Tc.dat -o Tc.csv

# ohne Header anhängen
pica filter -s "029P.4?" Tc.dat |
pica select "003@.0, '029P', 029P{2, 4}" >> Tc.csv

pica filter -s--where "030P029P.4?" Tc.dat | --append -o Tc.csv
pica select "003@.0, '030P', 030P{2, 4}" >> Tc.csv

pica filter -s--where "022P030P.4?" Tc.dat | --append -o Tc.csv
pica select "003@.0, '022P', 022P{2, 4}" >> Tc.csv

pica filter -s--where "041P022P.4?" Tc.dat | --append -o Tc.csv
pica select "003@.0, '041P', 041P{2, 4}" >> Tc.csv

pica filter -s--where "065P041P.4?" Tc.dat | --append -o Tc.csv
pica select "003@.0, '065P', 065P{2, 4}" --where "065P.4?" >> Tc.dat --append -o Tc.csv

Anzahl der Tc-Sätze gruppiert nach Thesaurus und Relation:

...

RelationAGROVOCLCSHRAMEAUMeSHSTWTheSozEMBNENSoggT-PRO
Äquivalenz (ftaa)9045.32733444.045037368.78778610311.2598.5632
exakte Äquivalenz (ftae)5.4913803833493524.75577557.340172236
inexakte Äquivalenz (ftai)518218720120620221202050329
ODER-Äquivalenz (ftao)435236500008
UND-Äquivalenz (ftau)1.2932.2804.4574721164061.605100
Oberbegriff-Relation (ftob)2.12700547.7517542.918000
Unterbegriff-Relation (ftub)1830011360387000
Verwandter-Begriff-Relation (ftvb)76900113.597923000
Null-Relation (ftnu)16817.96897019.4554570779872010
GESAMT10.13066.17218968.5305475.25028021.68568714.35311.2778.58975