Versionen im Vergleich

Schlüssel

  • Diese Zeile wurde hinzugefügt.
  • Diese Zeile wurde entfernt.
  • Formatierung wurde geändert.

Datum des CBS-Abzugs: 20232024-08-01

Dieser Bericht wurde automatisiert mit R Markdown erstellt. Der pica-rs-Code für die Abfrage aller Tc-Sätze und der R-Code für die Berechnung der Ausgabetabelle können durch Aufklappen der Codeblöcke eingesehen werden.

...

Codeblock
languagenone
collapsetrue
# Crosskonkordanzen einlesen
ck <- read_csv('Tc.csv', col_types = 'cccc')

# Wertebereiche gemäß Wiki-Seiten definieren
thesauri <- read_csv('Thesauri.csv', col_types = 'cc')
relationen <- read_csv('Relationen.csv', col_types = 'cc')

# Crosskonkordanzen filtern und zählen
rslt1 <- ck %>%
  filter(Thesaurus %in% thesauri$Code & Relation %in% relationen$Code) %>%
  mutate(
    Thesaurus = factor(Thesaurus, 
                       levels = thesauri$Code, labels = thesauri$Thesaurus),
    Relation  = factor(Relation,
                       levels = relationen$Code, labels = relationen$Relation)
  ) %>% # auch alle leeren Levels jeweils mit Anzahl 0 anzeigen
  group_by(Thesaurus, Relation, .drop = FALSE) %>% 
  # jede Kombination (Thesaurus, Relation) je IDN nur einmal zählen
  summarise(n = n_distinct(IDN)) %>%
  pivot_wider(id_cols = Relation, names_from = Thesaurus, values_from = n)

# Summe
rslt2 <- data.frame(Relation = factor('GESAMT'), 
                    rslt1 %>% select(-Relation) %>% summarise_all(.funs = sum))
colnames(rslt2) <- colnames(rslt1)

# Formatierte Ausgabetabelle
rbind(rslt1, rslt2) %>% 
  mutate_at(.vars = setdiff(colnames(.), 'Relation'), .funs = ~ formatC(
    ., format = 'd', big.mark = '.', decimal.mark = ',')) %>%
  knitr::kable(align = c('l', rep('r', ncol(.)-1)))
RelationAGROVOCLCSHRAMEAUMeSHSTWTheSozEMBNENSoggT-PRO
Äquivalenz (ftaa)90
45
46.
434
577
44
45.
029
244
36
40
154
0103
11
13.
259
0408.
563
6172
exakte Äquivalenz (ftae)5.
491
490
450
717
417
6676.
012
190
8
5.
697
7607.340172236
inexakte Äquivalenz (ftai)5
243
488
262
406
353
3630205
0
550329
ODER-Äquivalenz (ftao)4
37
123
22
546500
0
608
UND-Äquivalenz (ftau)1.2932.
289
3044.
578
661116
407
4171.
605
612100
Oberbegriff-Relation (ftob)2.12700
54
557.
748
8882.
918
970000
Unterbegriff-Relation (ftub)18300
11
12
365
375387000
Verwandter-Begriff-Relation (ftvb)76900113.
613
750
923
933000
Null-Relation (ftnu)16818.
066
37919.
570
8990
761
505
872
893
0
210
GESAMT10.
130
129
66
68.
519
588
68
70.
878
9316.
658
852
21
18.
745
69514.
353
443
11
13.
277
6168.
589
64375