Seitenhistorie
...
ILTIS-Handbuch, Titeldaten, Formatdokumentation, Feldbeschreibungen
Stand: 18022022
PICA3 | PICA+ / UF | W | Bezeichnung | MARC 21 / UF / Pos. |
---|---|---|---|---|
1500 | 010@ | J | Code(s) für Sprache(n) des Textes und des Originals (nach DIN 2335 / ISO 639-2, 3 Kleinbuchstaben) | MARC-PICA-Konkordanzen |
/1 | $a | J | Code der Sprache des Textes | |
/3 | $c | J | Code der Sprache des Originals | |
"$E" | $E | N | Kennzeichnung der Erfassungsart (Code) | |
"$H" | $H | N | Herkunft (Code) | |
"$K" | $K | N | Konfidenzwert maschinell ermittelter Sprachencode (1,000 - 0,000) | |
"$D" | $D | N | Datum der automatisierten Erstellung (JJJJ-MM-TT) |
Indextyp/Schlüsseltyp | UF | Indexierungsroutine |
---|---|---|
COD/SCT | $a | Sy (wortweise mit Sonderzeichen, nur für intellektuell vergebene Sprachcodes) |
COD/SCO | $c | Sy (wortweise mit Sonderzeichen) |
SCM | $a | Sy (wortweise mit Sonderzeichen, nur für maschinell vergebene Sprachcodes) |
SCE | $E | W, Ph |
SCH | $H | W, Ph |
SCK | $K | W, Ph |
SCD | $D | Ph |
Verwendung
Das Feld ist in allen Satzarten zulässig. In der ZDB ist nur das Unterfeld $a zulässig. In nach RDA katalogisierten und gekennzeichneten Datensätzen ist die "Sprache der Expression" ein Kernelement und daher obligatorisch zu erfassen.
...
Im Unterfeld $E kann der Code m (= maschinell ermittelt) vergeben werden. Im Unterfeld $H wird die Bezeichnung des Prozesses angegeben, aus dem die Daten in PICA/CBS übernommen wurden. Der Prozess zur automatischen Ermittlung der Sprachcodes mit Hilfe der Erschließungssoftware wird Hilfe der Erschließungssoftware wird mit dem Code aeplc (= durch die DNB vergebener Language Code aus der Averbis-Software) beschrieben. Das Unterfeld $D zeigt das Datum der maschinellen Erstellung der Sprachcodes an. Das Unterfeld $K zeigt den Konfidenzwert an, mit dem die Software die Sprache der Ressource ermittelt hat. Das Unterfeld $K kann Werte zwischen 1,000 und 0,000 enthalten.
...
Liste der ISO-Sprachcodes: Alphabetische Liste der Codes (Deutsche Benennung und Code)
Codes, die keiner bestimmten Sprache zugeordnet sind:
mul | zusammenfassender Code bei mehr als 3 Sprachen |
mis | wird für bekannte Sprachen verwendet, für die es aber keinen Code gibt |
und | wenn die Sprache nicht bekannt ist |
zxx | kein linguistischer Inhalt |
$E | Kennzeichnung der Erfassungsart |
---|---|
a | andere |
i | Intellektuell |
m | maschinell |
$H | Herkunft |
---|---|
aeplc | durch die DNB vergebener Language Code (LC) aus der Averbis-Software (AEP) ; maschinelle Vergabe von Sprachencodes |
dnb-pa | Übernahme aus Parallelabgleich |
ka... | aus Digitalisierungsprozess |
npi | durch die DNB beim Import von Netzpublikationen übernommen |
Beispiele
1500 /1ger
1500 /1ger/3eng
...
1500 /1ger/3und
1500 /1ger/3pol 3pol [Erläuterung: Die Sprache der Expression des zugrundeliegenden Werks ist polnisch; für die Übersetzung der Ressource wurde eine englische Fassung des Werks zugrunde gelegt --> Angabe in /3pol 3pol nicht /3eng/3pol]
1500 /1ger/1mul
1500 /1mis/3ger
1500 /1zxx 1zxx [kein sprachgebundenes Material]
...
1500 /1gre$Em$Haeplc$K0,554$D2017-03-07
1500 /1eng$Em$Haeplc$K0,511$D2017-03-07
1500 /1fre$Em$Haeplc$K0,478$D2017-03-07
...
Altdaten/Datenpflege
Erweitern | ||||||||
---|---|---|---|---|---|---|---|---|
| ||||||||
Codes
|
Erweitern | ||||||||
---|---|---|---|---|---|---|---|---|
| ||||||||
Beschreibung des FeldinhaltesIn Feld 1500 ist das RDA-Element "Sprache der Expression" abgelegt. Es enthält Angaben zu Sprache(n) des Inhalts einer Ressource sowie bei Übersetzungen Angaben zu Sprache(n) des Originals in codierter Form gemäß DIN 2335/ISO 639-2/B. Besteht die Ressource ausschließlich aus nicht nichtsprachlichem Inhalt, zum Beispiel Bilder oder Instrumentalmusik, wird ein entsprechender Code vergeben. Sprache des Originals bei Übersetzungen meint die Originalsprache eines Werkes. Die Sprache, aus der die vorliegende Ressource übersetzt wurde, muss nicht immer die Originalsprache sein. Sofern das der Fall ist, wird ausschließlich die Originalsprache aufgeführt. Für den Eintrag maschinell ermittelter Sprachcodes wurde das Feld um drei Unterfelder erweitert: $E (Kennzeichnung der Erfassungsart), $H (Herkunft), $K (Konfidenzwert maschinell ermittelter Sprachcode) und $D (Datum der automatisierten Erstellung). Die Unterfelder $E, $H und $D enthalten Provenienz-Informationen. Im Unterfeld $E kann der Code m (= maschinell ermittelt) vergeben werden. Im Unterfeld $H wird die Bezeichnung des Prozesses angegeben, aus dem die Daten in PICA/CBS übernommen wurden. Der Prozess zur automatischen Ermittlung der Sprachcodes mit Hilfe der Erschließungssoftware wird mit dem Code aep-lc (= durch die DNB vergebener Language Code aus der Averbis-Software) beschrieben. Das Unterfeld $D zeigt das Datum der maschinellen Erstellung der Sprachcodes an. Das Unterfeld $K zeigt den Konfidenzwert an, mit dem die Software die Sprache der Ressource ermittelt hat. Das Unterfeld $K kann Werte zwischen 1,000 und 0,000 enthalten.
Formatbeispiel für Erfassung maschinell ermittelter Sprachcodes:1500 /1gre $Em $H aep-lc $K 0,554 $D 2017-03-07 |
...
Erweitern | ||
---|---|---|
| ||
Alte Beschreibung, Stand: 01.10.2010 1. DatenfeldDas Feld 1500 enthält Code-Angaben für die Sprache(n) der vorliegenden Veröffentlichung sowie bei Übersetzungen für die Sprache(n) des Originals. Der Sprachencode wird seit März 2007 in allen neu anzulegenden Katalogisaten angegeben, auch wenn die Sprache nur Deutsch ist. Einbezogen in die Sprachencodierung werden alle Arten von Veröffentlichungen und Publikationsmedien (z.B. auch Bildbände, Kunstbände, Karten, Videos, Kassetten, elektronische Publikationen, Medienkombinationen etc.) sowie alle Katalogisate, die DNB herstellt, unabhängig davon ob sie eine Bibliografieanzeige erhalten oder nicht. Die Erfassung des Sprachencodes erfolgt in den Satzarten *a, *f und *F. Bei der Bearbeitung von fortlaufenden Sammelwerken in den Satzarten *dvz und *bvz ist die Angabe der Sprachencodes ebenfalls obligatorisch. Anm.: Vor März 2007 wurden Sprachencodes nur teilweise vergeben: In allen DNB-Katalogisaten wurde der Sprachencode vom 1. Dezember 1995 bis Februar 2007 nur angegeben, wenn die Sprache der Veröffentlichung nicht Deutsch war und keine Übersetzung ins Deutsche vorlag. Bei fremdsprachigen Germanica und Übersetzungen deutschsprachiger Werke wurden Sprachencodes ab 1992 erfasst, bis Oktober 2010 in allen Satzarten. Die folgenden Ausführungen in den Punkten 2 - 4 gelten für Monografien, Loseblattausgaben, Zeitschriftenstücktitel und Zeitschriftenbandsätze. Für fortlaufende Sammelwerke gelten besondere Regelungen, s. dazu Punkt 5. 2. Steuerzeichensyntaxs. Tabelle oben Bei mehreren Sprachenangaben ist die Kennung vor jedem Sprachencode zu erfassen. Die Codes für die Sprache der vorliegenden Veröffentlichung werden vor denen für die Sprache des Originals angegeben. 3. Grundlage für die SprachencodierungDer Sprachencode bezieht sich auf die Sprachen des "Haupttextes" einer Veröffentlichung. Texte geringen Umfangs in anderen Sprachen (z.B. Zusammenfassungen, Abstracts, Vor- worte, Nachworte, Einleitungen, Bildunterschriften, kurze Erläuterungen sowie Beigaben, Beilagen, Texte der Benutzeroberfläche bei elektronischen Publikationen etc.) werden für die Vergabe des Sprachencodes in der Regel nicht berücksichtigt. Ist jedoch eine Veröffentlichung z.B. eine Bibliografie oder ein Bibliothekskatalog oder besteht der wesentliche Teil einer Publikation nicht aus geschriebener oder gesprochener Sprache (betr. z.B. Bild- und Kunstbände, Bilderbücher, Karten, Audio-CDs etc.), bezieht sich die Angabe des Sprachencodes auf die Sprache(n) von Einleitungen, Vor- und Nachworten, Erläuterungen, Bildunterschriften, die "Rahmenbeschriftung" bei Karten u. dgl. Ist das nicht möglich (z.B. bei Bilderbüchern ohne Text), richtet sich der Sprachencode nach der Sprache des Titels der Veröffentlichung. 4. Umfang der SprachencodierungEs werden die Codes nach ISO 639-2/B verwendet. Die Angabe ist auf 3 Sprachencodes je Kennung begrenzt. Alphabetische Liste der Codes und alphabetische Lister der Sprachen: http://www.dnb.de/DE/Standardisierung/GND/gndArbeitshilfen.html Codes, die keiner bestimmten Sprache zugeordnet sind: Anm.: Intensive Nachforschungen zur Bestimmung einer Sprache sind nicht vorgesehen. 4.1. Beispiele1500 /1dut 4.2. Originalsprache(n) bei Übersetzungena) Der Sprachencode wird sowohl für die Sprache der vorliegenden Veröffentlichung als auch für die Originalsprache angegeben. 5. Sprachencodierung bei fortlaufenden SammelwerkenBei fortlaufenden Sammelwerken werden nur die Sprachen der vorliegenden Veröffentlichung beschrieben. Für Datensätze von Schriftenreihen kann auch die Sprache des Sachtitels als Grundlage dienen. Hier liegt der Schwerpunkt der Codierung in den Datensätzen der zugehörigen Bände. Es werden bis zu 3 Sprachen berücksichtigt jeweils eingeleitet mit /1... Das Feld wird auch besetzt, wenn die Veröffentlichung in mehr als drei Textsprachen erscheint. Ergänzende Angaben (mehr als drei Sprachen o.ä.) werden in Feld 4221 gemacht. Link zur ZETA-Beschreibung: http://www.zeitschriftendatenbank.de/erschliessung/arbeitsunterlagen/zeta/1500.html |
...