1500 - Code(s) für Sprache(n) des Textes und des Originals (nach DIN 2335 / ISO 639-2, 3 Kleinbuchstaben)

ILTIS-Handbuch, Titeldaten, Formatdokumentation, Feldbeschreibungen

Stand:  


PICA3PICA+ / UFBezeichnungMARC 21 / UF / Pos.
1500010@JCode(s) für Sprache(n) des Textes und des Originals (nach DIN 2335 / ISO 639-2, 3 Kleinbuchstaben)MARC-PICA-Konkordanzen
/1$aJCode der Sprache des Textes
/3$cJCode der Sprache des Originals
"$E" $E Kennzeichnung der Erfassungsart (Code)
"$H" $H Herkunft (Code)
"$K" $K Konfidenzwert  maschinell ermittelter Sprachencode (1,000 - 0,000)
"$D" $D Datum der automatisierten Erstellung (JJJJ-MM-TT)
Indextyp/SchlüsseltypUFIndexierungsroutine
COD/SCT $a Sy (wortweise mit Sonderzeichen, nur für intellektuell vergebene Sprachcodes)
COD/SCO$c Sy (wortweise mit Sonderzeichen)
SCM $aSy (wortweise mit Sonderzeichen, nur für maschinell vergebene Sprachcodes) 
SCE $E W, Ph
SCH $H W, Ph
SCK $K W, Ph 
SCD $D Ph

Verwendung

Das Feld ist in allen Satzarten zulässig. In der ZDB ist nur das Unterfeld $a zulässig. In nach RDA katalogisierten und gekennzeichneten Datensätzen ist die "Sprache der Expression" ein Kernelement und daher obligatorisch zu erfassen.

Link zum ZDB-Format

https://zeitschriftendatenbank.de/fileadmin/user_upload/ZDB/pdf/zdbformat/1500.pdf

Für fortlaufende und integrierende Ressourcen sind die Angaben des ZDB-Formats zu beachten.

Beschreibung des Feldinhaltes

In Feld 1500 ist das RDA-Element "Sprache der Expression" abgelegt. Es enthält Angaben zu Sprache(n) des Inhalts einer Ressource sowie bei Übersetzungen Angaben zu  Sprache(n) des Originals in codierter Form gemäß DIN 2335/ISO 639-2/B.

Besteht die Ressource ausschließlich aus nicht nichtsprachlichem Inhalt, zum Beispiel Bilder oder Instrumentalmusik, wird ein entsprechender Code vergeben.

Sprache des Originals bei Übersetzungen meint die Originalsprache eines Werkes. Die Sprache, aus der die vorliegende Ressource übersetzt wurde, muss nicht immer die Originalsprache sein. Sofern das der Fall ist, wird ausschließlich die Originalsprache aufgeführt.

Für den Eintrag maschinell ermittelter Sprachcodes wurde das Feld um drei Unterfelder erweitert: $E (Kennzeichnung der Erfassungsart), $H (Herkunft), $K (Konfidenzwert maschinell ermittelter Sprachcode) und $D (Datum der automatisierten Erstellung). Die Unterfelder $E, $H und $D enthalten Provenienz-Informationen.

Im Unterfeld $E kann der Code m (= maschinell ermittelt) vergeben werden. Im Unterfeld $H wird die Bezeichnung des Prozesses angegeben, aus dem die Daten in PICA/CBS übernommen wurden. Der Prozess zur automatischen Ermittlung der Sprachcodes mit Hilfe der Erschließungssoftware wird mit dem Code aeplc (= durch die DNB vergebener Language Code aus der Averbis-Software) beschrieben. Das Unterfeld $D zeigt das Datum der maschinellen Erstellung der Sprachcodes an. Das Unterfeld $K zeigt den Konfidenzwert an, mit dem die Software die Sprache der Ressource ermittelt hat. Das Unterfeld $K kann Werte zwischen 1,000 und 0,000 enthalten.

 Ausführungsbestimmungen

Enthält die Ressource Text in maximal drei Sprachen, werden für alle Sprachen Sprachencodes erfasst, getrennt durch /1. 

Weist die Ressource mehr als drei Textsprachen auf, wird ein spezifischer Code für die prägende Sprache vergeben, alle weiteren Sprachen werden durch den Code "mul" zusammengefasst. 

Bei mehreren Sprachangaben ist die Kennung vor jedem Sprachencode zu erfassen. Die Codes für die Sprache der vorliegenden Ressource werden vor denen für die Sprache des Originals angegeben. Die Codes beziehen sich auf die Sprachen des Hauptteils einer Ressource, d. h. Vor- und Nachworte, Einleitungen, Anhänge, Register u.Ä. können vernachlässigt werden.

Bei Musikressourcen wird in der Regel auf die Angabe einer Originalsprache verzichtet.

Enthält die Ressource kein sprachgebundenes Material, ist der Code "zxx" zu erfassen. Für die Entscheidung, ob sprachgebundenes Material enthalten ist, werden Informationsquellen mit Titelangaben (z.B. Titelseite, Label, Kolophon) nicht berücksichtigt.

Bei der Erfassung der Sprache der Expression wird die Sprache von Begleitmaterial (z.B. Booklet) nicht berücksichtigt.

Die maschinell ermittelten ISO 639-2/B-Sprachcodes werden nur bei NP-Titeldaten (O-Sätze) eingetragen, sofern noch kein intellektuell vergebener oder durch Parallelabgleich ermittelter Sprachcode in Feld 1500 vorliegt. Bei späterer intellektueller oder durch Parallelabgleich erfolgender Sprachcodevergabe sollen maschinell ermittelte Sprachcodes gelöscht werden. Zunächst wird nur ein maschinell ermittelter Sprachcode eingetragen, mittelfristig auch einen zweiten und dritten Sprachcode geplant.

Der Sprachcode in UF $a wird für den Index SCT nur dann indexiert, wenn 010@ $E nicht vorhanden ist.

Codes

Liste der ISO-Sprachcodes:

Alphabetische Liste der Codes (Deutsche Benennung und Code) 

Systematische Liste der Code (Code und deutsche Benennung)

Codes, die keiner bestimmten Sprache zugeordnet sind:

mulzusammenfassender Code bei mehr als 3 Sprachen
miswird für bekannte Sprachen verwendet, für die es aber keinen Code gibt
undwenn die Sprache nicht bekannt ist
zxx kein linguistischer Inhalt 
$EKennzeichnung der Erfassungsart
aandere
iIntellektuell
mmaschinell
$HHerkunft
aeplc

durch die DNB vergebener Language Code (LC) aus der Averbis-Software (AEP) ; maschinelle Vergabe von Sprachencodes

dnb-paÜbernahme aus Parallelabgleich
ka...aus Digitalisierungsprozess
npidurch die DNB beim Import von Netzpublikationen übernommen

Beispiele

1500 /1ger 

1500 /1ger/3eng

1500 /1ger/1eng/1fre

1500 /1ger/3und

1500 /1ger/3pol [Erläuterung: Die Sprache der Expression des zugrundeliegenden Werks ist polnisch; für die Übersetzung der Ressource wurde eine englische Fassung des Werks zugrunde gelegt --> Angabe in /3pol nicht /3eng/3pol]

1500 /1ger/1mul

1500 /1mis/3ger

1500 /1zxx [kein sprachgebundenes Material]

Formatbeispiel für Erfassung maschinell ermittelter Sprachcodes:

1500 /1gre$Em$Haeplc$K0,554$D2017-03-07
1500 /1eng$Em$Haeplc$K0,511$D2017-03-07
1500 /1fre$Em$Haeplc$K0,478$D2017-03-07



Altdaten/Datenpflege


Codes

$E

Kennzeichnung der Erfassungsart

mmaschinell gebildet
$HHerkunft
aeplcdurch die DNB vergebener Language Code (LC) aus der Averbis-Software (AEP)

Beschreibung des Feldinhaltes

In Feld 1500 ist das RDA-Element "Sprache der Expression" abgelegt. Es enthält Angaben zu Sprache(n) des Inhalts einer Ressource sowie bei Übersetzungen Angaben zu  Sprache(n) des Originals in codierter Form gemäß DIN 2335/ISO 639-2/B.

Besteht die Ressource ausschließlich aus nicht nichtsprachlichem Inhalt, zum Beispiel Bilder oder Instrumentalmusik, wird ein entsprechender Code vergeben.

Sprache des Originals bei Übersetzungen meint die Originalsprache eines Werkes. Die Sprache, aus der die vorliegende Ressource übersetzt wurde, muss nicht immer die Originalsprache sein. Sofern das der Fall ist, wird ausschließlich die Originalsprache aufgeführt.

Für den Eintrag maschinell ermittelter Sprachcodes wurde das Feld um drei Unterfelder erweitert: $E (Kennzeichnung der Erfassungsart), $H (Herkunft), $K (Konfidenzwert maschinell ermittelter Sprachcode) und $D (Datum der automatisierten Erstellung). Die Unterfelder $E, $H und $D enthalten Provenienz-Informationen.

Im Unterfeld $E kann der Code m (= maschinell ermittelt) vergeben werden. Im Unterfeld $H wird die Bezeichnung des Prozesses angegeben, aus dem die Daten in PICA/CBS übernommen wurden. Der Prozess zur automatischen Ermittlung der Sprachcodes mit Hilfe der Erschließungssoftware wird mit dem Code aep-lc (= durch die DNB vergebener Language Code aus der Averbis-Software) beschrieben. Das Unterfeld $D zeigt das Datum der maschinellen Erstellung der Sprachcodes an. Das Unterfeld $K zeigt den Konfidenzwert an, mit dem die Software die Sprache der Ressource ermittelt hat. Das Unterfeld $K kann Werte zwischen 1,000 und 0,000 enthalten.

$EKennzeichnung der Erfassungsart
mmaschinell gebildet
$HHerkunft
aep-lcdurch die DNB vergebener Language Code (LC) aus der Averbis-Software (AEP)
Formatbeispiel für Erfassung maschinell ermittelter Sprachcodes:

1500 /1gre $Em $H aep-lc $K 0,554 $D 2017-03-07
1500 /1eng $Em $H aep-lc $K 0,511 $D 2017-03-07
1500 /1fre $Em $H aep-lc $K 0,478 $D 2017-03-07

Alte Beschreibung, Stand: 01.10.2010 

1. Datenfeld

Das Feld 1500 enthält Code-Angaben für die Sprache(n) der vorliegenden Veröffentlichung sowie bei Übersetzungen für die Sprache(n) des Originals.

Der Sprachencode wird seit März 2007 in allen neu anzulegenden Katalogisaten angegeben, auch wenn die Sprache nur Deutsch ist.

Einbezogen in die Sprachencodierung werden alle Arten von Veröffentlichungen und Publikationsmedien (z.B. auch Bildbände, Kunstbände, Karten, Videos, Kassetten, elektronische Publikationen, Medienkombinationen etc.) sowie alle Katalogisate, die DNB herstellt, unabhängig davon ob sie eine Bibliografieanzeige erhalten oder nicht.

Die Erfassung des Sprachencodes erfolgt in den Satzarten *a, *f und *F. Bei der Bearbeitung von fortlaufenden Sammelwerken in den Satzarten *dvz und *bvz ist die Angabe der Sprachencodes ebenfalls obligatorisch.

Anm.: Vor März 2007 wurden Sprachencodes nur teilweise vergeben: In allen DNB-Katalogisaten wurde der Sprachencode vom 1. Dezember 1995 bis Februar 2007 nur angegeben, wenn die Sprache der Veröffentlichung nicht Deutsch war und keine Übersetzung ins Deutsche vorlag. Bei fremdsprachigen Germanica und Übersetzungen deutschsprachiger Werke wurden Sprachencodes ab 1992 erfasst, bis Oktober 2010 in allen Satzarten.

Die folgenden Ausführungen in den Punkten 2 - 4 gelten für Monografien, Loseblattausgaben, Zeitschriftenstücktitel und Zeitschriftenbandsätze. Für fortlaufende Sammelwerke gelten besondere Regelungen, s. dazu Punkt 5.

2. Steuerzeichensyntax

s. Tabelle oben

Bei mehreren Sprachenangaben ist die Kennung vor jedem Sprachencode zu erfassen. Die Codes für die Sprache der vorliegenden Veröffentlichung werden vor denen für die Sprache des Originals angegeben.

3. Grundlage für die Sprachencodierung

Der Sprachencode bezieht sich auf die Sprachen des "Haupttextes" einer Veröffentlichung. Texte geringen Umfangs in anderen Sprachen (z.B. Zusammenfassungen, Abstracts, Vor- worte, Nachworte, Einleitungen, Bildunterschriften, kurze Erläuterungen sowie Beigaben, Beilagen, Texte der Benutzeroberfläche bei elektronischen Publikationen etc.) werden für die Vergabe des Sprachencodes in der Regel nicht berücksichtigt.

Ist jedoch eine Veröffentlichung z.B. eine Bibliografie oder ein Bibliothekskatalog oder besteht der wesentliche Teil einer Publikation nicht aus geschriebener oder gesprochener Sprache (betr. z.B. Bild- und Kunstbände, Bilderbücher, Karten, Audio-CDs etc.), bezieht sich die Angabe des Sprachencodes auf die Sprache(n) von Einleitungen, Vor- und Nachworten, Erläuterungen, Bildunterschriften, die "Rahmenbeschriftung" bei Karten u. dgl. Ist das nicht möglich (z.B. bei Bilderbüchern ohne Text), richtet sich der Sprachencode nach der Sprache des Titels der Veröffentlichung.

4. Umfang der Sprachencodierung

Es werden die Codes nach ISO 639-2/B verwendet. Die Angabe ist auf 3 Sprachencodes je Kennung begrenzt. Alphabetische Liste der Codes und alphabetische Lister der Sprachen: http://www.dnb.de/DE/Standardisierung/GND/gndArbeitshilfen.html

Codes, die keiner bestimmten Sprache zugeordnet sind:
"mul"            Wird ab vier Sprachen angegeben.
"mis"            Wird für bekannte Sprachen verwendet, für die es aber keinen Code gibt.
"und"            Ist die Sprache nicht bekannt, wird dieser Code erfasst.

Anm.: Intensive Nachforschungen zur Bestimmung einer Sprache sind nicht vorgesehen. 

4.1. Beispiele

1500    /1dut
1500    /1ger/1eng
1500    /1eng/3rus
1500    /1ger/3und
1500    /1mul
1500    /1mis/3ger
1500    /1ger/3mul      [Sammelwerk mit original deutschen Beiträgen und Übersetzungen aus mehr als 3 Sprachen]  

4.2. Originalsprache(n) bei Übersetzungen

a)       Der Sprachencode wird sowohl für die Sprache der vorliegenden Veröffentlichung als auch für die Originalsprache angegeben.
          1500   /1ger/3eng              (Übersetzung aus dem Englischen ins Deutsche)
          1500   /1eng/3rus              (Übersetzung aus dem Russischen ins Englische)

b)       Die Veröffentlichung enthält ein Werk sowohl im Originaltext als auch in Übersetzung.
          1500   /1ger/1eng/3eng     (die Originalsprache ist Englisch; Übersetzung ins Deutsche)
          1500   /1ger/1fre/3ger       (die Originalsprache ist Deutsch; Übersetzung ins Französische)

c)       Kommentar / Werk
          1500   /1ger/3spa              (der Kommentar und das kommentierte Werk sind aus dem Spanischen übersetzt)
          1500   /1ger/1lat/3eng       (der Kommentar ist eine Übersetzung aus dem Englischen ins Deutsche; die Veröffentlichung enthält das kommentierte Werk im lateinischen Originaltext)
          1500   /1ger/3eng/3lat       (der englische Kommentar und der lateinische Originaltext des kommentierten Werkes sind ins Deutsche übersetzt)
          1500   /1ger/1lat/3lat         (der Kommentar ist deutsch; das kommentierte Werk liegt im lateinischen Originaltext und in der deutschen Übersetzung vor)

d)       Beigefügte/enthaltene Werke bei begrenzten Sammelwerken.

          Die Einzelwerke der Veröffentlichung sind teilweise Übersetzungen aus verschiedenen Sprachen. Angegeben wird die Originalsprache für das Werk der Haupteintragung und das erste beigefügte Werk bzw. für die beiden aufgeführten enthaltenen Werke.
          1500   /1ger/3swe              (das Werk der Haupteintragung und das beigefügte Werk bzw. die beiden aufgeführten enthaltenen Werke sind Übersetzungen aus dem Schwedischen) 
          1500   /1ger/3dan/3nor      (das Werk der Haupteintragung ist aus dem Dänischen übersetzt, das beigefügte Werk bzw. eines der beiden aufgeführten enthaltenen Werke aus dem Norwegischen)
          1500   /1ger/3eng              (das Werk der Haupteintragung ist deutsch, das beigefügte Werk bzw. die beiden aufgeführten enthaltenen Werke sind Übersetzungen aus dem Englischen)

e)       Bei Parallelausgaben wird die Originalsprache nur dann angegeben, wenn in der Vorlage ein Übersetzungsvermerk vorhanden ist.  

5. Sprachencodierung bei fortlaufenden Sammelwerken

Bei fortlaufenden Sammelwerken werden nur die Sprachen der vorliegenden Veröffentlichung beschrieben. Für Datensätze von Schriftenreihen kann auch die Sprache des Sachtitels als Grundlage dienen. Hier liegt der Schwerpunkt der Codierung in den Datensätzen der zugehörigen Bände.

Es werden bis zu 3 Sprachen berücksichtigt jeweils eingeleitet mit /1...

Das Feld wird auch besetzt, wenn die Veröffentlichung in mehr als drei Textsprachen erscheint. Ergänzende Angaben (mehr als drei Sprachen o.ä.) werden in  Feld 4221 gemacht.
Es gelten die Sprachenlisten in ZETA G 251 und G 253. Diese Listen bilden eine in der ZDB gebräuchliche Auswahl an Sprachen ab.
Die Codes "mul", "mis" und "und" sind in den ZDB-Listen nicht enthalten und werden auch nicht verwendet. Kann auch anhand des Titels nicht entschieden werden, welcher Code verwendet werden muss, unterbleibt die Besetzung des entsprechenden ZDB-Feldes.

Link zur ZETA-Beschreibung:

http://www.zeitschriftendatenbank.de/erschliessung/arbeitsunterlagen/zeta/1500.html