Korpora des Sonderforschungsbereichs 538 Mehrsprachigkeit

Die folgende Tabelle gibt einen Überblick über alle Korpora, die zwischen 1999 und 2011 am Sonderforschungsbereich 538 Mehrsprachigkeit erstellt wurden und nun vom Hamburger Zentrum für Sprachkorpora (HZSK) gepflegt werden. Klicken Sie auf Mehr Information, um detaillierte Angaben zur Größe eines Korpus, zu den Zugangbedingungen etc. zu erhalten.
Der Großteil der Korpora sind EXMARaLDA-Korpora. Um mehr über EXMARaLDA-Korpora zu erfahren, empfehlen wir einen der folgenden Schritte:

Die Beantragung von Korpuszugängen erfolgt ab sofort direkt im Korpus-Repositorium.

Korpusname
Projekt / Dateninhaber
Typ

Kurzbeschreibung

Schlüsselwörter

Sprache(n)
Hamburg Adult Bilingual Language (HABLA)Mehr Information
E11 / Tanja Kupisch
spoken/audio/exmaralda
Audioaufnahmen (semispontane Interviews) mit deutsch/italienisch und deutsch/französisch zweisprachigen Sprechern, etwa zwischen 15-55 Jahren. Die simultanen Zweisprachigen mit Deutsch und Französisch/Italienisch als L1 wurden für jede Sprache einmal aufgenommen. Die konsekutiven Zweisprachigen mit Deutsch als L1 und Französisch/Italienisch als L2, oder Französisch/Italienisch als L1 und Deutsch als L2, haben alle einen Erwerbsanfang von 11 bis 38 Jahren und wurden in ihrer L2 aufgenommen. L2-Daten
Querschnittsdaten
Spracherosion
Zweisprachigkeit bei Erwachsenen
konsekutive Zweisprachigkeit
simultane Zweisprachigkeit
German, Standard (deu), French (fra), Italian (ita),
Hamburg Corpus of Polish in Germany (HamCoPoliG)Mehr Information
H8 / Bernhard Brehmer
spoken/audio/exmaralda
Semispontane Daten (3 Themen) und Erzählung einer Bildergeschichte (aus: 'Vater und Sohn') von bilingualen (Polnisch und Deutsch) und monolingualen (Polnisch) Erwachsenen (16-46 Jahre). L1-Daten
Querschnittsdaten
Spracherosion
Zweisprachigkeit bei Erwachsenen
Zweitspracherwerb bei Erwachsenen
kindlicher Zweitspracherwerb
konsekutive Zweisprachigkeit
simultane Zweisprachigkeit
Polish (pol),
Hamburg Corpus of Argentinean Spanish (HaCASpa)Mehr Information
H9 / Christoph Gabriel
spoken/audio/exmaralda
Audio- und Videoaufnahmen von spontansprachlichen und laborphonologischen Daten von erwachsenen Sprechern des Porteño-Spanischen (Alter 18-69) aus zwei geographischen Gebieten Argentiniens (mittels u.a. Lesetext, Nacherzählung, gelesene Frage-Antwort-Paare, Intonationsfragebogen, freie Interviews und MapTask); insgesamt 7 Teilexperimente. Das in den Experimenten als Stimuli verwendete Material ist in den Transkriptionen als Annotation festgehalten. Kontaktvarietät
Querschnittsdaten
Sprachkontakt
regionale Varietät
Spanish (spa),
Dolmetschen im Krankenhaus (DiK)Mehr Information
K2 / Kristin Bührig, Bernd Meyer
spoken/audio/exmaralda
Audioaufnahmen verschiedener Arten von Arzt-Patienten-Kommunikation im Krankenhaus. Monolinguale Gespräche auf Deutsch, Portugiesisch und Türkisch im jeweiligen Land aufgenommen, sowie gedolmetschte Gespräche (Deutsch-Türkisch, Deutsch-Portugiesisch und Deutsch-Portugiesisch/Spanisch) in Deutschland aufgenommen, etwa 15-20 Aufnahmen pro Kategorie. Die dolmetschenden Personen sind zweisprachige Pflegekräfte oder Familienangehörige der Patienten, alle leben in Deutschland, verfügen jedoch über unterschiedliche Kompetenzen im Deutschen. Arzt-Patienten-Kommunikation
Kommunikation in Institutionen
Konsekutivdolmetschen
Laiendolmetschen
gedolmetschte Kommunikation
German, Standard (deu), Portuguese (por), Turkish (tur),
Consecutive and Simultaneous Interpreting (CoSi)Mehr Information
K6 / Bernd Meyer
spoken/audio+video/exmaralda
Audio- und Videoaufnahmen von drei simultan und konsekutiv gedolmetschten Vorträgen, professionell vom Portugiesischen ins Deutsche gedolmetscht. Für den simultan-gedolmetschten Vortrag sind verschiedene Aufnahmen und Transkriptionen für die Teilnehmer vorhanden. Experten-Laien-Kommunikation
Konsekutivdolmetschen
Simultandolmetschen
professionelles Dolmetschen
German, Standard (deu), Portuguese (por),
Community Interpreting Database Pilot Corpus (ComInDat)Mehr Information
ComInDat / Philipp Angermeyer, Kristin Bührig, Bernd Meyer
spoken/audio+video/exmaralda
Audio- und Videoaufnahmen verschiedener Typen gedolmetschter Kommunikation (Arzt-Patienten-Kommunikation, simulierte Arzt-Patienten-Kommunikation, Gerichtskommunikation) in deutschen (simulierte und authentische Arzt-Patienten-Kommunikation) und US-Amerikanischen (Gerichtskommunikation) Institutionen. Die Community Languages der Laiendolmetscher sind jeweils unterschiedlich. Videoaufnahmen sind nur für die simulierten Gespräche vorhanden. Für die authentische Arzt-Patienten-Kommunikation werden keine Audiodateien zur Verfügung gestellt. Arzt-Patienten-Kommunikation
Community Interpreting
Gerichtskommunikation
Kommunikation in Institutionen
Laiendolmetschen
gedolmetschte Kommunikation
German, Standard (deu), English (eng), Haitian (hat), Polish (pol), Portuguese (por), Russian (rus), Spanish (spa), Turkish (tur),
EXMARaLDA Demo CorpusMehr Information
Z2 / Hamburger Zentrum für Sprachkorpora
spoken/audio+video/exmaralda
Kurze Audio- und Videoaufnahmen in verschiedenen Sprachen zur Demonstration des EXMARaLDA-Systems. German, Standard (deu), English (eng), French (fra), Italian (ita), Norwegian (nor), Polish (pol), Spanish (spa), Swedish (swe), Turkish (tur), Vietnamese (vie),
Hamburg Map Task Corpus (HAMATAC)Mehr Information
Z2 / Hamburger Zentrum für Sprachkorpora
spoken/audio/exmaralda
Audioaufnahmen von Map-Tasks mit erwachsenen Deutschlernern. Die L1-Sprachen der Sprecher und ihre L2-Kompetenz variieren. Die für die Aufgabe verwendeten Karten stehen zur Verfügung. L2-Daten
Lernerkorpus
Map-Task
Zweisprachigkeit bei Erwachsenen
Zweitspracherwerb bei Erwachsenen
aufgabenorientierte Kommunikation
konsekutive Zweisprachigkeit
simultane Zweisprachigkeit
German, Standard (deu),
Deutscher und Französischer doppelter Erstpracherwerb (DUFDE)Mehr Information
E2 / Jürgen Meisel
spoken/video/exmaralda
Videoaufnahmen (Longitudinalstudie) von sieben französisch-deutsch bilingualen Kindern im Alter von 1 Jahr;6 Monate bis 6 Jahre;11Monate (+ einzelne spätere Aufnahmen). In jeder Aufnahme (Interviewer-Kind-Interaktion) wird das Kind jeweils in einem Teil auf Französisch und in einem auf Deutsch angesprochen. L1-Daten
L2-Daten
Longitudinaldaten
kindliche Zweisprachigkeit
kindlicher Spracherwerb
simultane Zweisprachigkeit
German, Standard (deu), French (fra),
Bilingualer Portugiesisch-Deutscher Erstpracherwerb (BIPODE)Mehr Information
E2 / Jürgen Meisel
spoken/video/exmaralda
Video-Aufnahmen (Longitudinalstudie) von drei portugiesisch-deutsch simultan-bilingualen Kindern im Alter von 1 Jahr;6 Monate bis 5 Jahre;6 Monate. Jede Interviewer-Kind-Interaktion gliedert sich in einen portugiesischen und einen deutschen Teil, in denen das Kind jeweils in der entsprechenden Sprache angesprochen wird. L1-Daten
L2-Daten
Longitudinaldaten
kindliche Zweisprachigkeit
kindlicher Spracherwerb
simultane Zweisprachigkeit
German, Standard (deu), Portuguese (por),
Parameterfixierung im Deutschen und Spanischen (PAIDUS)Mehr Information
E3 / Conxita Lleó
spoken/audio/exmaralda
Vergleichende Longitudinalstudie (Audioaufnahmen) zum monolingualen kindlichen Spracherwerb in Deutsch und Spanisch von jeweils fünf deutsch- und fünf spanischsprachigen monolingualen Kindern. Es liegen für die deutschsprachigen Kinder etwa 30 Aufnahmen (Interviewer-Kind-Interaktion) pro Kind vor, die im Durchschnitt ab einem Lebensalter von 9 Monaten beginnen und bis zum 3. Lebensjahr andauern. Für die spanischsprachigen Kinder liegen im Durchschnitt 15 Aufnahmen pro Kind bis zum 2. Lebenjahr vor. Longitudinaldaten
kindlicher Spracherwerb
monolinguale Daten
German, Standard (deu), Spanish (spa),
PhonBLA Longitudinalstudie HamburgMehr Information
E3 / Conxita Lleó
spoken/audio+video/exmaralda
Longitudinalstudie (Audio- und Videoaufnahmen) zum bilingualen deutsch-spanischen Erstspracherwerb von vier Kindern ab einem Alter von etwa 1 Jahr; 6 Monaten bis zum 6.-7. Lebensjahr. Pro Kind liegen etwa 100 Aufnahmen (Interviewer-Kind-Interaktion) vor, zur Hälfte jeweils auf Deutsch bzw. Spanisch. L1-Daten
L2-Daten
Longitudinalstudie
kindliche Zweisprachigkeit
kindlicher Spracherwerb
simultane Zweisprachigkeit
German, Standard (deu), Spanish (spa),
Phonologie-Erwerb Deutsch-Spanisch als Erste Sprachen (PEDSES)Mehr Information
E3 / Conxita Lleó
spoken/audio/exmaralda
Longitudinalstudie zum simultanen bilingualen deutsch-spanischen Erstspracherwerb von drei Kindern ab einem Alter von etwa 1 Jahr bis zum 2. bzw. 3. Lebensjahr. Pro Kind liegen 20-50 Aufnahmen (Interviewer-Kind-Interaktion) vor, jeweils zur Hälfte auf Deutsch bzw. Spanisch. Longitudinaldaten
kindliche Zweisprachigkeit
kindlicher Spracherwerb
simultane Zweisprachigkeit
German, Standard (deu), Spanish (spa),
Phon-CL2Mehr Information
E3 / Conxita Lleó
spoken/audio/exmaralda
Audioaufnahmen von 15 deutschen Probanden/Kindern in Spanien (im Alter von 5 bis 36 Jahren), die ab einem Alter von zwei Jahren Spanisch als zweite Sprache erworben haben oder erwerben. Bei den spanischsprachigen Aufnahmen handelt es sich um Bildbennungen und Geschichtenerzählungen etc. Zahlreiche Metadaten zum Sprachgebrauch und -verhalten innerhalb der Familien (von den Eltern angegeben). L2-Daten
kindliche Zweisprachigkeit
kindlicher Spracherwerb
kindlicher Zweitspracherwerb
konsekutive Zweisprachigkeit
konsekutive Zweisprachigkeit
German, Standard (deu), Spanish (spa),
Catalan in a bilingual context (PhonCAT)Mehr Information
H6 / Conxita Lleó
spoken/audio/exmaralda
Elizitierte, gelesene und spontansprachliche Daten (Audioaufnahmen) von Sprechern des Katalanischen (L1) aus Barcelona, stratifiziert nach Stadtteilen und Alter (drei Altersgruppen) der Sprecher. Alter der Sprecher variiert zwischen 5 und 45 Jahren. L1-Daten
Querschnittsdaten
Sprachkontakt
Zweisprachige Gesellschaft
Zweisprachigkeit bei Erwachsenen
kindliche Zweisprachigkeit
kindlicher Zweitspracherwerb
konsekutive Zweisprachigkeit
simultane Zweisprachigkeit
Catalan-Valencian-Balear (cat),
Skandinavische Semikommunikation (SkandSemiko)Mehr Information
K5 / Kurt Braunmüller
spoken/audio/exmaralda
Audioaufnahmen von Sprechern einer skandinavischen Sprache, die in ihren jeweiligen Muttersprachen interagieren. Aufnahmen aus verschiedenen Kontexten: Zweisprachige Radioaufnahmen (vornehmlich aus der Öresund-Region), Diskussionen von einer Konferenz einer Nordischen Organisation, Aufnahmen aus dem Unterricht einer skandinavischen Schule in Deutschland, zwei semispontane Gespräche zwischen dänischen und norwegischen Teenagern und Aufnahmen aus einem Dänischkurs für schwedische Studenten in Südschweden. Die meisten Sprecher sind Muttersprachler des Dänischen, Schwedischen oder Norwegischen mit unterschiedlicher rezeptiver Kompetenz in den jeweils anderen, wohingegen z.B. isländische Muttersprachler skandinavische Sprachen als Fremdsprachen gebrauchen. Sprachen. Jugendsprache
Semikommunikation
Spracherwerb bei Erwachsenen
kindliche Zweisprachigkeit
rezeptive Mehrsprachigkeit
Danish (dan), Norwegian (nor), Swedish (swe),
ALCEBLAMehr Information
E3 / Conxita Lleó
spoken/audio/exmaralda
Spanischsprachige Audioaufnahmen von 23 spanisch-deutsch simultan-bilingualen Kindern, die in Deutschland leben und dort einen spanischen Ergänzungsunterricht besuchen. 1-6 Aufnahmen pro Kind, mit 11 von ihnen auch vor Beginn des spanischen Ergänzungsunterrichts. Bei allen Aufnahmen handelt es sich um elizitierte Sprache, wie Bildbenennungen, Geschichtenerzählungen, morphosyntaktische Aufgaben, lexikalische Aufgaben und HAVAS 5. Zahlreiche Metadaten zum Sprachgebrauch und -verhalten innerhalb der Familien (Angaben der Eltern). kindliche Zweisprachigkeit
kindlicher Spracherwerb
simultane Zweisprachigkeit
German, Standard (deu), Spanish (spa),
Simuliertes Dolmetschen im Krankenhaus (SimDik)Mehr Information
T5 / Kristin Bührig, Bernd Meyer
spoken/audio+video/exmaralda
Simulationen von gedolmetschten Arzt-Patienten-Gesprächen (Audio- und Videoaufnahmen) mit den Sprachenpaaren Polnisch-Deutsch, Rumänisch-Deutsch und Russisch-Deutsch. Die Dolmetscher sind bilinguale Angestellte in Krankenhäusern, die an einem Dolmetscher-Trainingsprogramm teilnehmen, welches im Rahmen des Projektes entwickelt wurde und auf DiK-Daten basiert. Arzt-Patienten-Kommunikation
Experten-Laien-Kommunikation
Kommunikation in Institutionen
Konsekutivdolmetschen
Laiendolmetschen
gedolmetschte Kommunikation
German, Standard (deu), Polish (pol), Romanian (ron), Russian (rus),
CHILD-L2Mehr Information
E2 / Jürgen Meisel
spoken/video/exmaralda
Videoaufnahmen von Kindern, die im Alter zwischen drei und vier Jahren das Französische oder Deutsche als zweite Sprache lernen. In einigen Familien werden weitere Sprachen gesprochen, hauptsächlich Englisch. Bei den Aufnahmen in Form von Interviewer-Kind-Interaktion wird mit dem Kind in seiner jeweiligen L2 interagiert. Im Durchschnitt handelt es sich pro Kind um Daten von zwei Sitzungen pro Jahr über einen Zeitraum von zwei Jahren. L2-Daten
Longitudinaldaten
kindliche Zweisprachigkeit
kindlicher Spracherwerb
kindlicher Zweitspracherwerb
konsekutive Zweisprachigkeit
German, Standard (deu), French (fra),
Zweitspracherwerb Italienischer und Spanischer Arbeiter (ZISA)Mehr Information
E2 / Jürgen Meisel
spoken/audio/exmaralda
Audioaufnahmen von fünf erwachsenen L2-Lernern des Deutschen mit Spanisch, Italienisch bzw. Portugiesisch als L1. Es handelt sich um Interviews bzw. Konversationen auf Deutsch, die ein bis zwei Mal im Monat ab der 3. - 14. Woche nach ihrer Ankunft in Deutschland über einen Zeitraum von etwa zwei Jahren stattgefunden haben. L2-Daten
Lernerkorpus
Longitudinaldaten
Zweisprachigkeit bei Erwachsenen
Zweitspracherwerb bei Erwachsenen
konsekutive Zweisprachigkeit
German, Standard (deu),
Baskischer und Spanischer doppelter Erstspracherwerb (BUSDE)Mehr Information
E2 / Jürgen Meisel
spoken/video/other
Longitudinalstudie (Videoaufnahmen) zum Spracherwerb bei baskisch-spanisch bilingualen Kindern ab einem Alter von etwa 1 Jahr;6 Monaten. Ein bis zwei Aufnahmen (Interviewer-Kind-Interaktion) pro Monat bis zu einem Alter von etwa 5 Jahren. Longitudinaldaten
kindliche Zweisprachigkeit
kindlicher Spracherwerb
Basque (eus), Spanish (spa),
PhonBLA Querschnittsstudie MadridMehr Information
E3 / Conxita Lleó
spoken/audio+video/exmaralda
Querschnittsstudie (Videoaufnahmen) zum simultanen bilingualen deutsch-spanischen Erstspracherwerb von 71 in Madrid (Spanien) lebenden Kindern. Für die meisten Kinder liegen die Aufnahmen (Interviewer-Kind-Interaktion) sowohl in Deutsch als auch Spanisch vor. L1-Daten
L2-Daten
Querschnittsdaten
kindliche Zweisprachigkeit
kindlicher Spracherwerb
simultane Zweisprachigkeit
German, Standard (deu), Spanish (spa),
PhonMASMehr Information
E3 / Conxita Lleó
spoken/audio/exmaralda
Audioaufnahmen (Interviewer-Kind-Interaktion) von monolingualen spanischen Kindern zwischen 2 und 6 Jahren. Die Aufnahmen entstanden in fünf verschiedenen Jahren, 11 Kinder wurde in zwei unterschiedlichen Jahren aufgenommen (Vergleichsdaten zu Madrid-PhonBLA). Querschnittsdaten
kindlicher Spracherwerb
monolinguale Daten
Spanish (spa),
TÜ_DE-cL2-KorpusMehr Information
E4 / Monika Rothweiler
spoken/video/exmaralda
Deutschsprachige Videoaufnahmen (Spontansprache und elizitierte Sprache) von acht sukzessiv-bilingualen Kindern mit der Erstsprache (L1) Türkisch und Zweitsprache (L2) Deutsch erworben ab dem 3. bis 4. Lebensjahr. Aufnahmen erfolgten über einen Zeitraum von 7-28 Monaten im Alter von 3 bis 6,5 Jahren. Der Fokus wurde auf den Artikelgebrauch gelegt. (Vergleichsdaten zu TP-DE-L1-Korpus). L2-Daten
Longitudinaldaten
kindliche Zweisprachigkeit
kindlicher Spracherwerb
kindlicher Zweitspracherwerb
konsekutive Zweisprachigkeit
German, Standard (deu),
TÜ_DE-L1-KorpusMehr Information
E4 / Monika Rothweiler
spoken/audio/exmaralda
Audioaufnahmen (Spontansprache und elizitierte Sprache) auf Türkisch von zwölf sukzessiv-bilingualen Kindern mit der Erstsprache (L1) Türkisch und Zweitsprache (L2) Deutsch, Erwerb ab einem Alter von 3-4 Jahren. (Vergleichsdaten zu TÜ_DE_cL2-Korpus). L1-Daten
kindliche Zweisprachigkeit
kindlicher Spracherwerb
kindlicher Zweitspracherwerb
konsekutive Zweisprachigkeit
Turkish (tur),
Rehbein-ENDFAS/Rehbein-SKOBI-KorpusMehr Information
E5 / Jochen Rehbein
spoken/audio/exmaralda
Audioaufnahmen von evokativen Feldexperimenten (Bildergeschichte, Nacherzählung, spontaner Diskurs etc.) mit deutsch-türkisch bilingualen und deutsch bzw. türkisch monolingualen Kindern als Kontrolldaten. Kontaktvarietät
L1-Daten
L2-Daten
Monolinguale Daten
kindliche Zweisprachigkeit
kindlicher Spracherwerb
German, Standard (deu), Turkish (tur),
ENDFAS/SKOBI Gold StandardMehr Information
E5 / Jochen Rehbein
spoken/audio/exmaralda
Audioaufnahmen von einem deutsch-türkisch bilingualen Kind (5 Jahre), einem deutsch monolingualen (7 Jahre) sowie einem türkisch monolingualen Kind (8 Jahre). Demonstrationsausschnitt aus dem größeren Rehbein-ENDFAS/Rehbein-SKOBI-Korpus. Kontaktvarietät
L1-Daten
L2-Daten
Monolinguale Daten
kindliche Zweisprachigkeit
kindlicher Spracherwerb
German, Standard (deu), Turkish (tur),
Faroese Danish Corpus Hamburg (FADAC Hamburg)Mehr Information
K8 / Kurt Braunmüller
spoken/audio/exmaralda
Audioaufnahmen von halbstrukturierten Interviews auf Färöisch und Dänisch mit bilingualen Sprechern (Alter 16-89) aus verschiedenen Regionen der Färöer-Inseln. Bei 37 der 56 Probanden gibt es Aufnahmen sowohl in ihrer L1 Färöisch als auch ihrer L2 Dänisch. Kontaktvarietät
L1-Daten
L2-Daten
Querschnittsdaten
Sprachkontakt
Zweisprachigkeit bei Erwachsenen
halbstrukturierte Interviews
konsekutive Zweisprachigkeit
zweisprachige Gesellschaft
Danish (dan), Faroese (fao),
Hamburg Corpus of Old Swedish with Syntactic Annotations (HaCOSSA)Mehr Information
H3 / Kurt Braunmüller
written/tei
Religiöse (biblische, liturgische, literarische Texte) und weltliche Prosa (literarische Texte), Rechtstexte auf Altschwedisch historische Texte
übersetzte Texte
Old Swedish (swe),
Covert translation: popular scienceMehr Information
K4 / Juliane House
written/tei
Übersetzungs- und Vergleichskorpus mit authentischen populärwissenschaftlichen Texten. Parallelkorpus
Populärwissenschaftstexte
Vergleichskorpus
übersetzte Texte
German, Standard (deu), English (eng),
Covert Translation: business communication (old)Mehr Information
K4 / Juliane House
written/tei
Übersetzungs- und Vergleichskorpus mit authentischen Texten aus der Wirtschaftskommunikation. Parallelkorpus
Populärwissenschaftstexte
Vergleichskorpus
Wirtschaftskommunikation
übersetzte Texte
German, Standard (deu), English (eng),
Covert Translation: business communication (new)Mehr Information
K4 / Juliane House
written/tei
Übersetzungs- und Vergleichskorpus mit authentischen Texten aus der Wirtschaftskommunikation. Parallelkorpus
Populärwissenschaftstexte
Vergleichskorpus
Wirtschaftskommunikation
übersetzte Texte
German, Standard (deu), English (eng),