Bei den sprachwissenschaftlichen Partnern, dem Institut für Deutsche Sprache in Mannheim sowie den sprachwissenschaftlichen Instituten der Universität Heidelberg, werden derzeit zahlreiche Forschungsprojekte umgesetzt. Bei Interesse oder Fragen wenden Sie sich bitte an die jeweiligen AnsprechpartnerInnen oder an die EZS-Geschäftsstelle.
Forschungsinfrastruktur
Die sprachwissenschaftlichen Partner, das Institut für Deutsche Sprache in Mannheim sowie die sprachwissenschaftlichen Institute der Universität Heidelberg, verfügen über umfangreiche Ressourcen, die für eine effektive und synergetische Untersuchung der europäischen Sprachen erforderlich sind. Bei Interesse an einzelnen Forschungsressourcen wenden Sie sich bitte an die jeweiligen AnsprechpartnerInnen; bei allgemeinen Fragen steht Ihnen die EZS-Geschäftsstelle gerne jederzeit zur Verfügung.
Die Forschungsinfrastruktur wird in Zukunft weiter ausgebaut. Dabei stehen insbesondere auch Fragen der Urheberrechte (Korpuszugang), der Netzkompatibilität (Schnittstellen zwischen einzelnen Instituten) sowie der Entwicklung von neuen Online-Portalen.
DeReKo + Cosmas II + CCDB (IDS)
Das Deutsche Referenzkorpus (DeReKo) am IDS ist die weltweit größte Sammlung deutschsprachiger Korpora als empirische Basis für die linguistische Forschung. Es umfasst derzeit 4,1 Milliarden fortlaufende Wörter, die digital aufbereitet (u.a. Wort- und Textannotationen) und größtenteils online der Forschungsgemeinde zur Verfügung stehen. Das Korpus enthält belletristische, wissenschaftliche und populärwissenschaftliche Texte, eine große Zahl von Zeitungstexten sowie eine breite Palette weiterer Textarten. DeReKo wird fortlaufende erweitert.
→ Zur ausführlichen Projekthomepage
Zugänglich sind die Texte aus DeReKo über die linguistische Online-Forschungs- und Analyseplattform Cosmas II. Cosmas bietet ausgefeilte Sortier- und Analysemethoden, um das Korpus für unterschiedlichste sprachwissenschaftliche Fragestellungen fruchtbar zu machen. Die Funktionalität umfasst neben zeilenbasierter Recherche (KWIC) und diverser Sortiermöglichkeiten auch komplexe Kookkurrenz- und Clusteranalysen. Die Daten werden grafisch aufbereitet, die Ergebnisse können in unterschiedlichen Formaten heruntergeladen werden.
→ Zur ausführlichen Projekthomepage
Die Kookkurrenzdatenbank (CCDB) schließlich bildet als große Sammlung von Kookkurrenzprofilen zu ca. 220.000 verschiedenen Lemmata eine solide Basis, um die im Sprachgebrauch manifesten emergenten Strukturen systematisch aufzudecken, zu inventarisieren, zu interpretieren und theoretisch zu begründen. Die Sammlung enthält zu jedem Lemma die Ergebnisse von bis zu fünf verschiedenen Kookkurrenzanalysen in Form von Hierarchien von ähnlichen Verwendungen, mit bis zu 100.000 Verwendungsbeispielen pro Lemma und Analyse.
→ Zur ausführlichen Projekthomepage
Thematische Korpora (Universität Heidelberg)
Folgende thematische Korpora liegen derzeit im Kontext des EZS vor und sind Teil von Analysen:
- Das Heidelberger Korpus (HeideKo)
Das Heidelberger Korpus beinhaltet aufgezeichnete und transkribierte Gesprächsbeiträge sowie schriftliche Texte zu gesellschaftlich relevanten Debatten (z.B. Bioethik-Diskurs, Bau und Fall der Mauer sowie Deutsche Einheit, Sterbehilfe/Palliativmedizin, Online-Durchsuchung, Interdisziplinäre Langzeitstudie zum Erwachsenenalter [= ILSE]). Es handelt sich dabei um ein thematisch zusammengestelltes, datenbankgestütztes und digital aufbereitetes Textkorpus zur interdisziplinären Untersuchung gesellschaftlicher Diskurse (vgl. Felder, Ekkehard / Müller, Marcus / Vogel, Friedemann (2010): Das Heidelberger Korpus – Gesellschaftliche Konflikte im Spiegel der Sprache. In: Zeitschrift für Germanistische Linguistik (ZGL) 38.2010, S. 314-319.). Das Heidelberger Korpus wird finanziert bzw. unterstützt vom Marsilius-Kolleg der Universität Heidelberg, von der FAZIT-Stiftung (Gemeinnützige Stiftung der Frankfurter Allgemeinen Zeitung), von Gruner + Jahr AG sowie der Zeitung Neues Deutschland.
Ausführliche Informationen erhalten Sie auf der Projekthomepage - Digitales Volltextkorpus zur Goethezeit
Das Korpus umfasst 400 deutschsprachige Autorinnen und Autoren der Zeit zwischen 1760 und 1840 mit mehr als 65.000 EinzelÂtexten (knapp 400.000 Druckseiten bzw. ca. 100 Mio. laufende Wortformen). Berücksichtigt werden u. a. theoretische Texte (Monographien, Abhandlungen usw.), literarische Texte, Briefe, TageÂbücher sowie zeitgenössische Nachschlagewerke. Der weitaus größte Teil der Quellen liegt in digitalisierter Form vor und bietet damit uneingeschränkte RechercheÂmöglichkeiten.
Ausführliche Informationen erhalten Sie auf der Projekthomepage
Multi- und Monolinguale bzw. Parallele Korpora (IDS und Universität Heidelberg)
Im Kontext des EZS stehen zahlreiche multilinguale und parallele Korpora für die linguistische Forschungs zur Verfügung.
- Multilingale und parallele Korpora aus dem Kontext computerlinguistischer Forschung (Ãœberblick)
- Digitalisierte Korpora zum L1-/L2-Erwerb in verschiedenen Sprachen, experimentell erhoben (Ansprechpartner: Prof. Dr. Christiane von Stutterheim)
- Diverse fachsprachliche elektronische Korpora Italienisch / Deutsch (Ansprechpartner: Prof. Dr. Giovanni Rovere)
- Diverse englischsprachige (historische, varietätenspezifische u.a.) Korpora (Ansprechpartnerin: Prof. Dr. Beatrix Busse; Übersicht der Korpora)
- Umfassende Korpora zur zeitgenössischen und historischen Sprache des Russischen, zukünftig verfügbar über die russischen Partner an der Moskauer Staatsuniversität (Ansprechpartnerin: Prof. Dr. Jadranka Gvozdanović)
Gesprächskorpora
Neben klassischen Textkorpora entstehen im Kontext des EZS auch größere Gesprächs- bzw. Transkriptkorpora. Hierzu zählen unter anderem:
- Archiv für Gesprochenes Deutsch (AGD)
Das Archiv für Gesprochenes Deutsch am IDS archiviert als größte Sammlung von Korpora des gesprochenen Deutsch (mehr als 17.000 Aufnahmen) die bei einzelnen Spracherhebungen und in Forschungsprojekten erstellten Korpora und stellt sie der Forschung für die weitere wissenschaftliche Auswertung zur Verfügung. Die Korpora, zu denen auch FOLK (Forschungs- und Lehrkorpus gesprochenes Deutsch) gehört, stehen ebenfalls über Cosmas II zur Verfügung. Zur Verbesserung der Datenqualität im AGD wurden in gesonderten Teilprojekten besondere Datenstandards (wie GAT 2.0) und Transkriptionstools (z.B. FOLKER) entwickelt und frei zugänglich gemacht. Ausführliche Informationen erhalten Sie auf der Projekthomepage (Ansprechpartner: Prof. Dr. Arnulf Deppermann) - ILSE-Korpus
Das ILSE-Korpus ist Teil des Heidelberger Korpus am Germanistischen Seminar der Universität Heidelberg. Es enthält Transkripte zu semistandardisierten biographischen Interviews mit 1002 Probanden zu bisher drei verschiedenen Messzeitpunkten und bildet zusammen mit über 10.000 zeitgleich erhobenen Metadaten die Grundlage für ILSE – die Interdisziplinäre Längsschnittstudie des Erwachsenenalters.
Mit dem Institut für Computerlinguistik Heidelberg und dem Programmbereich Korpuslinguistik am IDS stehen der sprachwissenschaftlichen Forschung weit entwickelte Software zur Verfügung. Hierzu zählen unter anderem Processors (Tokenizer, Tagger, Parser, Aligners usw.), Preprocessors und diverse Lingware (Lexika, Grammatiken usw.).
Im Kontext der Kooperation von IDS und Universität Heidelberg bündelt das EZS insgesamt acht umfangreiche Institutsbibliotheken und stellt damit auch für viele GastwissenschaftlerInnen aus aller Welt eine komfortable Arbeitsumgebung bereit. Daneben befinden sich folgende Spezialressourcen derzeit im Aufbau:
- Namenkundliche Bibliothek und namenkundlicher Nachlass Seibicke
als Grundlage für eine im Aufbau befindliche Namenberatung sowie als Teil der „Bibliothek des Klassikerwörterbuchs“ (Ansprechpartner: Prof. Dr. Jörg Riecke) - Bibliothek des Klassikerwörterbuchs
(Ansprechpartner: Prof. Dr. Jörg Riecke)
Folgende Online-Plattformen werden im IDS entwickelt und bereitgestellt:
- Umfassende Spezialbibliographien
zur Grammatik, zu Konnektoren, Präpositionen, zur Gesprächsforschung sowie zur elektronischen Lexikographie. - grammis und Progr@mm
bieten als grammatische Informations-, Nachschlage- und (Fremdsprachen-) Lernerportale eine umfassende Grundlage für die linguistische Lehre und Forschung. (Projekthomepages zu grammis und Progr@mm) - OWID – Online-Wortschatz-Informationssystem Deutsch des IDS
mit den Teilportalen elexiko, Neologismenwörterbuch, Feste Wortverbindungen und Diskurswörterbuch 1945-1955 (Nähere Informationen auf der Projekthomepage) - E-VALBU – Das elektronische Valenzwörterbuch deutscher Verben
In E-VALBU, dem Valenzwörterbuch des IDS, liegt das Gewicht vor allem auf der inhaltlichen und formalen Erfassung der Umgebung der behandelten Verben (Valenzinformationen). (Projekthomepage) - Gesprächsanalytisches Informationssystem (GAIS)
bietet umfassende Informationen zum gesprächsanalytischen Arbeitskontext (Projekthomepage)
Für kognitions- bzw. psycholinguistische Untersuchungen steht im Kontext des EZS ein Eye-Tracking-Labor mit Labor-Manager zur Verfügung (Ansprechpartner: Prof. Dr. Christiane von Stutterheim)