We're sorry but this page doesn't work properly without JavaScript enabled. Please enable it to continue.
Feedback

Drei Fragen an Expert:innen - Warum arbeiten Sie mit Korpora?

00:00

Formale Metadaten

Titel
Drei Fragen an Expert:innen - Warum arbeiten Sie mit Korpora?
Serientitel
Anzahl der Teile
3
Autor
Lizenz
CC-Namensnennung - Weitergabe unter gleichen Bedingungen 4.0 International:
Sie dürfen das Werk bzw. den Inhalt zu jedem legalen Zweck nutzen, verändern und in unveränderter oder veränderter Form vervielfältigen, verbreiten und öffentlich zugänglich machen, sofern Sie den Namen des Autors/Rechteinhabers in der von ihm festgelegten Weise nennen und das Werk bzw. diesen Inhalt auch in veränderter Form nur unter den Bedingungen dieser Lizenz weitergeben.
Identifikatoren
Herausgeber
Erscheinungsjahr
Sprache
Produzent

Inhaltliche Metadaten

Fachgebiet
Genre
Abstract
In diesem ersten Teil der dreiteiligen Videoserie "3 Fragen an Expert:innen" beantworten Korpuslinguist:innen aus verschiedenen Forschungsdisziplinen die Frage "Warum arbeiten Sie mit Korpora?".
Schlagwörter
Besprechung/Interview
Besprechung/Interview
Besprechung/Interview
Besprechung/Interview
Besprechung/Interview
Besprechung/Interview
Besprechung/Interview
Besprechung/InterviewComputeranimation
Transkript: Deutsch(automatisch erzeugt)
Womit sonst wäre meine erste Antwort gewesen? Die zweite Antwort ist, weil Sprache einfach anders aussieht, wenn man den Zugang zu ganz vielen Daten hat, die man auswerten kann.
Das ist tatsächlich ein bisschen geklautes Zitat von John Sinclair, ein Pionier der Corpus und mein eigener Anteil noch ganz zum Schluss als Antwort hinten dran ist, dass wir eigentlich ganz gut damit den Prozess simulieren können, wie wir selber Sprache erworben haben, weil wir aus Daten heraus unser ganzes Sprachvermögen heraus abgeleitet haben.
Ja, ich möchte mit einem kleinen Beispiel beginnen. Vor ein paar Jahren bin ich immer wieder auf die Redewendung, das Leben ist kein Ponyhof gestoßen. Ich habe mich ein bisschen gewundert, denn ich kannte nur, das Leben ist kein Wunschkonzert und auch die einschlägigen Redewendungswörterbücher haben mich in meiner Intuition bestätigt. Aber meine Kinder meinten mit einem Augenzwinkern, ich wäre wohl nicht mehr ganz auf dem Laufenden. Der Ponyhof-Spruch ist
echt geläufig. Dann habe ich meinen Orakel, das Corpus befragt und ich musste meinen Kindern Recht geben. Etliche Ponyhof-Satzbelege waren zu finden, die ersten 2002, Tendenz steigend. Aber so ganz unrecht hatte ich auch nicht. Das Wunschkonzert kann in Bezug auf die Häufigkeit
noch mithalten. Was die Corpore aber auch zeigten, war, dass es eine große Vielfalt an Varianten gibt. Das Leben ist kein Spiel, Film, Tanzlokal oder Streichelzoo. Augenscheinlich hat sich das Schema das Leben ist kein X im Sprachgedächtnis verfestigt und es ist klar, dass es sich nicht nur um
sprachspielerische Vorlieben handelt, sondern um Muster. Solche Informationen kann man mit der Sprachintuition kaum gewinnen. Dazu brauchen wir die Corpora. Man muss seine eigenen Sprachkompetenz misstrauen. Das habe ich in vielen Jahren gelernt. Jeder hat eine eigene Sprachbiografie. Keiner ist in allen Dialektgebieten, Gruppen und Sondersprachen zu Hause. Sprache wandelt sich stetig und wir
sehen immer nur einen kleinen Sprachausschnitt. Deswegen können wir rein intuitiv nicht beurteilen, ob eine Abwandlung, die einem mehrfach begegnet, nur eine vorübergehende Mode ist oder schon in den Wortschatz aufgenommen wurde. Ein wichtiges Ziel meiner Forschung ist, typischen Sprachgebrauch zu entdecken und zu beschreiben. Typischer Sprachgebrauch bedeutet, dass bestimmte sprachliche
Einheiten verteilt über viele Texte und Zeitverläufe auf dieselbe Art und Weise eingesetzt werden. Corpora als Sammlung riesiger Textmengen helfen genau dabei, das zu erkennen, visualisierten Sprachgebrauch von Singulären zu unterscheiden und vor allgemeinerbarer Aussage über Sprache
treffen zu können. Sie bieten eben oft neue Einsichten von Dingen, die sich unserem Blick vorher verschlossen haben. Also ich interessiere mich vor allen Dingen dafür, wie sich die Sprache verändert. Entweder über den Lauf der Zeit oder über verschiedene Kontexte, wie zum Beispiel verschiedene wissenschaftliche Disziplinen oder verschiedene Sprechergruppen hinweg und dafür,
um das zu untersuchen, braucht man typischerweise viele Texte und Methoden, um diese Texte auch untersuchen zu können und deswegen mache ich Corpus Linguistik. Als Computerlinguisten interessieren wir uns für ein Spektrum von Fragen, die von Ingenieurwissenschaftlichen Ansätzen,
also Sprachtechnologie bis hin zu psycholinguistischen Fragen, also Sprache und über die menschliche Sprachverarbeitung reichen und zentral für alle diese Fragen ist im Grunde menschliche Sprachproduktion, menschliches Sprachverständnis. Das heißt, wir brauchen Daten darüber, wie Menschen Sprache konkret verwenden und die finden wir in Corpora.
Eigentlich ist die Antwort ganz einfach, weil es mir Spaß macht. Aber natürlich gibt es auch noch ein bisschen tiefer liegende Gründe. Wir können, wenn wir mit Corpora arbeiten, Datenmengen bewältigen, die wir lesend eben nicht bewältigen könnten. Und selbst wenn wir die Daten lesen würden,
dann würden wir viele Dinge nicht bemerken, die man eben nur mit computergestützten Methoden überhaupt bemerken kann.