Skip to main content
Thematic issue articles

WIKIPEDISTIK IN VERMITTLUNGSKONTEXTEN DES DAF-/ DAZ-UNTERRICHTS: KOLLABORATIVE TEXTPRODUKTION MITHILFE VON CMC-KORPORA ANALYSIEREN UND REFLEKTIEREN

Author: Eva Gredel orcid logo (Universität Duisburg-Essen)

  • WIKIPEDISTIK IN VERMITTLUNGSKONTEXTEN DES DAF-/ DAZ-UNTERRICHTS: KOLLABORATIVE TEXTPRODUKTION MITHILFE VON CMC-KORPORA ANALYSIEREN UND REFLEKTIEREN

    Thematic issue articles

    WIKIPEDISTIK IN VERMITTLUNGSKONTEXTEN DES DAF-/ DAZ-UNTERRICHTS: KOLLABORATIVE TEXTPRODUKTION MITHILFE VON CMC-KORPORA ANALYSIEREN UND REFLEKTIEREN

    Author:

Abstract

Mit der Digitalisierung ist die kollaborative Textproduktion über Social Software in Vermittlungskontexten in den Fokus gerückt und hat in Zeiten von Distance Teaching weiter an Relevanz gewonnen. Ein Typ von Social Software, der die kollaborative Textproduktion ermöglicht, ist die Software MediaWiki, die etwa der Wikipedia zugrunde liegt. Mit den Wikipedia-Korpora des Leibniz-Instituts für Deutsche Sprache (IDS) sind Prozesse der Kollaboration in Form großer digital verfügbarer Datenmengen empirisch zugänglich. Dieser Beitrag zeigt anhand didaktischer Szenarien auf, wie die Wikipedia-Korpora des IDS im DaF-/DaZ-Unterricht genutzt werden können, um sprachliche Phänomene in Wikipedia mithilfe von CMC-Korpora zu analysieren.


With digitization, collaborative text production via social software has come into focus indidactic contexts and has gained further relevance in times of “distance teaching”. One type of social software enabling collaboration is the MediaWiki software, which is the basis of Wikipedia. Via the Wikipedia corpora of the Leibniz Institute for the German Language (IDS), the processes of collaborative text production is accessible via digitally available datasets. This article shows how these corpora can be used in didactic contexts of German as a Foreign Language lessons in order to analyse collaboration with the help of CMC corpora.

Keywords: Korpuslinguistik, Corpus Literacy, Wikipedia, kollaborative Textproduktion, internetbasierte Kommunikation, corpus linguistics, corpus literacy, collaborative text production, computer mediated communication

How to Cite:

Gredel, E., (2021) “WIKIPEDISTIK IN VERMITTLUNGSKONTEXTEN DES DAF-/ DAZ-UNTERRICHTS: KOLLABORATIVE TEXTPRODUKTION MITHILFE VON CMC-KORPORA ANALYSIEREN UND REFLEKTIEREN”, Korpora Deutsch als Fremdsprache 1(2), 74–94. doi: https://doi.org/10.48694/tujournals-83

849 Views

207 Downloads

Published on
2021-12-20

Peer Reviewed

1. Einleitung

Im Jahr des 20. Jubiläums der Online-Enzyklopädie Wikipedia soll in diesem Beitrag anhand der Wikipedia-Korpora des IDS aufgezeigt werden, welches Potential der Einsatz von CMC-Korpora1 im DaF-/DaZ-Unterricht bietet. In diesem Zusammenhang werden drei didaktische Szenarien vorgestellt, die bereits in universitären Lehrveranstaltungen erprobt wurden. Wikipedia eignet sich dabei aus mehreren Gründen als Untersuchungsgegenstand: Mit insgesamt 295 Sprachversionen, steht die Wikipedia Internetnutzer*innen weltweit zur digitalen Informationssuche zur Verfügung und erfreut sich international großer Bekanntheit und Beliebtheit. Mit rund 55 Millionen online-enzyklopädischen Einträgen (Wikimedia 2020) deckt Wikipedia zudem ein breites Spektrum unterschiedlichster Themen ab. Dies ermöglicht es in DaF-/DaZ-Kontexten, didaktische Szenarien an den Interessen verschiedener Gruppen zu orientieren. Durch die hypertextuelle Verknüpfung der Sprachversionen werden Diskussionen zu den Inhalten der Wikipedia auch transnational geführt (vgl. Gredel 2018), was den Sprach- und Kulturvergleich sprachlicher Muster internetbasierter Kommunikation zulässt.

Zwischenzeitlich kann die Wikipedia als etablierte digitale Plattform verstanden werden, die über Social Software die kollaborative Textproduktion Tausender Autor*innen fördert. In Zeiten von Distance Teaching wird die Relevanz kollaborativer Textproduktion über digitale Tools und auf digitalen Plattformen in verschiedensten Vermittlungskontexten (Schule und Hochschule) sowie auch in beruflichen Kontexten (etwa in Unternehmen und auch in der Wissenschaft) deutlich: So sind Wikis auf Lernplattformen wie Moodle, Ilias oder OLAT typische Elemente, die zur kollaborativen Textproduktion zum Einsatz kommen. Begleitend zur Kompetenz, in der eigenen Muttersprache auf digitalen Plattformen zu interagieren, zeigt dieser Beitrag, wie diese Kompetenzen mithilfe der Wikipedia-Korpora auch in DaF-/DaZ-Kontexten thematisiert werden können. Ziel ist es dann, Lernenden auch über ihre Muttersprache hinaus digitale Teilhabe zu ermöglichen. Wie der Einsatz der Wikipedia-Korpora die Fremdsprachendidaktik bereichern kann, soll anhand der folgenden Fragen bearbeitet werden:

  1. Welche Möglichkeiten bieten die Wikipedia-Korpora für die Fremdsprachendidaktik?

  2. Welche didaktischen Szenarien können mithilfe der Wikipedia-Korpora realisiert werden?

  3. Wie kann die Korpusanalyse-Software COSMAS II genutzt werden, um Sprach- und Metadaten zu analysieren?

Die folgenden didaktischen Szenarien wurden im Kontext verschiedener Seminare im universitären Kontext erprobt.2 Es soll nun zunächst beschrieben werden, wie die konkreten didaktischen Szenarien strukturiert und in größere Seminareinheiten integriert werden können.

2. Einbettung der linguistischen Wikipedistik in universitäre Lehrveranstaltungen

Mit der Verbreitung der Wikipedia hat sich ein Forschungsfeld herausgebildet, das unter dem Begriff Wikipedistik „die wissenschaftliche Beschäftigung mit dem Phänomen Wikipedia im Speziellen und mit Wikis im Allgemeinen“ (Wiktionary 2021) fasst. Die im Folgenden fokussierte linguistische Wikipedistik ist der Teilbereich der Wikipedistik, der sich mit der Wikipedia aus einer linguistischen Perspektive beschäftigt (vgl. Gredel / Herzberg / Storrer 2018). Die Wikipedia-Korpora des IDS stellen in diesem Kontext eine zentrale Ressource dar, die den empirischen Zugriff auf (Sprach-)Daten der Wikipedia eröffnet.

Die in Abschnitt 4 vorgestellten didaktischen Szenarien wurden an der Universität Mannheim im M.A.-Hauptseminar „Digitale Methoden in der Linguistik“, im B.A.-Hauptseminar „Linguistische Wikipedistik“ und im B.A.-Hauptseminar „Wikipedia aus text- und diskurslinguistischer Perspektive“ durchgeführt. An den Seminaren nahmen Studierende teil, die zwei Gruppen zuzurechnen sind, die als Akteur*innen der hier besprochenen Fremdsprachendidaktik zu verstehen sind: Dies waren einerseits Studierende in Lehramtsstudiengängen. Zum anderen waren es Studierende des binationalen Studiengangs „Intercultural German Studies“ sowie Austauschstudierende, die als DaF-/DaZ-Lernende der Niveaus A2/B1 des europäischen Referenzrahmens einzustufen sind. Für Lernende dieser Sprachniveaus ist die Arbeit mit Korpora sinnvoll (vgl. Blauth-Henke / Heinz 2009; Flinz / Katelhön 2019; Flinz 2020) und wurde für DaF-/DaZ-Kontexte beschrieben und empfohlen (vgl. Lüdeling / Walter 2010; Makowiec 2016; Nolting / Radtke 2019). Ein zentrales Argument für den hier vorgeschlagenen Einsatz von Korpus-Daten in der Fremdsprachendidaktik ist deren Authentizität (vgl. Edelhoff 1985: 7; Chudak / Nardi 2016: 50; Imo / Weidner 2018: 233). Bisher wurde allerdings v.a. der Einsatz von Korpora geschriebener Sprache aus Zeitungen (vgl. Wallner 2016) sowie die Nutzung von Korpora, die gesprochene Sprache enthalten, für die Fremdsprachendidaktik diskutiert (vgl. Imo / Moraldo 2015; Imo / Weidner 2018). Die Integration eines dritten Typs, nämlich CMC-Korpora, lässt sich mit der vielfach beschriebenen Relevanz digitaler Medien (vgl. Autorengruppe Bildungsbericht 2020: 231) begründen.

Die Arbeit mit den Korpora war in einen fünfgliedrigen Aufbau der Seminare folgendermaßen eingebettet: Zu Beginn wurde in einer ersten Phase (Hinführung zum Thema und Digital Literacy) mit den Studierenden eine Einstiegsreflexion zur Wikipedia durchgeführt, um abzufragen, welches Vorwissen vorhanden ist. Konkrete Fragen dieser Einstiegsreflexion waren:

  1. Wie häufig nutzen Sie die Wikipedia?

  2. Welche positiven / negativen Erfahrungen haben Sie mit der Wikipedia gemacht?

  3. Haben Sie zur Wikipedia bereits als Autor*in beigetragen?

  4. Welche Sprachversionen der Wikipedia haben Sie außer der deutschen schon genutzt?

  5. Welche sprachlichen Aspekte der Wikipedia würden Sie interessieren?

Die Mehrheit der Studierenden gab an, die Wikipedia regelmäßig bei Wissensfragen im Alltag zu nutzen, hatte jedoch noch nie selbst als Autor*innen zur Wikipedia beigetragen, was sich mit den Ausführungen zu digitalen Kompetenzen von Digital Natives deckt (vgl. Würffel 2020: 221). Durch die Einstiegsreflexion wurde deutlich, dass die Studierenden den Aufbau der Wikipedia mit den verschiedenen Namensräume3 nicht kennen, was aber für die Arbeit mit den Wikipedia-Korpora zentral ist (vgl. Gredel 2021). Deshalb wurde vor der eigentlichen Nutzung von CMC-Korpora der Aufbau der Wikipedia thematisiert.

Um den Studierenden in der zweiten Phase (Theoretische Hintergründe) Spezifika von (Sprach-)Daten in CMC-Korpora zu verdeutlichen, wurde ein erweiterter Textbegriff eingeführt, der auch für Hypertexte mit Eigenschaften wie Non-Linearität, Dynamik und Multimodalität angemessen ist (vgl. Storrer 2018). Durch den Abgleich der unterschiedlichen Namensräume wurden anhand von Beispielen aus den Wikipedia-Originaldaten die Unterschiede des textorientierten Schreibens auf den Artikelseiten gegenüber dem interaktionsorientierten Schreiben auf den Diskussionsseiten der Wikipedia transparent gemacht (vgl. Storrer 2013).

In der dritten Phase des Seminars (Methodische Grundlagen) wurde abgefragt, inwieweit die Studierenden bereits Corpus Literacy (vgl. Mukherjee 2002) im Studium erwerben konnten. Corpus Literacy kann dabei als „multicomponential set of complex skills“ (Callies 2019: 247) verstanden werden. Zentrale Fragen sind:

  1. Können Studierende grundlegende Konzepte der Korpuslinguistik verstehen?

  2. Können Studierende Korpus-Daten mit Korpusanalyse-Software untersuchen?

  3. Können Studierende Sprach- und Metadaten in Korpora interpretieren?

Die Korpora wurden in der vierten Phase (Empirische Korpusanalysen) im Sinne des „Forschenden Lernens“ (Huber 2013: 11) im Rahmen von empirischen Studienprojekten genutzt, wobei alle Stufen korpuslinguistischen Arbeitens von der Konzeption der Fragen, über die Auswahl geeigneter Suchstrings bis zur Ergebnispräsentation durch die Studierenden in Gruppen eigenständig erarbeitet wurden. In der fünften Phase (Ergebnispräsentation) sollten die Studierenden ihre Projekte in den drei o.g. Seminaren in verschiedenen Formen präsentieren: Neben Kurzpräsentationen in einem Seminar hatten die Studierenden in einem anderen die Möglichkeit, im Rahmen einer Poster-Session ihre Ergebnisse mit Wikipedia-Autor*innen sowie Wissenschaftler*innen zu diskutieren. Im dritten Seminar wurden Ergebnisse in ein Wiki der Lernplattform Ilias eingestellt.

3. Die Wikipedia-Korpora des IDS

Die Wikipedia-Korpora des IDS, die über COSMAS II zur Verfügung stehen, können für nicht-kommerzielle Zwecke (also auch für didaktische Kontexte) kostenlos mit Hilfe von COSMAS II durchsucht und analysiert werden. Im Archiv „WP – Wikipedia Artikel u. Artikeldiskussionen & Benutzerdiskussionen 2013/2015/2017“ sind Daten aus verschiedenen Bereichen der Wikipedia vertreten, wobei hier die Daten der Korpora von 2017 aufgeführt werden sollen: Neben den bekannten Artikelseiten (wpd17 mit 873 Mio. Tokens), die den enzyklopädischen Kern der Wikipedia darstellen, sind dies auch Artikeldiskussionen (wdd17 mit 349 Mio. Tokens), Benutzerdiskussionen (wud17 mit 309 Mio. Tokens) sowie Redundanzdiskussionen (wrd17 mit 177 Mio. Tokens).

Insbesondere die drei Korpora mit den verschiedenen Typen an Diskussionsseiten (wdd17, wud17 und wrd17) können mit ihrer dialogisch-interaktionalen Struktur der IBK zugerechnet werden.

Im Hauptmenü findet sich die Möglichkeit der An- bzw. Abmeldung in COSMAS II Abb. 1, 1 und das Menü „Optionen“ (Abb. 1, 3), wo unter dem Reiter „Ergebnispräsentation“ die automatische Berechnung und Darstellung von Häufigkeitsmaßen aktiviert werden kann. Das Menü ist jedoch beim Reiter „Recherche“ (Abb. 1, 2) zu finden, der bei der Korpusanalyse durch die möglichen Analyseschritte in COSMAS II leitet (Abb. 1, A-I). Für die Beispielanalysen sind die folgenden Elemente des Menüs „Recherche“ zentral: Unter Abb. 1, A sollte für die didaktischen Szenarien in Abschnitt 4 das Archiv „WP - Wikipedia Artikel u. Artikeldiskussion & Benutzerdiskussion 2013/2015/2017“ (Abb. 1, J) ausgewählt werden. Im nächsten Menüpunkt „Korpus“ bietet es sich an, das vordefinierte Korpus „WP17-gesamt – alle Korpora des Archivs WP17 „Artikel u. Artikel- & Benutzerdiskussion 2017“ zu nutzen. Unter dem Menüpunkt „Suche“ geht es darum, eine Suchanfrage einzugeben und zu starten. Bevor die Lernenden ihre Recherche beginnen, soll motiviert werden, warum ein bestimmter Suchstring für die Beantwortung der fokussierten Fragestellung angemessen ist. Hier ist der Hinweis auf die Online-Hilfe von COSMAS II für die Lernenden wichtig, um sich in die Syntax für Suchanfragen einzuarbeiten. Bei der Korpusrecherche zu Wortsegmenten sind die Platzhalter besonders wichtig. Die „Wortformliste“ (Abb. 1, D) ist für die vernetzte Wortschatzarbeit in Abschnitt 4.1 hilfreich und sollte nicht grundsätzlich abgewählt werden, wie dies in anderen Studien zum didaktischen Einsatz von COSMAS II beschrieben wird (vgl. Makowiec 2016: 55). Unter diesem Reiter können etwa Wortbildungsprodukte eingesehen und an- oder abgewählt werden. Beim Menüpunkt Ergebnisse (Abb. 1, E) können bei der Ergebnispräsentation mit der Trefferansicht für die jeweilige Suchfrage ausgegebenen Treffer nach verschiedenen Kriterien sortiert werden. Für die folgenden didaktischen Szenarien ist die sogenannte Korpusansicht besonders hilfreich, bei der die Treffer aus dem Korpus „WP17-gesamt – alle Korpora des Archivs WP17, Artikel u. Artikel- & Benutzerdiskussion 2017“ nach ihrer Herkunft aus den vier Teilkorpora wpd17, wdd17, wrd17 sowie wud17 aufgeteilt werden. So eröffnen etwa die Treffer aus den drei zuletzt genannten Teilkorpora den Blick auf die diskursive Aushandlung bestimmter Termini auf den verschiedenen Diskussionsseiten der Wikipedia. Die Kookkurrenzanalyse (Abb. 1, F) ist für die Analyse in Abschnitt 4.3 relevant, wohingegen die Menüpunkte „Gesamt-KWIC“ (Abb. 1, G) und „Gesamt-Volltext“ (Abb. 1, H) für die Exploration der Treffer in allen drei didaktischen Szenarien wichtig sind. Die Export-Funktion (Abb. 1, I) ermöglicht Studierenden die weitergehende Analyse der Treffer etwa über AntConc (2021).

Abbildung 1
Abbildung 1

Menü „Recherche“ in COSMAS II. Quelle: COSMAS II4.

4. DaF-/DaZ-Unterricht und Wikipedistik: Didaktische Szenarien zur Nutzung von CMC-Korpora am Beispiel der Wikipedia

Im Folgenden werden drei didaktische Szenarien im Detail beschrieben, über die Studierende mit den Wikipedia-Korpora Aspekte der kollaborativen Textproduktion korpuslinguistisch analysieren und reflektieren können. Die Szenarien adressieren dabei sprachliche Phänomene ganz unterschiedlicher Ebenen von Morphemen über syntagmatische Muster bis hin zur Analyse diskursiver Einheiten.

4.1 Vernetzte Wortschatzarbeit: Morphologisches Wissen und Diskursfähigkeit korpuslinguistisch trainieren

Die Software COSMAS II bietet die Möglichkeit, auch unterhalb der Wortebene auf Einheiten zuzugreifen, die für das Verstehen von neuen Elementen des Wortschatzes relevant sind. Unter dem Label „vernetzte Wortschatzarbeit“ soll hier ein entsprechendes didaktisches Szenario vorgestellt werden. Für die selbstständige Erschließung potentiellen Wortschatzes empfehlen Horstmann / Settinieri / Freitag (2020) für die Fremdsprachendidaktik Folgendes: „[W]ir können Lerner*innen darin trainieren, in unbekanntem Wortschatz bekannte Elemente zu identifizieren, die ihnen dann bei der Texterschließung helfen können“ (Horstmann / Settinieri / Freitag 2020: 154). Solche Elemente können neben Wortstämmen wie {Klima} auch Wortbildungsaffixe wie {keit} und {itis} oder Konfixe (etwa -man- und -phob-) sein, die über bestimmte Wortbildungsstrategien zu frequenten Wortbildungsprodukten führen. Mithilfe von Operatoren bzw. Platzhaltern der jeweiligen Korpusanalyse-Software kann gezielt nach solchen Elementen gesucht werden, um Lernenden Regelmäßigkeiten und auch Besonderheiten der Wortbildung im Deutschen zu vermitteln.

Interessant ist an den gewählten Beispiel auch, dass sich an die morphologisch motivierte Seminareinheit diskursanalytische Überlegungen zu aktuellen und relevanten Themen wie etwa zum Klimadiskurs bzw. zum europapolitischen Diskurs anfügen lassen, wobei die Diskursfähigkeit der Lernenden geübt werden kann: „An Verhandlungen und Aushandlungen, an Diskursen (in der Fremdsprache) teilnehmen und dabei die eigene Identität und Persönlichkeit, aber auch das eigene Verantwortungsbewusstsein für Entwicklungen auf der Welt stärken zu können, ist das Ziel von Lehr- und Lern- als Bildungsprozessen“ (Hille 2015: 110).

4.1.1 Nominale Determinativkomposita mit {Klima}

Sicherlich ist der Klimawandel eines der Themen, das in den letzten Jahren Diskurse weltweit bestimmte. Auffällig ist in öffentlichen Debatten die enorme Zahl an Determinativkomposita, die mit dem Erstglied {Klima} gebildet werden. Die Fragen, die Lernende in einer ersten Korpus-Studie untersuchen können, lauten deshalb: Welche nominalen Determinativkomposita des Typs N+N mit {Klima} als Erstglied kommen in den Wikipedia-Korpora vor? Werden diese Komposita auf den Diskussionsseiten der Wikipedia kontrovers verhandelt?

Der Suchstring, der für diese Fragestellung geeignet ist, ist Klima*. Er erlaubt es, Wortgebilde aus WP17 abzufragen, die neben dem Erstglied {Klima} ein bzw. mehrere Wortsegmente mit beliebig vielen Zeichen abfragen. Nutzt man das Korpus WP17 mit dem o.g. Suchstring gibt COSMAS II insgesamt 4.133 Wortformen in 91.880 Treffern aus, was bei der relativen Frequenz einem pMW-Wert5 von 56.33 entspricht. Nicht alle ausgegebenen Wortgebilde sind tatsächlich N+N-Komposita (z.B. klimatisch) und können deshalb aussortiert werden. Zudem sind auch nicht alle N+N-Komposita interessant für diskurslinguistischen Überlegungen (z.B. Klimaanlage). Unter den häufigsten nominalen Determinativkomposita, die als diskursive Einheiten des Klimadiskurses gesehen werden können, finden sich die Folgenden:

(1) Klimawandel(s), (2) Klimaschutz, (3) Klimadiagramm(e), (4) Klimazone(n), (5) Klimatabelle, (6) Klimaerwärmung, (7) Klimaforschung, (8) Klimadaten, (9) Klimaskeptiker, (10) Klimapolitik, (11) Klimaforscher, (12) Klimaveränderung, (13) Klimageschichte, (14) Klimaklassifikation, (15) Klimamodelle

Aus der Perspektive der Morphologie können mit DaF/DaZ-Lernenden die Besonderheiten der Interpretation von N+N-Komposita thematisiert werden. Meibauer et al. (2015: 52) verweisen auf Folgendes: „Die Interpretation von N+N-Komposita ist schwieriger, als es zunaächst erscheint“ (Meibauer et al. 2015: 52). Beispielhaft sei hier das Kompositum Klimaskeptiker genannt, das mit den zugehörigen Wortformen in Mediendiskursen zum Klimawandel häufig verwendet wird und allein im ausgewählten Wikipedia-Korpus in den Jahren von 2007 bis 2017 insgesamt 823-mal vorkommt (pMW = 0,505), wenn man den Suchstring &Klimaskeptiker nutzt.

In den Duden online (2021) hat das Kompositum jedoch noch keinen Eingang gefunden. Hier lohnt sich also eine weitergehende Recherche etwa im Rahmen empirischer Projekte der Studierenden, um das Kompositum auch als diskursive Einheit näher zu betrachten. Die Exploration der ausgegebenen Sprachdaten kann über die Trefferliste zum Suchstring &Klimaskeptiker erfolgen. Unter dem Menüpunkte „Ergebnisse“ des Menüs „Recherche“ findet sich die Ergebnispräsentation mit der Trefferansicht. An diesem Punkt können die Treffer nach bestimmten Ansichten sortiert werden. Aufschlussreich bei den Wikipedia-Korpora ist beispielsweise die „Korpusansicht“, die für &Klimaskeptiker verfügbar ist:

Tabelle 1

Ergebnisse der Suchanfrage &Klimaskeptiker. Eigene Darstellung.

Suchanfrage &Klimaskeptiker Treffer Rel. Häuf. (pMW) Jahre
WDD17: Artikeldiskussionen 567 1,519 2007 bis 2017
WPD17: Artikel 174 0,187 2013 bis 2017
WUD17: Benutzerdiskussionen 82 0,251 2007 bis 2017
Summe 823 0,505 2007 bis 2017

Klimaskeptiker ist ein Wortbildungsprodukt, das ab 2007 auf den Diskussionsseiten der Wikipedia genutzt wird und seit 2013 auch auf den enzyklopädischen Artikelseiten vorkommt. Die absolute und relative Häufigkeit auf den Artikeldiskussionsseiten ist im Vergleich allerdings am größten. Wie die unten exemplarisch aufgeführten Belege zeigen, wird mithilfe des Kompositums eine bestimmte (extreme) Position innerhalb des Diskurses benannt und vielfach auch kritisch beleuchtet:

  • (1) „Klimaskeptiker“ ist ein polemischer politischer Kampfbegriff, der eingeführt wurde, um „gute“ dogmakonforme „Klimaforscher“ von „bösen“ das Dogma gefährdenden Personen abzuheben und letzteren die Wissenschaftlichkeit abzusprechen. (WDD17/G68.69516)

  • (2) Überarbeitung abgebrochen und entfernt. Schon allein die Formulierung „Der gesamte Planet wird zum größten Teil zur leblosen Steinwüste“ (nein, auch bei 6 °C verdampft der Ozean noch nicht!) wäre ein Fest für jeden Klimaskeptiker. So etwas in dem Artikel geht gar nicht. (WDD17/F43.58670)

  • (3) Ach und noch was: 1998 war das Jahr mit dem stärksten je gemessenen El Nino. Und bei El Nino ist das Meer großflächig wärmer, was die „gemessenen Temperaturen“ nach oben treibt. Das ist eben auch der Grund, warum Klimaskeptiker immer genau dieses Jahr als Referenz nehmen, um damit „zu belegen“, es sei seither nicht wärmer geworden (WDD17/G68.69516)

Das erste Beispiel verdeutlicht mit der metsprachlichen Besprechung von Klimaskeptiker („polemischer politischer Kampfbegriff“) einen didaktischen Vorteil der hier genutzten Wikipedia-Korpora: Insbesondere die Diskussionsseiten mit der Dialogizität sowie ihrer im Vergleich zu Diskursen in Printmedien höheren Polyphonität und Kontroversität (vgl. Gredel 2018) eröffnen den Blick auf die diskursive Aushandlung sprachlicher Einheiten.

4.1.2 Derivation und Kombination: Nachhaltigkeit

Eine zentrale diskursive Einheit im Klimadiskurs ist auch der Ausdruck nachhalten: Ausgehend vom Verb nachhalten haben sich die Derivate nachhaltig und Nachhaltigkeit herausgebildet und verbreitet. Ursprünglich in der Forstwirtschaft zum Umgang mit der Ressource Holz als Handlungsmaxime gesetzt, wurde der Begriff in politischen Diskursen aufgegriffen und kommt dann auch in journalistischen Texten vor (vgl. Henn-Memmesheimer et al. 2012: 182). Im DaF-/DaZ-Unterricht sollten zunächst die Grundlagen zur Derivation erläutert werden. Dabei kann die digitale Ressource „Wörterbuch der Affixe“ in grammis (2021) hilfreich sein, um dort die Spezifika der Affixe {ig} und {keit} näher zu betrachten.

Abbildung 2
Abbildung 2

Screenshot aus dem Wörterbuch der Affixe zu {keit}. Quelle: grammis (2021).

Dort wird {ig} als Suffix beschrieben, das Verben zu Adjektiven transponiert und {keit} als Suffix, das wiederum Adjektive in Nomen überführt (grammis 2021). Neben den Derivaten nachhaltig sowie Nachhaltigkeit selbst können wiederum Komposita mit Nachhaltigkeit (Suchstring: Nachhaltigkeit*) untersucht werden, um Themen des Nachhaltigkeitsdiskurses über frequente Wortbildungsprodukte zu eruieren:

(1) Nachhaltigkeitsinitiative, (2) Nachhaltigkeitsstrategie, (3) Nachhaltigkeitspreis, (4) Nachhaltigkeitsmanagement, (5) Nachhaltigkeitsbericht, (6) Nachhaltigkeitsforschung, (7) Nachhaltigkeitskriterien, (8) Nachhaltigkeitspreises, (9) Nachhaltigkeitswissenschaft, (10) Nachhaltigkeitsindikatoren, (11) Nachhaltigkeitsrat, (12) Nachhaltigkeitspolitik, (13) Nachhaltigkeitsberichte, (14) Nachhaltigkeitsstrategien, (15) Nachhaltigkeitsfaktor

Die Treffer belegen, dass das Thema Nachhaltigkeit in ökonomischen Diskursen relevant ist (Nachhaltigkeitsmanagement) und dort sogar Handlungsrelevanz erlangt hat, was sich etwa an der Thematisierung der neuen Textsorte der Nachhaltigkeitsberichte zeigt, die insbesondere in börsennotierten Unternehmen verfasst werden, um Stakeholder über die Nachhaltigkeitsstrategie des Unternehmens zu informieren (vgl. Gredel 2017). Anhand dieser Korpusstudie kann beispielhaft die Wortbildungsstrategie der Derivation sowie die Kombination von Derivaten zu komplexen Komposita thematisiert werden. Zudem ermöglichen die Ergebnisse der Korpusabfrage die intensive Beschäftigung mit dem Nachhaltigkeitsdiskurs auf der digitalen Plattform Wikipedia.

4.1.3 Kontamination

Es soll nun noch ein didaktisches Szenario zur korpuslinguistischen Analyse von Kontamination skizziert werden. Es handelt sich um eine Wortbildungsstrategie, die sich unter anderem in (europa-)politischen Diskursen auch über Einzelsprachen hinaus großer Beliebtheit erfreut (z.B. Teuro, Eurosklerose, Brimain, Bregret). Insbesondere Kontaminationen mit dem Bestandteil {exit} bzw. {xit} prägten in den letzten Jahren Diskurse zur europäischen Desintegration. Wortbildungsprodukte, die mit diesen Segmenten gebildet wurden, waren etwa Brexit, Grexit oder Italexit, die auf das (mögliche) Ausscheiden von EU-Mitgliedsstaaten aus der EU oder aus der Euro-Zone verweisen. Für solche Wortbildungsprodukte können im DaF-/DaZ-Unterricht Suchanfragen an die Wikipedia-Korpora formuliert werden. Zuletzt wurden auch Wortbildungsprodukte nach diesem Muster verwendet, die nicht in direktem Zusammenhang mit Europapolitik stehen (z.B. Me(g)xit als Kontamination aus Meghan und Exit), aber sich in zeitlicher Kopräsenz zur europäischen Desintegration ereigneten. Das WP17 gibt insgesamt 502 Treffer aus, was einem pMW von rund 0,308 entspricht.

Tabelle 2

Ergebnisse zur Suchanfrage Brexit. Eigene Darstellung.

Suchanfrage Brexit Treffer Texte pMW
WPD 17: Artikel 254 159 0,51
WDD 17: Artikeldiskussionen 189 63 0,27
WRD17: Redundanzdiskussionen 21 1 10,76
WUD17: Benutzerdiskussionen 38 37 0,12
Summe 502 260 0,31

Sehr aufschlussreich für diskursanalytische Überlegungen ist dann der qualitative Blick in den Volltext der Treffer des Korpus wdd17, wo dies besonders kontrovers diskutiert wird:

  • (4) Brexit als Artikeltitel finde ich nicht optimal, weil das doch eine relativ neue Wortschöpfung ist. In dem Artikel sollte es meiner Ansicht nach aber um die Diskussionen um den Austritt des Vereinigten Königreichs aus der EU bzw. EWG allgemein gehen. Diese Diskussionen fingen schon 1973 […] an, als der Begriff „Brexit“ noch nicht existierte. (WDD17/E95.05426)

  • (5) Den Artikel völlig ohne Hinweise auf den Brexit stehen zu lassen, ist allerdings auch nicht erstrebenswert. […] Es wäre nur konsistent, wenn man einen Abschnitt „Austrittskandidaten“ hinzufügt und dort das UK listet. (WDD17/E95.36851)

  • (6) Grexit: Ausstieg aus dem Euro, Brexit: Ausstieg aus der EU. Zwei verschiedene Dinge über dieselbe Kofferwort Bildung abzuhandeln ist recht ungeschickt und sollte in der Wikipedia nicht übernommen werden (WDD17/E95.05426)

Auch hier werden die fokussierten Wortbildungsprodukte metasprachlich thematisiert und deren diskursive Relevanz und Angemessenheit problematisiert, was für DaF-/DaZ-Lernende besonders aufschlussreich ist. In (6) wird sogar darauf verwiesen, dass mit einem ähnlichen Muster der Wortbildungsstrategie auf unterschiedliche Vorgänge referiert wird, was im Diskurs irreführend sein könnte. Die bereits o.g. fremdsprachigen Wikipedia-Korpora ermöglichen es dann auch, in kontrastiv konzipierten Diskursanalysen zu betrachten, ob es in anderen Sprachen ähnlich gelagerte Schlag- und Schlüsselwörter gibt, in welcher Frequenz diese in anderen Sprachversionen der Wikipedia vorkommen und ob diese auf den Diskussionsseiten metasprachlich und diskursiv verhandelt werden (vgl. Gredel 2018). Auch die Suche nach Konfixen bzw. Konfixderivaten wie {manie} oder {phobie} ist über COSMAS II und die Wikipedia-Korpora gut möglich (vgl. Gredel / Flinz 2020). Deutlich wird in solchen morphologischen Analysen der Wikipedia-Korpora, dass diese Wortbildungseinheiten beim interaktionsorientierten Schreiben mit einem sehr viel größeren Spektrum an Basen kombiniert werden, als dies in Zeitungstexten der Fall ist (vgl. Gredel / Flinz 2020). Durch die korpuslinguistisch fundierte Zusammenschau von Wortbildungsprodukten zu einer bestimmten Wortbildungsstrategien im Sinne der vernetzten Wortschatzarbeit erwerben die Studierenden die Kompetenz, ausgehend von frequenten Wortbildungsprodukten (z.B. Brexit) auch innovative und weniger verbreitete Wortbildungsprodukte (z.B. Öxit) verstehen und deuten zu können. In Vermittlungskontexten bietet es sich an, ausgehend von einzelnen durch die Dozierenden ausgewählten Texten die genannten Kontaminationen wie Brexit, Grexit, Italexit aus einer morphologischen Perspektive zu besprechen. Für empirisch fundierte Mini-Projekte können die Lernenden in Gruppen eingeteilt werden, wobei jede Gruppe ein konkretes Wortbildungsprodukt für eine Korpusstudie auswählt, um korpusgestützt morphologische, semantische und diskursanalytische Aspekte der jeweils fokussierten Wortbildungsprodukte zu untersuchen. Im Rahmen einer (moderierten) Postersession können dann die Ergebnisse zu den Gruppenarbeiten im Plenum zusammengeführt werden. Durch diese Zusammenschau der Ergebnisse ist es möglich, Gemeinsamkeiten und auch Unterschiede der einzelnen Wortbildungsprodukte nach den Prinzipien der vernetzten Wortschatzarbeit herauszuarbeiten. Dieser didaktische Vorschlag eignet sich nicht nur für die Betrachtung von Kontamination (4.1.3), sondern auch für die anderen beschriebenen Wortbildungsstrategien wie Komposition (4.1.1) sowie Derivation und Kombination (4.1.2). Eine weiterführende Fragestellung für fremdsprachendidaktische Kontexte könnte es dann auch sein, über CMC-Korpora rekonstruierbare digitale Diskurse mit Diskursen in Printmedien zu vergleichen, um Unterschiede zu den Wortbildungsprodukten in Korpora schriftsprachlicher Daten sichtbar zu machen.

4.2 Die Aushandlung sprachlicher (Un-)Höflichkeit korpuslinguistisch rekonstruieren

Die Thematisierung sprachlicher (Un-)Höflichkeit in Vermittlungskontexten ist in politischen Rahmenpapieren zu digitalen Kompetenzen verankert (vgl. zu Kompetenzen im Zusammenhang mit „Netiquetten“6 DigComp der European Commission 2017: 11) und wird auch in der Forschung für die Fremdsprachendidaktik empfohlen (vgl. Neuland 2009 sowie Rösler 2012). Ein Thema aus dem Bereich sprachlicher Höflichkeit kann dann etwa die Verwendung des Konjunktivs (Imo / Hayashi / Ogasawara 2020: 59) sein. Im Folgenden sollen exemplarisch sozialdeiktische Elemente und deren metasprachliche Thematisierung sowie korpuslinguistische Analyse besprochen werden. Der adäquate Einsatz sozialdeiktischer Elemente in der Interaktion ist auch für Muttersprachler*innen seit jeher nicht so trivial, wie dies in manchen Lehrwerken suggeriert wird. In vielen Lehrbüchern zur Germanistischen Linguistik wird das Thema nur knapp verhandelt und auf das zweigliedrige System der Sozialdeixis im Deutschen verwiesen, bei dem es darum geht, „das Verhältnis zwischen SprecherIn und HörerIn (und deren Umgebung) auszudrücken. […] So kann z.B. die Wahl der Pronomen (du resp. Sie) als deiktisches Element für die Markierung von Nähe resp. Höflichkeit/ Respekt gedeutet werden“ (Linke / Nussbaumer / Portmann 2004: 229). In Studien, die Sozialdeixis empirisch untersuchen, wird der Einsatz von Pronomina differenzierter betrachtet. In diesem Zusammenhang verweist Busch auf das Phänomen der „Du-Expansion“, die zu Unsicherheiten bei Sprecher*innen des Deutschen führen kann und in vielen Situationen Konfliktpotential birgt:

Das expandierende Du verändert zwangsweise auch das Sie. Unsicherheit kommt auf hinsichtlich der Verteilungsregeln und des Signalwerts. Das führt leicht zu Missverständnissen und Konflikten im privaten und öffentlichen Alltag. Die Anrede […] erhält, viel stärker als früher, eine Weltanschauungskomponente (vgl. Busch 1998: 7).

Die Unsicherheiten, die Busch für Muttersprachler*innen beschreibt, können für DaF-/DaZ-Lernende noch sehr viel größer sein, weil „viele Sprachen – z.B. das Englische und Dänische – […] gar keine Höflichkeitsdistinktion in den Personalpronomen [haben]“ (Nübling et al. 2013: 179) bzw. es andere Sprachen (z.B. das Japanische) gibt, die noch mehr Abstufungen bei der Höflichkeitsdistinktion kennen.

In fast allen Einführungen in die (Germanistische) Linguistik bzw. zur Teildisziplin der Pragmatik (vgl. u.a. Meibauer et al. 2015: 213; Liedtke 2016: 205; Busch / Stenschke 2018: 242) wird Sozialdeixis mit Blick auf die Face-to-Face-Interaktion beschrieben. Die Pronomen Ihr / Sie werden dann als höflichkeitsanzeigende Pronomen dargestellt. Es wird Lernenden dort nicht aufgezeigt, dass es in der digitalen Interaktion auf bestimmten Plattformen so sein kann, dass das Siezen sogar als unhöfliche Form verstanden wird, wie dies im Metabereich der Wikipedia erläutert wird: „Viele der Umgangsformen der Wikipedia stammen noch aus der Zeit, als sich eine überschaubare Gruppe von Enthusiasten die Aufgabe gestellt hatte, eine Enzyklopädie zu schreiben […]. Aus dieser Zeit stammt auch das hier übliche vertrauliche „Du“ im Miteinander der Benutzer“(Wikipedia 2020b).

Die Legitimation für das Duzen wird hier allein durch das gemeinsame Ziel der kollaborativ erarbeiteten Online-Enzyklopädie konstruiert, auch wenn sich viele Autor*innen außerhalb des Projekts nicht kennen. Der korpuslinguistische Blick auf Diskussionsseiten der Wikipedia zeigt jedoch, dass Sozialdeixis unter den Wikipedia-Autor*innen nicht so unstrittig ist, wie das im Metabereich der Wikipedia suggeriert wird. Diese Feststellung kann Ausgangspunkt für eine Korpusstudie sein, die die Aushandlung von Sozialdeixis in der kollaborativen Textproduktion analysiert. Mögliche Fragestellungen sind dann:

  1. Inwiefern thematisieren Wikipedia-Autor*innen Sozialdeixis metasprachlich?

  2. Welche Aspekte des Gebrauchs von Sozialdeixis werden metasprachlich thematisiert?

  3. Welche Besonderheiten bei der Sozialdeixis sind in den Korpora rekonstruierbar?

Bei diesem Vorhaben führen Pronomina wie Sie und Ihr als Suchstrings zu sehr großen Treffermengen. Zielführend sind Suchstrings, wie etwa &siezen, die Treffer zur metasprachlichen Thematisierung aus COSMAS II gezielt abfragen. Wird der Suchstring &siezen verwendet, ergeben sich insgesamt 885 Treffer im Korpus WP17:

Tabelle 3

Ergebnisse zur Suchanfrage &siezen. Eigene Darstellung.

Suchanfrage &siezen Treffer Texte pMW
WUD 17: Benutzerdiskussionen 395 290 1,211
WDD 17: Artikeldiskussionen 322 208 0,863
WRD17: Redundanzdiskussionen 168 100 0,181
Summe 885 598 0,543

Die quantitative Auswertung der ausgegebenen Treffer sowie deren Sortierung nach Vorkommen in den Teilkorpora über die sogenannte Korpusansicht zeigt, dass die metasprachliche Thematisierung der Sozialdeixis v.a. auf den Diskussionsseiten und dort auf den Benutzerdiskussionsseiten vorzufinden ist, auf denen Wikipedia-Autor*innen ihre Beiträge zur Wikipedia gegenseitig kommentieren. Wie unterschiedlich die Nutzung sozialdeiktischer Elemente eingeschätzt wird, zeigen die beiden folgenden Treffer aus dem Korpus:

  • (7)Im Medium Internet wie auch bei Wikipedia hat sich eingebürgert, sich in Diskussionen zu duzen. Siezen gilt dagegen meist als unhöflich. (WDD17/B18.96254)

  • (8) Zudem liegt das Siezen bei jedem einzelnen Wikipedianer. Angenommen, jemand möchte Siezen, dann soll er dass [sic!] tun, denn es gibt keine Gründe, ihn zu hindern (so seh ich das wenigstens) (WDD17/A70.28640)

Die folgenden und auf einer Diskussionsseite aufeinander bezogenen Posts in (9) bis (11) belegen, dass Sozialdeixis auch im direkten Austausch verhandelt wird. Der Autor in (9) empfindet es als Affront, gesiezt zu werden und bezeichnet dies sogar als Verstoß gegen die üblichen Regeln. In (10) antwortet der adressierte Autor, der sich den Regeln der Wikipedia jedoch nicht verpflichtet fühlt:

  • (9) Wieso siezt du mich eigentlich auf einmal, gegen die hier üblichen Regeln?

  • (10) Ich „dutze“ nicht, weil es sich in schriftlichen Mitteilungen nicht gehört. Dass das Dutzen in der Wikipedia üblich ist, beschäftigt mich nicht.

  • (11) ich bleibe beim hier üblichen Du (WDD17/A20.99856)

Beide Autoren bleiben bei der jeweils präferierten Form sozialer Deixis. Es handelt sich hier um den Sonderfall des asymmetrischen Einsatzes der pronominalen Anrede (vgl. Nübling et al. 2013: 178), der sich in den Wikipedia-Korpora vielfach findet, wenn kein Konsens über das Vorhandensein sozialer Nähe bzw. Distanz und in der Konsequenz auch keine gemeinsame Form der pronominalen Anrede gefunden werden kann.

Dass das Konzept der sozialen Nähe bzw. Distanz sehr komplex ist, zeigt Kretzenbacher in seiner empirischen Analyse und beschreibt drei Faktoren, die den Einsatz sozialdeiktischer Elemente bestimmten: relatives Alter, gemeinsame Lebenswelt und emotionale Nähe (vgl. Kretzenbacher 2010: 10-12). Den Aspekt der gemeinsamen Lebenswelt überträgt er dabei auch auf geteilte virtuelle Welten: „Das verbreitete […] Duzen in Internet-Foren, Chatgroups und interaktiven Blogs wird auch als Symptom einer gemeinsamen virtuellen Lebenswelt interpretiert“ (Kretzenbacher 2010: 11). In den folgenden Korpustreffern sprechen Wikipedia-Autor*innen diese Aspekte an:

  • (12) Wenn ich mir eine persönliche Bemerkung erlauben darf. Ich kann nicht beurteilen in welchem sozialen oder gesellschaftspolitischen Umfeld Sie leben, jedoch wäre es für mich undenkbar einen Fremden zu duzen. Diese respektlose und herabwürdigende Unsitte aus Kindertagen die im Erwachsenenalter offenbar einst durch marxistische Ideologien geprägt wurde, findet heute im öffentlichen Leben keine Berechtigung! (WDD17/B22.21041)

  • (13) Ich finde es ja lustig diese Seite zu lesen und sich auf der Zunge zergehen zu lassen, wie ein vermutlich schon älterer Herr mit vielen Verdiensten über [sic!] Wikipedia, angegriffen von einem jungen (Gott sei Dank gibt es solche auch) Heißsporn über Duz und Siez Storys zu lesen. […] Aber ich erlaube mir solche Äußerungen, weil ich selbst uralt bin (WDD17/B22.21041)

In (12) wird keine geteilte virtuelle Welt angenommen, die das vertraute Duzen bei der kollaborativen Textarbeit legitimieren würde. Duzen von Fremden auf digitalen Plattformen wird hier mit einer bestimmten Weltanschauung („marxistische Ideologien“) in Verbindung gebracht und das Duzen auf Diskussionsseiten als infantiles sprachliches Verhalten („Unsitte aus Kindertagen“) diskreditiert. Im zweiten Beleg, der sich auf derselben Diskussionsseite befindet und sich auf den ersten Beleg bezieht, solidarisiert sich ein anderer Wikipedia-Autor, der sich selbst als „uralt“ bezeichnet, mit den duzenden Wikipedia-Autor*innen. Er bringt das oben bereits genannte Argument des relativen Alters („älterer Herr“ versus „jungen Heißsporn“) ein, das insbesondere in translokalen und (teil-)anonymen Kontexten auf digitalen Plattformen Konfliktpotential hat. Er impliziert aber zugleich, dass nicht für alle das relative Alter das entscheidende Kriterium bei der Wahl der pronominalen Anrede ist.

Die hier vorgestellte Fallstudie zur pronominalen Anrede erlaubt es, mit Lernenden in der Fremdsprachendidaktik zu einer differenzierteren Einschätzung sozialdeiktischer Mittel zu kommen. Deutlich werden zudem die besonderen Herausforderungen pronominaler Anrede in der digitalen Interaktion. Für Vermittlungskontexte des DaF-/DaZ-Unterrichts bietet es sich an, die Lehreinheit zum hier skizzierten didaktischen Szenario mit einer Einstiegsreflexion zu Sozialdeixis zu beginnen: Je nach Heterogenität der Gruppe bringen die Lernenden ganz unterschiedliches Vorwissen aus ihrer Muttersprache zum Phänomen der Sozialdeixis mit. Zudem könnte in diesem Rahmen auch Erlebnisse im Zusammenhang mit sprachlicher (Un-)Höflichkeit in interkulturellen Kontexten (des Internets) thematisiert werden, die die darauffolgenden detaillierten Korpusstudien motivieren. Auf der Grundlage der korpuslinguistischen Daten könnten die Studierenden den Schreibauftrag erhalten, für ihre jeweilige Muttersprache und das Deutsche eine differenzierte Netiquette zum adäquaten Einsatz sozialdeiktischer Zeichen zu formulieren.

4.3 Internet- bzw. plattformspezifische Vokabulare und syntagmatische Muster

In diesem letzten didaktischen Szenario sollen mithilfe der Wikipedia-Korpora internet- bzw. plattformspezifische Vokabulare und Muster korpuslinguistisch analysiert werden, wobei Begriffe wie Benutzerkonto, Klarname, Qualitätssicherung, Namensraum, Quelltext oder Zugangsdaten als Elemente einer Fachsprache oder Werkstattsprache der Wikipedia (vgl. Storrer 2017: 269) eingestuft werden können. Fachsprachen haben hohe Relevanz für die Fremdsprachendidaktik und können dort korpuslinguistisch analysiert werden (vgl. Flinz 2020).

Lüngen und Kupietz (2020: 334) verweisen auf die Besonderheiten des in Wikipedia verwendeten Vokabulars, dessen Spezifizität sich mithilfe des Abgleichs verschiedener Korpora nachweisen lässt: „Unter den im Kontrast zu DeReKo-Gesamt typischsten Wörtern findet man […] spezifisches Vokabular des Editierens von Online-Enzyklopädie-Artikeln wie Benutzerkonten, Beitrag, Artikel, Änderung“ (Lüngen / Kupietz 2020: 334). Als Ausgangspunkt für die Korpusstudien in didaktischen Kontexten eignet sich eine Seite im Metabereich der Wikipedia, die unter dem Titel Glossar Fachausdrücke und zugehörige Abkürzungen der Online-Enzyklopädie versammelt (vgl. Wikipedia 2021). Lernende finden dort erste Anhaltspunkte, welche Termini sich für Korpusanalysen eignen. Dabei sind auch Fachausdrücke aufschlussreich, die in der jeweiligen Fachsprache eine andere Bedeutung als in der Gemeinsprache haben. Häufig treten diese Fachausdrücke dann auch in spezifischen sprachlichen Mustern auf, was sich über die in COSMAS II implementierte Kookkurrenzanalyse (vgl. Belica 1995) untersuchen lässt. Dies soll am Beispiel des Ausdrucks Baustein erläutert werden, der im wdd17 insgesamt 24.916 Treffer in 13.272 Texten beim Suchstring &Baustein7 aufweist.

Vor Beginn der eigentlichen Korpusanalyse sollten mit den Studierenden die Parameter der Kookkurrenzanalyse besprochen werden. Termini wie Granularität oder Zuverlässigkeit sind ebenso zu klären wie die mathematisch-statistischen Hintergründe der in COSMAS II implementierten Kookkurrenzanalyse. In Abb. 3 sind die Einstellungen der im Seminar durchgeführten Kookkurrenzanalyse zu sehen:

Abbildung 3
Abbildung 3

Screenshot der Einstellungen zur Kookkurrenzanalyse &Baustein. Quelle: COSMAS II.

Laut dem o.g. Wikipedia-Glossar kann Baustein in der Werkstattsprache der Wikipedia folgendermaßen paraphrasiert werden: „Kurz für Textbaustein, wird aber zumeist für Mangel- oder Wartungsbausteine verwendet. Entsprechend sind Bausteinartikel Artikel mit angezeigten Mängeln“ (Wikipedia 2021). Mit dieser Erklärung lassen sich auch die in Abb. 4 auf der Grundlage der oben getroffenen Einstellung erlangten Kokkurrenzen interpretieren: Die syntagmatischen Muster Baustein entfernen, Baustein gesetzt und Baustein einfügen verweisen darauf, dass die Bedeutung von Baustein sehr spezifisch in Wikipedia ist und im Zusammenhang mit der Qualitätssicherung genutzt wird, um Mängel etwa bei der Neutralität zu markieren. Zudem finden sich im Kookkurrenzprofil unter den ersten zwölf Kookkurrenzen einige weitere die auf Qualitätssicherung hinweisen. Darunter sind Kookkurrenzen wie das Adjektiv lückenhaft (Kookkurrenz #7), Neutralität kennzeichnen (#8), sowie Beleg fehlen (#9) und QS (#12), das in der Werkstattsprache der Wikipedia für Qualitätssicherung steht.

Abbildung 4
Abbildung 4

Screenshot der Kookkurrenzen #1-#12 zu &Baustein. Quelle: COSMAS II.

Im Zusammenhang mit der Auswertung der Kookkurrenzanalyse in COSMAS II kann die Bedeutung von Baustein auch in anderen digitalen Sprachressourcen nachgeschlagen werden, um den Kontrast der Verwendung in gemein- und fachsprachlichen Kontexten herauszuarbeiten. Im Duden online wird Baustein folgendermaßen paraphrasiert: „1.) Baustein 2.) Bauklötzchen 3.) kleiner, aber wichtiger Bestandteil von etwas; einer von vielen Bestandteilen, aus denen etwas zusammengesetzt ist oder zusammengesetzt werden kann“ (Duden online 2020). Typische Wortverbindungen auf der Basis des Dudenkorpus, sind andere als die in den Wikipedia-Korpora gefundenen (z.B. Baustein liefern und Baustein enthalten).

Im Wortschatzlexikon der Universität Leipzig werden ebenfalls typische Wortverbindungen automatisiert zu einem zentralen Suchwort berechnet und in einem Kookkurrenzgraphen visualisiert. Abb. 5 zeigt, dass Baustein in den Korpora des Wortschatzlexikons mit Kookkurrenzpartnern wie z.B. zentraler, Energiewende und wesentlicher vorkommt.

Abbildung 5
Abbildung 5

Screenshot des Kookkurrenz-Graphen zu &Baustein. Quelle: Wortschatzlexikon (2021).

Die unterschiedlichen Korpora fokussieren, ja nach ihrer Quellen-Zusammensetzung, unterschiedliche Verwendungsaspekte im Gebrauch von Baustein. Der Einsatz verschiedenartiger Korpora gewährleistet so einen umfassenderen Blick in alltags- und fachsprachliche Kontexte. Die Wikipedia-Korpora und insbesondere die Korpora zu den Diskussionsseiten, auf denen die kollaborative Textproduktion besprochen wird, enthalten also gute Beispiel, um zu zeigen, wie sich Lernende mithilfe von Korpora plattformspezifische Gebrauchsweisen von Wörtern und zugehörige syntagmatische Muster erarbeiten können.

5. Evaluation und Fazit

In diesem Beitrag wurden drei didaktische Szenarien aus dem Bereich der linguistischen Wikipedistik vorgestellt, mit denen DaF-/DaZ-Lernende über die Arbeit mit den Wikipedia-Korpora des Leibniz-Instituts für Deutsche Sprache an sprachliche Formen und Muster kollaborativer Textproduktion auf der digitalen Plattform Wikipedia herangeführt werden können:

  1. Mithilfe der Platzhalter und Operatoren in COSMAS II wurden sprachliche Einheiten unterhalb der Wortebene korpuslinguistisch analysiert. Beispielhaft fanden Wortbildungsprodukte aus dem Klima- bzw. Nachhaltigkeitsdiskurs sowie aus europapolitischen Debatten in der Korpusstudie Berücksichtigung. Kurz skizziert wurden weitere Möglichkeiten qualitativer Analysen, die die metasprachliche Aushandlungen dieser Wortbildungsprodukte auf den Diskussionsseiten der Wikipedia sowie deren diskursive Funktion zeigten, womit die Diskursfähigkeit von Lernenden geschult werden kann. Dies kann über sprachkritische Debatten, die nach den Korpusstudien von den Dozierenden initiiert und moderiert werden, vertieft werden.

  2. Das zweite didaktische Szenario fokussierte im Bereich der sprachlichen (Un-)Höflichkeit auf den Einsatz sozialdeiktischer Elemente und ganz konkret auf die Verwendung der pronominalen Anrede. Die Korpusstudie machte transparent, dass das Siezen in der kollaborativen Textproduktion der Wikipedia-Autor*innen kontrovers verhandelt wird. Die Korpustreffer bieten dann im Fremdsprachenunterricht Anlass, die Spezifika pronominaler Anrede auf digitalen Plattformen und auch ganz allgemein im Deutschen sehr viel differenzierter als in vielen Lehrbüchern zu betrachten.

  3. Zuletzt wurde ein didaktisches Szenario skizziert, mit dem die Lernenden über das korpuslinguistische Verfahren der Kookkurrenzanalyse eine Methode erlernen konnten, um sich plattformspezifische Vokabulare sowie die zugehörigen syntagmatischen Muster anzueignen. Über den Abgleich der typischen Wortverbindungen von Baustein in mehreren digitalen Ressourcen wurde deutlich gemacht, wie sehr sich syntagmatische Muster zu einem Wort in gemeinsprachlichen und fachsprachlichen Kontexten unterscheiden können.

Die Studierenden evaluierten die Veranstaltungen insgesamt sehr positiv und machten im Freitext der Evaluation auf die Relevanz einer klaren Struktur des empirischen Arbeitens aufmerksam: „Außerdem war die klare Struktur, die […] uns für die Arbeitsschritte der Miniprojekte vorgegeben [waren], für mich wirklich hilfreich“ (studentische Evaluation zum Seminar „Linguistische Wikipedistik“). Auch die alternative Präsentationsform der Korpusstudien als Poster in einem der Seminare wurde explizit thematisiert: „Das Erstellen eines wissenschaftlichen Posters war für mich neu; durch dieses Format und die gute Gruppenarbeit habe ich sehr viel gelernt, was mir auch bei der Hausarbeit helfen wird.“ (studentische Evaluation zum Seminar „Linguistische Wikipedistik“). Die Studierenden empfanden außerdem die selbständige Arbeit mit Korpora als abwechslungsreich: „Sehr gut strukturiert, da nicht einfach nur trockene Referate, sondern ausgewogener Mix zwischen Input der Dozentin und kleinen Aufgaben zum selbstständigen Bearbeiten und anschließendem Präsentieren im Unterricht“ (studentische Evaluation zum Seminar „Wikipedia aus text- und diskurslinguistischer Perspektive“).

Mit den beschriebenen didaktischen Szenarien wurden die Vorzüge der Arbeit mit den Wikipedia-Korpora in DaF-/DaZ-Kontexten deutlich: Die Korpora überführen die Daten einer dynamischen digitalen Plattform zu einem bestimmten Zeitpunkt in einen statischen Zustand, sodass die Nachvollziehbarkeit der Ergebnisse in didaktischen Kontexten gewährleistet ist. Zudem sind die Korpora aufbereitet und mit linguistischen Metadaten versehen. Dies ermöglicht komplexe und linguistisch informierte Suchanfragen, die die Suchoptionen in der Online-Enzyklopädie Wikipedia selbst bei weitem übersteigen. Auch die statistischen Auswertungen etwa im Rahmen der Kookkurrenzanalyse sind nur über die Korpusanalyse-Software in Vermittlungskontexten niederschwellig möglich. Die Wikipedia ist als vielfältiger und relevanter Untersuchungsgegenstand über die beschriebenen Korpora in DaF-/DaZ-Kontexten gut empirisch zugänglich. Die Korpora erlauben es Lernenden somit, sich auf einem hohen theoretischen und methodischen Niveau mit aktuellen Fragestellungen kollaborativer Textproduktion sowie ganz allgemein digitaler Kommunikation zu befassen, um sowohl Corpus Literacy wie auch Digital Literacy auf- und auszubauen.

Deutlich wurde somit, dass Korpora internetbasierter Kommunikation als dritter Typ neben Korpora mit schriftsprachlichen und gesprochenen Sprachdaten das Spektrum verfügbarer Korpustypen abrunden und komplettiert: Diese Korpora ermöglichen es also, empirisch fundiert in unterschiedlichsten Vermittlungskontexten Einblicke in sprachliche Strukturen und Muster im hochrelevanten Bereich der internetbasierten Kommunikation zu erlangen.

Notes

  1. Im Folgenden wird internetbasierte Kommunikation (IBK) „auch als deutsche Übersetzung für CMC“ (Lüngen / Kupietz 2020: 321) verstanden und mit Storrer folgendermaßen definiert: „Der Ausdruck IBK […] dient als Bezeichnung für Kommunikationsformen, die den dialogischen, sozialen Austausch über die technische Infrastruktur des Internets ermöglichen“ (Storrer 2018: 409). [^]
  2. Die in diesem Beitrag im Detail vorgestellten didaktischen Szenarien wurden bereits in der ZiF (vgl. Gredel 2021) in Ansätzen skizziert und dort in einen größeren Kontext (Stichwort: Digital Literacy) eingeordnet. [^]
  3. „Namensräume sind ein Strukturierungskonzept, welches unter anderem im MediaWiki zum Einsatz kommt […] und hier zur Gruppierung von Seiten genutzt wird.“ (Wikipedia 2020a). [^]
  4. Die roten Markierungen in Abbildung 1 wurden durch die Verfasserin des Beitrags der Bildschirmfotografie hinzugefügt und sind so nicht in COSMAS II integriert. [^]
  5. Die Abkürzung pMW steht für Vorkommnisse pro Million Wortformen. [^]
  6. Dabei können Netiquetten „als Regelsammlungen für den richtigen Umgang mit den Kommunikationsdiensten des Internet, die sich primär an Neulinge richten“ (Storrer / Waldenberger 1998: 63) verstanden werden. [^]
  7. Der Operator & erlaubt es, in COSMAS II alle Wortformen eines Lexems aus den Korpora abzufragen. [^]

Literatur und Ressourcen

Blauth-Henke, Christine / Heinz, Matthias (2009): Korpora und Fremdsprachendidaktik: Neue Perspektiven für Lehrer und Lerner. In: Zeitschrift für romanische Sprachen und ihre Didaktik 3:1, 85–108.

Busch, Werner (1998): Duzen, Siezen, Titulieren. Zur Anrede im Deutschen heute und gestern. Göttingen: Vandenhoeck und Ruprecht.

Busch, Albert / Stenschke, Oliver (2018): Germanistische Linguistik. Eine Einführung. Narr: Tübingen.

Callies, Marcus (2019): Integrating corpus literacy into language teacher education: The case of learner corpora. In: Götz, Sandra / Mukherjee, Joybrato (Hrsg.): Learner Corpora and Language Teaching. Amsterdam / Philadalphia: John Benjamins, 245–265.

Chudak, Sebastian / Nardi, Antonella (2016): Dimensionen der Authentizität im DaF- und DaZ- Unterricht. In: Chudak, Sebastian et al. (Hrsg.) (2016), 39–53.

Chudak, Sebastian et al. (Hrsg.) (2016): IDT 2013. Band 6 – Sektionen F2, F3, F4. Medien in Kommunikation und Unterricht. Bozen: Bozen-Bolzano University Press.

Edelhoff, Christoph (1985): Authentizität im Fremdsprachenunterricht. In: Edelhoff, Christoph (Hrsg.), Authentische Texte im Deutschunterricht. Ismaning: Hueber, 7–30.

Flinz, Carolina (2020): Vergleichbare Spezialkorpora für den Tourismus: eine Chance für den Fachsprachenunterricht. In: Hepp, Marianne / Salzmann, Katharina (Hrsg.) (2020): Sprachvergleich in der mehrsprachig orientierten DaF-Didaktik. Theorie und Praxis, Roma: Istituto Italiano di Studi Germanici, 133–151.

Flinz, Carolina / Katelhön, Peggy (2019): Corpora nella didattica del tedesco come lingua straniera. Proposte per l’insegnamento del linguaggio specialistico del turismo. In: EL.LE 8: 2, 323–348.

Gredel, Eva (2017): Wort- und Themenkarrieren in der Wirtschaftskommunikation: Nachhaltigkeitsberichte als Teildiskurse. In: Behr Irmtraud et al. (Hrsg.): Die narrative Dimension der Wirtschaft. Tübingen: Narr (= Studien zur deutschen Sprache), 93–109.

Gredel, Eva (2018): Metaphorische Muster zur Europäischen Integration in verschiedenen Sprachversionen der Wikipedia – Die Online-Enzyklopädie als Ressource zum Sprach- und Kulturvergleich. In: Gredel, Eva et al. (Hrsg.): Diskurs – kontrastiv. Diskurslinguistik als Methode zur Erfassung sprachübergreifender und transnationaler Diskursrealitäten. Bremen: Hempen, 97–121.

Gredel, Eva (2021): CMC-Korpora und Digital Literacy in der Fremdsprachendidaktik: Relevanz, Potentiale und didaktische Szenarien. In: Zeitschrift für Interkulturellen Fremdsprachenunterricht 26: 1, 109–135.

Gredel, Eva / Flinz, Carolina (2020): Morphosyntax im deutsch-italienischen Vergleich: Kontrastive Fallstudie zu Wortbildungsprodukten und deren diskursiven Funktionen in der internetbasierten Kommunikation der Online-Enzyklopädie Wikipedia. In: Deutsche Sprache 2020: 3, 193–209.

Gredel, Eva / Herzberg, Laura / Storrer, Angelika (2018). Linguistische Wikipedistik. In: Zeitschrift für Germanistische Linguistik 46: 3, 480–493.

Henn-Memmesheimer, Beate et al. (2012): Zur Dynamik eines Sprachbildes: Nachhaltig. In: Hansen-Kokoruš, Renate / Henn-Memmesheimer / Seybert, Gislinde (Hrsg.): Sprachbilder und kulturelle Kontexte. Eine deutsch-russische Fachtagung. St. Ingbert: Röhrig, 159–190.

Hille, Almut (2015): Erinnerungen im Dialog: Globale Erinnerungsorte im Fach Deutsch als Fremdsprache. In: Badstübner-Kizik, Camilla / Hille, Almut (Hrsg.): Kulturelles Gedächtnis und Erinnerungsorte im hochschuldidaktischen Kontext: Perspektiven für das Fach Deutsch als Fremdsprache. Frankfurt am Main: Peter Lang, 103–117.

Horstmann, Susanne / Settinieri, Julia / Freitag, Dagmar (2020): Einführung in die Linguistik für DaF/DaZ. Stuttgart: UTB.

Huber, Ludwig (2013): Warum Forschendes Lernen nötig und möglich ist. In: Huber, Ludwig / Hellmer, Julia / Schneider, Friederike (Hrsg.): Forschendes Lernen im Studium. Bielefeld: Universitätsverlag Webler, 9–35.

Imo, Wolfgang / Moraldo, Sandro (2015) (Hrsg.): Interaktionale Sprache und ihre Didaktisierung im DaF-Unterricht. Tübingen: Stauffenburg.

Imo, Wolfgang / Weidner, Beate (2018): Mündliche Korpora im DaF- und DaZ-Unterricht. In: Kupietz, Marc / Schmidt, Thomas (Hrsg.): Korpuslinguistik. Berlin / Boston: de Gruyter, 231–251.

Imo, Wolfgang / Ogasarawa, Fujiko / Hayashi, Akiko (2020): Mobile Kurznachrichtenkommunikation im Sprach- und Kulturvergleich: Potenziale für Linguistik und Sprachdidaktik. In: Lipsky, Angela et al. (Hrsg.): Erträge des JGG-Seminars für Deutsch als Fremdsprache. München: Iudicium, 52–89.

Kretzenbacher, Heinz Leonhard (2010): „Man ordnet ja bestimmte Leute irgendwo ein für sich …“. Anrede und soziale Deixis. In: Deutsche Sprache 1, 1–18.

Liedtke, Frank (2016): Moderne Pragmatik. Grundbegriffe und Methoden. Narr: Tübingen.

Linke, Angelika / Nussbaumer, Markus / Portmann, Paul R. (2004): Studienbuch Linguistik. Tübingen: Niemeyer.

Lüdeling, Anke / Walter, Maik (2010). Korpuslinguistik. In: Krumm, Hans-Jürgen et al. (Hrsg.): Deutsch als Fremd- und Zweitsprache. Ein internationales Handbuch. Berlin: de Gruyter, 315–322.

Lüngen, Harald / Kupietz, Marc (2020): IBK- und Social Media-Korpora am Leibniz-Institut für Deutsche Sprache In: Marx, Konstanze et al. (Hrsg.) (2020): 319–342.

Makowiec, Beate (2016): Leseverstehen 2.0 – Recherchen in Online- Textkorpora In: Chudak, Sebastian et al. (Hrsg.) (2016), 249–259.

Marx, Konstanze / Lobin, Henning / Schmidt, Axel (Hrsg.) (2020): Deutsch in Sozialen Medien. Interaktiv, multimodal, vielfältig. Jahrbuch des Instituts für Deutsche Sprache 2019. Berlin, Boston: de Gruyter.

Meibauer, Jörg et al. (2015): Einführung in die germanistische Linguistik. Stuttgart, Weimar: Metzler.

Mukherjee, Joybrato (2002): Korpuslinguistik und Englischunterricht. Eine Einführung. Frankfurt a. M.: Lang.

Neuland, Eva (2009): Sprachliche Höflichkeit – eine Schlüsselkompetenz für die Interkulturelle Kommunikation. In: Riedner, Renate / Steinmann, Siegfried (Hrsg.): Alexandrinische Gespräche. Forschungsbeiträge ägyptischer und deutscher Germanistik, München: Iudicium 2009, 169–185.

Nolting, Antje / Radtke, Nadja (2019): Korpusbasierte Lexikografie. Nutzung von Korpora und Analysewerkzeugen im Unterricht für Deutsch als Muttersprache und Fremdsprache. In: Zeitschrift für Interkulturellen Fremdsprachenunterricht 24: 1, 107–126.

Nübling, Damaris et al. (2013): Historische Sprachwissenschaft des Deutschen. Eine Einführung in die Prinzipien des Deutschen. Tübingen: Narr.

Rösler, Dietmar (2012): Deutsch als Fremdsprache. Eine Einführung. Metzler: Weimar.

Storrer, Angelika (2013): Sprachstil und Sprachvariation in sozialen Netzwerken. In: Frank-Job, Barbara / Mehler, Alexander / Sutter, Tilmann (Hrsg.): Die Dynamik sozialer und sprachlicher Netzwerke. Konzepte, Methoden und empirische Untersuchungen an Beispielen des WWW. Wiesbaden: Springer VS, 331–366.

Storrer, Angelika (2017): Internetbasierte Kommunikation. In: Deutsche Akademie für Sprache und Dichtung und Union der deutschen Akademien der Wissenschaften (Hrsg.): Vielfalt und Einheit der deutschen Sprache: Zweiter Bericht zur Lage der deutschen Sprache. Tübingen: Stauffenburg Verlag, 247–282.

Storrer, Angelika (2018): Web 2.0: Das Beispiel Wikipedia. In: Birkner, Karin (Hrsg.): Handbuch Text und Gespräch. Berlin / Boston: De Gruyter, 387–417.

Storrer, Angelika / Waldenberger, Sandra (1998): Zwischen Grice und Knigge. Die Netiketten im Internet. In: Strohner, Hans / Sichelschmidt, Lorenz / Hielscher, Martina (Hrsg.): Medium Sprache. Frankfurt am Main: Lang, 63–77.

Wallner, Franziska (2016): Corpus Literacy im DaF-Studium. In: Chudak, Sebastian et al. (Hrsg.) (2016), 273–290.

Würffel, Nicola (2020): Soziale Medien im Deutsch-als-Fremdsprache-Unterricht: Potenziale und Herausforderungen. In: Marx, Konstanze et al. (Hrsg.) (2020): 217–231.

(Online-)Quellenverzeichnis

AntConc (2021): A freeware corpus analysis toolkit for concordancing and text analysis. https://www.laurenceanthony.net/software/antconc/ (18.08.2021).

Autorengruppe Bildungsberichterstattung (2020): Bildung in Deutschland 2020. https://www.bildungsbericht.de/static_pdfs/bildungsbericht-2020.pdf (18.08.2021).

COSMAS II = Corpus Search and Management System (2020): COSMAS II. https://www.ids-mannheim.de/cosmas2/web-app/ (18.08.2021)

Duden Online (2020): Baustein. https://www.duden.de/suchen/dudenonline/Baustein (18.08.2021).

European Commission (2017): DigComp 2.1. The Digital Competence Framework for Citizens. With eight proficiency levels and examples of use. https://publications.jrc.ec.europa.eu/repository/bitstream/ JRC106281/web-digcomp2.1pdf_(online).pdf (18.08.2021).

grammis – Grammatisches Informationssystem (2021): Wörterbuch der Affixe. https://grammis.ids-mannheim.de/affixe (18.08.2021).

Wikimedia (2020): Statistiken. https://stats.wikimedia.org/#/all-wikipedia-projects/content/pages-to-date/ normal|line|2-year|(page_type)~content|monthly (18.08.2021).

Wikipedia (2020a): Hilfe: Namensräume. https://de.wikipedia.org/wiki/Hilfe:Namensräume (18.08.2021).

Wikipedia (2020b): Warum sich hier alle duzen. https://de.wikipedia.org/wiki/Wikipedia: Warum_sich_hier_alle_duzen (18.08.2021).

Wikipedia (2021): Glossar. https://de.wikipedia.org/wiki/Hilfe:Glossar (18.08.2021).

Wiktionary (2021): Wikipedistik. https://de.wiktionary.org/wiki/Wikipedistik (18.08.2021).

Wortschatz (2021): Baustein. https://corpora.uni-leipzig.de/en/res?corpusId=deu_newscrawl-public_2018& word=Baustein (18.08.2021).

Kurzbio

Prof. Dr. Eva Gredel ist Juniorprofessorin mit Tenure Track an der Universität Duisburg-Essen. Ihr Forschungsschwerpunkt liegt im Bereich digitaler Kommunikation in Vermittlungskontexten. Sie promovierte 2014 an der Universität Mannheim mit einer Arbeit zu Diskursdynamiken am Beispiel des Diskursobjekts Virus. In ihrem Habilitationsprojekt analysiert sie digitale Diskurse in der Online-Enzyklopädie Wikipedia. Seit 2016 ist sie Koordinatorin des DFG- Netzwerks „Diskurse – digital: Theorien, Methoden, Fallstudien“.