Thematic issue articles

FUßBALLWORTSCHATZ DIGITAL. KORPUSLINGUISTISCHE RESSOURCEN FÜR DEN SPRACHUNTERRICHT

Author:

Abstract

Aufgrund der globalen Popularität und der großen alltags- und populärkulturellen Bedeutung des Fußballs ist die Fußballsprache auch für den Sprachunterricht relevant. Vorallem der ausdifferenzierte Wortschatz dieser Sondersprache ist ein wichtiger und didaktisch reizvoller Vermittlungsgegenstand. Der Beitrag stellt mit den multilingualen Korpora zur Fußballlinguistik eine frei zugängliche Korpusressource vor und demonstriert entlang konkreter Beispiele die didaktischen Potenziale, welche korpusgestützte Zugänge wie etwa Kollokationsanalysen für die Wortschatzvermittlung haben. Sie umgehen eine strikte Trennung von Lexikon und Grammatik und eröffnen mit ihrem Fokus auf syntaktische und textuelle Einbettungen auch neue Perspektiven für sprachvergleichende Analysen.


Due to the global popularity and the great popular cultural significance of football, the language of football is also relevant for language teaching. Above all, the differentiated vocabulary of this special language is an important subject. The article presents the multilingual corpora on football linguistics, a freely accessible corpus resource. By means of concrete examples, it demonstrates the didactic potential of corpus-based approaches like collocation analysis for vocabulary teaching. It is shown that corpus-based approaches avoid a strict separation of lexicon and grammar and, with their focus on syntactic and textual embedding, also open up new perspectives for comparative linguistic analyses.

Keywords: Fußball, Sondersprache, Wortschatz, Mehrsprachigkeit, Kollokationen, football, special language, vocabulary, multilingualism, collocations

How to Cite: Meier-Vieracker, S. (2022) “FUßBALLWORTSCHATZ DIGITAL. KORPUSLINGUISTISCHE RESSOURCEN FÜR DEN SPRACHUNTERRICHT”, Korpora Deutsch als Fremdsprache. 2(1). doi: https://doi.org/10.48694/kordaf-3485

1. Einleitung

Der Fußball gehört in vielen Teilen der Welt und auch in Deutschland zu den populärsten Sportarten. Seine mediale Präsenz ist enorm, seine populärkulturellen Bearbeitungen sind vielfältig und auch in der Alltagskommunikation ist der Fußball eine ausgesprochen ergiebige thematische Ressource. Für den Fremdsprachunterricht ist die Fußballsprache deshalb aus mehreren Gründen relevant. Erstens ist eine zumindest grundlegende Kenntnis dessen, wie über Fußball im weitesten Sinne gesprochen wird, in vielen Fällen Voraussetzung für Teilhabe am gesellschaftlichen Leben im deutschsprachigen Raum, angefangen vom spezialisierten Wortschatz des Fußballs bis hin zu den weit verbreiteten Fußballmetaphern etwa in der Politik. Zweitens und damit zusammenhängend kann der Fußball in seiner globalen Popularität auch ein guter Aufhänger für sprachdidaktische Szenarien sein. Viele Deutschlernende haben ein Interesse am Fußball und dürften mit Fragen nach den jeweils einzelsprachspezifischen Besonderheiten des Redens (und Schreibens) über Fußball gut zu motivieren sein. Tatsächlich gibt es in der global verbreiteten, aber einzelsprachlich ausdifferenzierten Sondersprache des Fußballs (vgl. Bergh / Ohlander 2012, 2020) viel zu entdecken, was sprachwissenschaftlich wie auch landeskundlich interessant ist, von der ausdifferenzierten jargonalen Lexik (Pille, Leder für Ball) über typische Phraseologismen (etwa mit angezogener Handbremse) und grammatische Phänomene (etwa Objektauslassungen bzw. Valenzreduktionen wie in Neuer rettet) bis hin zu fußballhistorischen Anspielungen (Fritz-Walter-Wetter; vgl. Burkhardt 2010). Die Fußballsprache ist dabei in der Tat als Sondersprache und nicht als Fachsprache im engeren Sinne zu beschreiben, da typische Merkmale von Fachsprachen wie das Streben nach terminologischer Eindeutigkeit (vgl. Roelcke 2015: 382) hier nicht gegeben sind. Zwar gibt es auch eine echte Fachsprache des Fußballs, die etwa in Regelwerken Anwendung findet. In medialen Kontexten oder auch in der Alltagskommunikation über Fußball sind ihre terminologischen Fixierungen aber nicht verbindlich.

An Ressourcen, welche die einzelsprachlichen Ausgestaltungen der Sondersprache des Fußballs – und hier vor allem des Fußballwortschatzes – dokumentieren und wenigstens für sprachvergleichende und ggf. auch für sprachdidaktische Zwecke aufbereiten, mangelt es nicht. Schon die frühesten sprachwissenschaftlichen Beiträge zum Thema Fußball liefern auch Übersetzungshilfen in Form von Vokabellisten (vgl. Valk 1935; Jackson / Penot 1983). Auch einzelsprachliche lexikographische Arbeiten liegen für viele europäische Sprachen vor, häufig mit einem gesonderten Interesse an Lehnwörtern (vgl. Schönfelder 1954; Burkhardt 2006a; Yıldırım 2006; Aleixandre-Benavent et al. 2007; Benzer 2010). Schließlich finden sich auf semantische Fragen perspektivierte, lexikologische Beiträge (vgl. Carvalho 1996; Vollmert-Spiesky 1996). All diese Arbeiten nutzen jedoch keine korpuslinguistischen Methoden im engeren Sinne (vgl. Stefanowitsch 2020; vgl. aber Bergh / Ohlander 2012). Zwar dürften sie alle auf Belegsammlungen in irgendeiner Art zurückgreifen, doch allein schon der lexikographische Typ des Belegwörterbuchs, das Gebrauch und Bedeutung der Lemmata anhand authentischer und mit Quellenangabe versehener Belege vorführt, findet sich nur selten (vgl. Burkhardt 2006a). Auch die ausdrücklich auf mögliche Didaktisierungen orientierten Arbeiten nutzen keine korpuslinguistischen Methoden (vgl. Burkhardt 2010; Kern / Siehr 2016).

Eines der wenigen Beispiele für eine korpusbasierte, lexikographische Ressource zum Thema Fußball ist das Kicktionary (vgl. Schmidt 2009a; b), ein mehrsprachiges (deutsch, englisch, französisch) elektronisches Wörterbuch der Fußballsprache. Dieses wurde auf der Grundlage umfangreicher Korpora von Spielberichten der Seite uefa.com und kicker.de erstellt. In die nach framesemantischen Prinzipien erstellten und untereinander vernetzten Wörterbucheinträge sind zahlreiche Verwendungsbeispiele integriert, die auch im größeren Textzusammenhang angezeigt werden können, was gerade für Sprachlernende nützlich ist (vgl. Ziem 2015). Das so präsentierte Belegmaterial ist jedoch statisch. Eigene Korpusabfragen, welche das didaktische Potenzial für Sprachlernende wie auch für Sprachlehrende erst ausschöpfen würden, sind leider nicht möglich. Hier wären korpuslinguistisch Interessierte, die entsprechenden methodischen Kompetenzen vorausgesetzt, auf die großen einzelsprachlichen Referenzkorpora wie DeReKo (Leibniz-Institut für Deutsche Sprache 2021) oder das British National Corpus (BNC Consortium 2007) angewiesen, die in ihrer breiten Erfassung der Pressesprache natürlich auch Texte der Fußballberichterstattung enthalten. Eine gezielte korpuslinguistische Untersuchung der Fußballsprache, die auch sprachvergleichende Fragen adressieren kann, ist so aber nur sehr bedingt möglich.

Hier kann eine Ressource zum Einsatz kommen, die im Projekt Fußballlinguistik (https://fussballlinguistik.de) seit einigen Jahren fortlaufend entwickelt wird: die Korpora zur Fußballlinguistik (vgl. Meier 2017), welche schriftliche und mündliche Texte aus dem Bereich der Fußballberichterstattung in mehreren europäischen Sprachen dokumentieren und über eine webbasierte Analyseplattform der Fachöffentlichkeit zugänglich machen. Im Folgenden sollen zunächst die Konzeption und die technische Umsetzung dieser Ressource vorgestellt werden (Abschnitt 2). Nach einigen grundlegenden Überlegungen zum Einsatz von Korpora in der Sprachdidaktik (Abschnitt 3) werden dann entlang eines ausgewählten Beispiels didaktische Szenarien für die korpusgestützte Vermittlung des Fußballwortschatzes demonstriert. Dabei soll gezeigt werden, dass der korpuslinguistische Zugriff auf den Wortschatz den Blick von den Einzellexemen und ihren Bedeutungen auf ihre grammatischen und textuellen Einbettungen ausweitet und eine strikte Trennung von Lexikon und Grammatik umgeht, was auch für Sprachlernende den Erwerb rezeptiver und produktiver Kompetenzen erleichtert (Abschnitt 4). In einem Ausblick werden weitere vielversprechende Zugriffsobjekte korpusbasierter Sondersprachdidaktik umrissen und mit dem Webkorpus Ballsportarten noch eine weitere korpuslinguistische Ressource zum Thema Fußballsprache vorgestellt (Abschnitt 5).

2. Die Korpora zur Fußballlinguistik: Konzeption und Umsetzung

Die Korpora zur Fußballlinguistik (https://fussballlinguistik.de/korpora/) enthalten Texte aus dem Bereich der internetbasierten Fußballberichterstattung in vollständig annotierter und um Metadaten angereicherter Form in den Sprachen Deutsch1, Englisch, Niederländisch, Französisch, Italienisch, Spanisch, Portugiesisch, Norwegisch, Polnisch, Tschechisch, Russisch, Ungarisch und Griechisch im Gesamtumfang von ca. 78. Mio. Token (Stand Dezember 2021). Die Texte entfallen auf die Textsorten Liveticker, Spielbericht, Einzelkritik und Taktikanalyse. Außerdem ist ein sehr kleines Korpus mit transkribierten Radiolivereportagen enthalten. Die erfassten Texte sind somit auf redaktionelle Textsorten beschränkt, die sich im engen Sinne mit konkreten Fußballspielen befassen. Weitere Textsorten aus der Domäne Fußball wie etwa Hintergrundreportagen, Fanzinebeiträge (vgl. Meier-Vieracker 2021 b) oder auch Social Media-Beiträge wie Livetweets (vgl. Meier 2019a) werden bewusst ausgeklammert, da diese thematisch zu dispers sind. Bei den erfassten Textgattungen kann hingegen davon ausgegangen werden, dass sie wenigstens die von Burkhardt (2006b: 55) als „Reportsprache“ bezeichnete Facette der Fußballsprache in Reinform repräsentieren. Tabelle 1 zeigt die Zusammensetzung der Korpora, wobei jede Quelle als eigenes, vordefiniertes Subkorpus abfragbar ist:

Tabelle 1

Korpora zur Fußballlinguistik (Release 2021-12)

Quelle Sprache Textsorten Tokens Texte
kicker.de deutsch Liveticker, Spielberichte 6.200.542 3.060
weltfussball.de deutsch Liveticker 13.077.803 5.192
SID deutsch Liveticker 8926082 3.163
nzz.ch deutsch (CH) Liveticker 883263 537
spielverlagerung.de deutsch Taktikanalysen 5.102.902 2.962
Taktikblogs diverse deutsch Taktikanalysen 498.264 290
sportschau.de deutsch Einzelkritiken 69.624 1.158
sportal.de deutsch Einzelkritiken 1.475.256 29.570
sportsmole.co.uk englisch Liveticker, Spielberichte 6.529.955 3.257
fcupdate.nl niederländisch Liveticker 4.706.975 2.476
lequipe.fr französisch Liveticker 2.730.803 1.247
matchendirect.fr französisch Liveticker 3.148.723 1.469
as.com spanisch Liveticker, Spielberichte 4.106.134 2.702
tuttomercatoweb.it italienisch Liveticker 5.505.344 3.080
maisfutebol.pt portugiesisch Liveticker 998.581 687
vglive.no norwegisch Liveticker 1.823.444 980
sportowefakty.wp.pl polnisch Liveticker 1.512.280 1.421
isport.cz tschechisch Liveticker 2.366.568 960
liveresult.ru russisch Liveticker 6.573.660 3.066
nemzetisport.hu ungarisch Liveticker, Spielberichte 21.208 154
sport24.gr griechisch Liveticker 593.187 413
ARD deutsch Radioreportage 31.992 5

Bei der Auswahl der Quellen spielen inhaltliche und technische Aspekte eine Rolle. Der Fokus liegt auf nicht vereinsgebundenen Quellen mit hoher Reichweite, typischerweise also überregionale (Fach-)Presseportale wie für das Deutsche kicker.de oder für das Französische lequipe.fr. Nicht aufgenommen wurde dagegen vereinsseitige Berichterstattung (vgl. hierzu Oksefjell Ebeling 2019). Weiterhin werden so weit wie möglich die Texte saisonweise erhoben, so dass die erfassten Texte die jeweiligen Zeiträume und Wettbewerbe vollständig abdecken und auch diachrone Analysen möglich sind. Schließlich schränken die technischen Rahmenbedingungen die Quellenauswahl weiter ein. Erhoben werden ausschließlich Texte, die sich für den automatisierten Download (Webscraping) eignen. Vollständig dynamische Webseiten ohne Archiv können nicht berücksichtigt werden. Diesen Beschränkungen zum Trotz dokumentieren die Korpora für das Deutsche umfassend und repräsentativ, für die weiteren Sprachen immerhin in bisher nicht verfügbarem Umfang, den Schriftsprachgebrauch in der thematischen Domäne der Fußballberichterstattung und erschließen die Sondersprache des Fußballs erstmals umfassend für korpuslinguistische Zwecke.

Im Zuge der Datenerhebung wurden die Texte einschließlich Metadaten erfasst und in einem XML-Format aufbereitet. Ein Metadatensatz, der aber je nach Quelle unvollständig sein kann, umfasst Angaben zu: Anbieter, Textsorte, Wettbewerb, Datum, Saison, Heimteam, Auswärtsteam, Anstoßzeit, Resultat und URL zur Originalquelle. Zudem erhält jeder Text eine korpusübergreifend eindeutige ID in Form einer Sigle, welche Auskunft über Quelle, Wettbewerb, Saison bzw. Jahr und Textsorte gibt. Bei der Datenerhebung wurde ausschließlich der Fließtext basierend auf dem HTML-Quellcode erfasst. Die in viele Texte eingebetteten Bilder und andere graphische Darstellungen blieben also unberücksichtigt, allerdings erlaubt es die URL zur Originalquelle, die Texte in ihrer ursprünglichen, multimodalen Textgestalt aufzurufen. Die so aufbereiteten Texte wurden schließlich mit linguistischen Annotationen (part-of-speech und Lemmata) versehen. Hierfür wurden die Software TreeTagger (vgl. Schmid 2003) und die standardmäßig mitgelieferten Parameter-Dateien genutzt. Für das Deutsche und Englische wurden diese um manuell erstellte, themenspezifische Lexika ergänzt, um die häufigsten Tagging- und Lemmatisierungsfehler zu vermeiden.

Die Korpora werden über die webbasierte Analysesoftware CQPweb (vgl. Hardie 2012) frei zur Verfügung gestellt. Nach kostenloser Registrierung kann in einem passwortgeschützten Bereich in den Texten in der standardisierten Suchsyntax CQP und dem vereinfachten Derivat Simple Query Syntax recherchiert werden, welche flexible Abfragen der annotierten Daten erlaubt. Für jeden Beleg, der zunächst in der typischen Keywords-in-Context-Ansicht angezeigt wird, kann der bis zu 1000 Wörter umfassende Kontext sowie der Metadatensatz des Textes angezeigt werden. Über die Metadaten sind auch eingeschränkte Suchen (etwa in einem bestimmten Zeitraum, einer bestimmten Textsorte oder einem bestimmten Wettbewerb) möglich und es können entsprechende Subkorpora angelegt werden. Weiterhin bietet die Analysesoftware verschiedene statistische Auswertungsinstrumente. Neben der Aufschlüsselung von (relativen) Frequenzen der Wortformen und ihrer Verteilung über Metadatenkategorien (etwa nach Erscheinungsjahr) stehen auch flexibel anpassbare Instrumente für Kollokations- und Keywordanalysen zur Verfügung. Insgesamt ist die Software also auf verschiedene Kompetenzstufen skalierbar, was ihren Einsatz in sprachdidaktischen Anwendungskontexten erlaubt. Über die einfache Suche nach Wortformen können auch Einsteiger:innen ohne jede korpuslinguistische Vorerfahrung in den Korpora recherchieren. Die Suchsyntax ermöglicht Fortgeschrittenen aber auch sehr komplexe Abfragen etwa syntaktischer Muster. Als Hilfestellung für die Nutzenden wurde ein inhaltlich auf die Korpora zugeschnittenes Tutorial entwickelt, das in aufsteigender Schwierigkeit in die Recherche- und Analysemöglichkeiten einführt (https://ali.gsw.tu-dresden.de/tutorial.html).

Als letzter Punkt sei noch die Rechtesituation angesprochen. Die in den Korpora gesammelten Texte sind urheberrechtlich geschützt. Um die Texte der Forschungsöffentlichkeit für wissenschaftliche Zwecke zur Verfügung stellen zu können, wurden mit einigen Anbietern Rechtevereinbarungen geschlossen, welche die Modalitäten der Nutzung regeln. Gemäß §60d des 2021 novellierten deutschen Urheberrechtsgesetzes (Text und Data Mining für Zwecke der wissenschaftlichen Forschung) können für die registrierten Nutzenden aber auch jene Texte für die wissenschaftliche Nutzung zur Verfügung gestellt werden, mit denen keine Rechtevereinbarungen getroffen werden konnten. In beiden Fällen aber ist zur Wahrung des Urheberrechts die Anzeige der Texte nur in Ausschnitten möglich. Es können weder die Volltexte noch ganze Korpora exportiert werden. Allerdings können verschiedene Ergebnislisten (Keywords in Context, Frequenzlisten, Kollokationsprofile, Keywordlisten usw.) im tsv-Format heruntergeladen werden. Für sprachdidaktische Zwecke dürfte das mehr als ausreichend sein.

3. Korpora in der Sprachdidaktik: Allgemeine Grundlagen

Wie Römer (2009) in ihrem Überblick über den Einsatz von Korpora im Sprachunterricht ausführt, lassen sich grundlegend indirekte und direkte Anwendungen unterscheiden, die im konkreten Fall freilich auch kombiniert werden können. In den indirekten Anwendungen beeinflussen die Verfügbarkeit von Korpora die Unterrichtsgestaltung im weitesten Sinne, und sei es nur dadurch, dass das Ziel der Vermittlung gebräuchlicher sprachlicher Strukturen durch korpuslinguistische Evidenzen angeleitet wird. Auch können bei der Entwicklung von konkreten Lehrmaterialien Korpora genutzt werden, um gezielt authentische Äußerungen erheben zu können und nicht auf fingierte Beispiele zurückgreifen zu müssen. Dass eine korpuslinguistische Perspektive auf Sprache und Sprachgebrauch auch ganz neue sprachliche Einheiten in den Blick rückt, welche auch für den (Fremd-)Spracherwerb hohe Relevanz haben, zeigt sich am Beispiel der Kollokationen bzw. Kookkurrenzen (vgl. Steyer 2002; Hausmann 2004; Malloggi 2021). Erst durch korpuslinguistische Methoden und statistische Analyseverfahren, mittels derer typische Wortverbindungen erhoben werden, konnten Kollokationswörterbücher (vgl. Häcki Buhofer et al. 2014) erstellt werden, welche gerade für Sprachlehrende und -lernende wichtige Ressourcen sein können.

Während in diesen indirekten Anwendungen Korpora zwar die Unterrichtsgestaltung prägen, korpuslinguistische Anwendungen selbst aber keinen Eingang in konkrete Lehr-Lernsettings finden, zielen direkte Anwendungen genau hierauf ab. So kann im Sinne des Forschenden Lernens die Arbeit mit korpuslinguistischen Tools in den Unterricht integriert werden, etwa um zur Reflexion über gesellschaftlich-politische Sprachgebräuche anzuregen (vgl. Knuchel / Bubenhofer 2020) oder um die Lernenden Bedeutungsnuancen semantisch verwandter Ausdrücke selbst explorieren zu lassen (vgl. Chambers 2005).

Die bisherigen Ausführungen können nun nicht nur für die großen Referenzkorpora Geltung beanspruchen, die der Vermittlung gemeinsprachlicher Phänomene dienen können. Auch Spezialkorpora können für fach- bzw. sondersprachdidaktische Zwecke zum Einsatz kommen, und womöglich zeigt sich hier der Mehrwert korpuslinguistischer Fundierungen und Anwendungen in besonderer Weise. Die Ermittlung der gebräuchlichsten Ausdrücke, denen auch in der Vermittlung Priorität eingeräumt werden sollte, kann hier kaum anders als korpusbasiert geschehen, und korpusbasiert erstellte Lehrmaterialien sind kaum zu ersetzen, wenn die Lernenden in die Lage versetzt werden sollen, mit dem tatsächlichen Fach- und Sondersprachgebrauch rezeptiv und produktiv sicher umzugehen. Wenigstens Beispielsammlungen auf der Grundlage authentischer Texte sind unumgänglich, und entsprechend aufbereitete Korpora können hier als Materialgrundlage dienen. Auch Korpusabfragen durch die Lernenden selbst dürften im Fall von Fach- und Sondersprachen besonders hohes Erkenntnispotenzial haben.

Vor diesem Hintergrund können die Korpora zur Fußballlinguistik als Ressource für die Vermittlung der Sondersprache des Fußballs herangezogen werden, und zwar sowohl in indirekten Anwendungen für die Entwicklung von Lehrmaterialien als auch in direkten Anwendungen der Korpora selbst in konkreten Lehr-Lernsettings, welche wie oben ausgeführt auch sprachvergleichende Fragen adressieren können. Ich werde im Folgenden aber nicht strikt zwischen indirekten und direkten Anwendungen trennen. Die korpuslinguistischen Methoden, welche für die Entwicklung von Lehrmaterialien genutzt werden können, lassen sich, grundlegende technische Kompetenzen bei den Lernenden bzw. entsprechende Instruktion vorausgesetzt, auch in den Unterricht selbst integrieren.

4. Didaktische Szenarien zum Fußballwortschatz

4.1 Erster Schritt: Ein frequenzorientierter Zugang

Wie schon ein sporadischer Blick in Texte der Fußballberichterstattung wie etwa Liveticker oder Spielberichte zeigt, stellen sie für Sprachlernende insbesondere auf der Ebene der Lexik eine besondere Herausforderung dar. Zahlreiche nur hier gebräuchliche (z.B. Strafraum) oder aber hier in von der Gemeinsprache in abweichender Bedeutung gebrauchte Ausdrücke (z.B. Schwalbe oder verwandeln) erschweren das Verständnis (vgl. Bergh / Ohlander 2012: 40). Fußballsprache, so hält Lavric in der Einleitung zum Sammelband „The linguistics of football“ fest, „is first and foremost football terminology“ (Lavric 2008: 5), und deshalb ist der Fußballwortschatz auch der naheliegendste und grundlegendste Unterrichtsgegenstand, wenn es um Fußballsprache geht. Die verfügbaren Ressourcen, allen voran das Kicktionary, sind hier ein möglicher Einstieg. In einem ganz einfachen Zugang können die Korpora zur Fußballlinguistik hierbei als erweiterte Materialbasis für die ergänzende Belegsuche und auch für die Erschließung weiterer Sprachen genutzt werden.

Um aber entscheiden zu können, welche Ausdrücke besondere Relevanz haben – die 800 im Kicktionary und erst recht die 2200 in Burkhardts (2006a) Wörterbuch aufgeführten Lemmata dürften Lernende überfordern –, bieten sich als Orientierungshilfe Frequenzlisten an. Die Software CQPweb, über die die Korpora zur Fußballlinguistik zur Verfügung gestellt werden, erlaubt die bequeme Ausgabe von Frequenzlisten nach den verfügbaren positionalen Attributen Wortform, Wortart und Lemma. Im Falle des kicker-Korpus, das je 3060 Bundesliga-Liveticker und -Spielberichte aus den Jahren 2006–2016 im Gesamtumfang von 5,8 Mio. Tokens enthält, umfasst die Liste 43649 Lemmata.2 Unter den häufigsten sind naturgemäß viele Funktionswörter, so dass eine Fokussierung auf Substantive und Vollverben sinnvoll erscheint. Tab. 2 zeigt die jeweils 25 häufigsten:

Tabelle 2

Häufigste Substantive und Vollverben im kicker-Korpus

Position Substantiv Frequenz
20 Ball 32644
33 Meter 22892
35 Tor 20974
51 Strafraum 14637
54 Minute 12651
59 Spiel 12149
64 Ecke 11371
68 Freistoß 10700
73 Partie 9611
81 Chance 8466
83 Leder 7940
86 Gast 7695
90 Flanke 7575
91 Position 7533
94 Schuss 7360
97 Kugel 7057
103 Pfosten 6733
109 Team 6371
129 Mitte 5422
130 Eck 5394
138 Mittelfeld 5207
145 Platz 4937
147 Führung 4870
148 Abschluss 4869
149 Hälfte 4855
Position Vollverb Frequenz
28 kommen 26467
48 gehen 15458
55 bringen 12550
57 stehen 12206
63 spielen 11468
69 lassen 10476
74 bleiben 9323
79 setzen 8708
89 geben 7612
92 klären 7527
93 machen 7487
95 ziehen 7225
106 treffen 6492
108 legen 6404
119 sehen 5901
122 finden 5593
127 schießen 5480
140 versuchen 5132
144 köpfen 4941
153 scheitern 4683
174 fehlen 4101
182 beginnen 3926
186 zeigen 3787
195 gewinnen 3580
197 landen 3507

Schon diese Listen verweisen auf eine Besonderheit der deutschen Fußballsprache, nämlich den Reichtum an jargonalen Synonymen wie hier Leder und Kugel für Ball. Ihre Kenntnis ist also schlicht notwendig, um Liveticker und Spielberichte verstehen zu können. Im Sprachunterricht sollten sie explizit thematisiert werden, zumal etwa im Englischen, wo ball die einzige relevante Bezeichnung ist, keine vergleichbare Ausdifferenzierung der Lexik vorliegt. Im Französischen hingegen sind mit ballon, balle, cuir und sphère ganz ähnliche Bezeichnungen geläufig. In der Liste der häufigsten Verben zeigt sich die Geltung des von Burkhardt (2006b: 62) so genannten Prinzips der simplifizierenden Abstraktion: kommen, gehen und stehen als vorderhand unspezifische Bewegungs- und Positionsverben können im Kontext konkreter Spielbeschreibungen sehr spezifische, aber hoch variable Bedeutungen haben, deren materialgestützte Systematisierung eine anspruchsvolle, aber sicherlich reizvolle didaktische Aufgabe ist.

Die Liste der Substantive in Tab. 2 führt mit den Lemmata Ecke und Eck auch zwei von der Wortform her sehr ähnliche Lexeme, die gleichwohl Unterschiedliches bedeuten. Die Vermittlung dieses Bedeutungsunterschiedes ist eine didaktische Herausforderung, wie abermals ein Vergleich mit dem Englischen oder auch dem Italienischen verdeutlicht, wo mit corner bzw. angolo nur ein homonymes Lexem zur Verfügung steht. Gerade dieses Beispiel kann aber auch die Potenziale eines korpusgestützten Zugangs und den Wert von Spezialkorpora verdeutlichen, der über die Einzellexeme hinaus auch typische Kontexte und Wortverbindungen adressiert. Darum sei im Folgenden auf dieses Beispiel vertieft eingegangen.

4.2 Zweiter Schritt: Bedeutungsexploration im Kontext

Zunächst sollen die folgenden Korpusbelege exemplarisch die typischen Verwendungen der beiden Lexeme Ecke und Eck verdeutlichen:

Mit Ecke wird also in einer für die Fußballsprache typischen Metonymie (vgl. Burkhardt 2006b: 60) der Eckstoß bzw. Eckball bezeichnet. Der Ort, von dem aus der Eckstoß geschlagen wird, steht für diesen Spielzug selbst (1) oder, nochmals anders perspektiviert, für den in diesem Spielzug geschlagenen Ball (2) (vgl. Burkhardt 2006a: 85). Nur so wird erklärlich, warum eine Ecke erzwungen oder verarbeitet werden kann. Eck hingegen referiert auf einen Teil des Tores, auch Torecke genannt, und zwar insbesondere als Ziel von Torschüssen. Die Belege (3) und (4) sind typische Beispiele, die auch zeigen, dass Eck für gewöhnlich in lokalen bzw. direktiven und durch die Attribute links/rechts ergänzten Präpositionalphrasen vorkommt, welche die Bewegung des Balles charakterisieren3. Dass Ecke und Eck in dieser Weise voneinander unterschieden sind, zeigen Belege, in denen sie sogar in Kombination auftreten:

Gerade die kontextuelle und syntaktische Einbettung, das zeigen die Belege, wird Berücksichtigung finden müssen, um die jeweils unterschiedliche Bedeutung der beiden Lexeme sicher zu bestimmen. Dies kann und sollte im Sprachunterricht thematisiert werden. Letztlich läuft dies darauf hinaus, dass in der Vermittlung der Fußballsprache Lexikon und Grammatik nicht getrennt voneinander behandelt werden sollten und Wörterbucheinträge oder andere didaktische Aufbereitungen auch das grammatische Verhalten der Lexeme thematisieren müssen (vgl. Ziem 2015).

Die lexikographische Ressource Kicktionary zielt mit ihrer framesemantischen Grundlegung in eben diese Richtung, indem für einzelne lexikalische Einheiten die durch syntaktische Einbettungen realisierten semantischen Valenzen („Frame-Elemente“) angegeben werden (vgl. Ziem 2015: 394). So wird im Wörterbucheintrag zu Eck das Frame-Element „ORIENTATION [Locative_Specification]“ genannt, das in einer Formulierung wie ins linke Eck realisiert wird. Im Eintrag zu Ecke wird dagegen das Frame-Element „EXECUTING_PLAYER [Player]“ aufgeführt, realisiert etwa durch Komposita wie Beinlich-Ecke oder, wie im Beleg (5), durch die Subjektposition in der Konstruktion eine Ecke schlagen. Im oben genannten Beleg (1) wird dieses Frame-Element zwar erst im Folgesatz realisiert, während es in (2) sogar nur implizit aufgerufen wird – Ziem (2015: 397) nennt dies in Anlehnung an Fillmore „Null-Instantiierung“. Doch zeigen alle Belege, wie die Bedeutung der jeweiligen Ausdrücke und ihre syntaktisch-textuellen Einbettungen ineinandergreifen. Mit diesem Wissen ist es dann auch möglich, abweichende Fälle richtig zu verstehen. Denn das Lexem Ecke wird mitunter auch zur Bezeichnung der Torecke verwendet, wie etwa in folgendem Beleg:

Die Einbettung in die Präpositionalphrase in die rechte Ecke wirkt hier gewissermaßen disambiguierend. Schon das macht deutlich, dass hier mit Ecke das Toreck und nicht etwa die Ecke des Spielfelds gemeint ist.

Die Korpora zur Fußballlinguistik haben nun, wie oben bereits erwähnt, gegenüber dem Kicktionary den Vorteil, dass über die dort präsentierten Beispiele hinaus weitere Belege gezielt erhoben werden können. Dies kann für Lehrende nützlich sein, die zur Demonstration bestimmter sprachlicher Detailphänomene Belegmaterial suchen. Belege wie (5) und (6), die beide Lexeme in Kombination in einem einzigen Satz enthalten, wird man manuell lange suchen müssen, mithilfe der Korpora aber können sie mit der einfachen Suchanfrage Eck <<12>> Ecke rasch gefunden werden. Aber auch Lernende selbst könnten im Sprachunterricht die Korpora nutzen und sich anhand von einfachen Suchanfragen und den jeweiligen Keywords-in-Context-Listen die Bedeutungsunterschiede und das jeweilige grammatische Verhalten der Lexeme selbst erarbeiten.

4.3 Dritter Schritt: Kollokationsanalysen

Gerade für solche Szenarien Forschenden Lernens, in denen Lernende im Sinne der direkten Anwendungen (vgl. Römer 2009) selbst die Korpora nutzen, bieten sich in Fortführung des Zugangs über die Keywords-in-Context-Listen auch Kollokationsanalysen an. Indem Kollokationsanalysen die signifikant häufig im unmittelbaren Kontext zum Suchausdruck auftretenden Lemmata ausgeben, vermitteln sie einen kondensierten Eindruck von typischen Formulierungsmustern, die in einzellexemorientierten Wörterbüchern kaum abgebildet werden können, aber Teil des relevanten sprachlichen Wissens sind (vgl. Steyer 2002). In der Kontrastierung von Kollokationsprofilen werden außerdem Bedeutungsunterscheide und die jeweils verschiedenen syntaktischen Einbettungen rasch deutlich, zumal in der Software die Kollokate hypertextuell mit den Beleglisten im Keywords-in-Context-Format verlinkt sind und bequem aufgerufen werden können. Tab. 3 zeigt die jeweils 20 signifikantesten Kollokate:

Tabelle 3

Kollokationsprofile (lemmatisiert, Log Likelihood Ratio, Fenstergröße 5) von Eck und Ecke im Vergleich

Eck Ecke
in+die zu+die
rechts klären
lang eine
links nichts
auf+die folgend
Meter bringen
unter .
kurz von
@ord@ nach
ober heraus
flach
bedroht einbringen
vollenden diese
einschießen lenken
treffen holen
aus rechts
trocken köpfen
unhaltbar abfälschen
Flachschuss blocken
präzise anschließend

Im Kollokationsprofil von Eck bestätigt sich zunächst die Beobachtung, dass der Ausdruck häufig in lokalen und direktionalen Präpositionalphrasen ins Eck und aufs Eck vorkommt und durch räumliche Adjektive näher bestimmt wird. Zusätzlich zu den bereits genannten Spezifizierungen in linkes und rechtes Eck fallen hier auch die die vertikale Ausrichtung unteres und oberes Eck sowie die die Position des ballführenden Spielers anzeigenden Spezifizierungen langes und kurzes Eck ins Auge. Die Verben vollenden, einschießen und treffen sowie das Adjektiv unhaltbar zeigen an, dass das Eck typischerweise als Zielpunkt von erfolgreichen Torschüssen Erwähnung findet. Schließlich findet sich mit bedroht ein Kollokat, das auf eine Kollokation im engen Sinne des Terminus als festgefügte, nichtsubstituierbare und (teil-)idiomatische Wortverbindung (vgl. Evert 2009: 1214) hinweist. Das bedrohte Eck ist jener Teil des Tores, in dem ein Schuss einzuschlagen droht, was jedoch vom Torhüter noch verhindert werden kann. Typische Formulierungen sind im bedrohten Eck sein (7) oder aus dem bedrohten Eck fischen (8):

Stets wird das bedrohte Eck also in Relation zu einer Parade des Torhüters bestimmt. Es ist diskutabel, ob eine solche Formulierung in lexikographischen Ressourcen Erwähnung finden sollte – das Kicktionary etwa verzichtet darauf. Doch mit 122 Belegen im kicker-Korpus ist sie doch so frequent, dass sie im Sprachunterricht wenigstens angesprochen und in ihrer recht restriktiven Verwendung reflektiert werden könnte.

Das Kollokationsprofil von Ecke zeigt, dass auch hier eine Präpositionalphrase zur Ecke typisch ist. Anders als die oben genannten Präpositionalphrasen ins/aufs Eck hat zur Ecke jedoch eher eine temporal-finale Lesart, wie sie etwa in den typischen, ebenfalls im Kollokationsprofil indizierten Formulierungen zur Ecke klären (10) oder zur Ecke blocken (11) zum Tragen kommt:

Die Belege verdeutlichen, dass mit Ecke hier gerade nicht auf die Ecke des Spielfelds referiert wird, sondern auf den Spielzug des Eckstoßes, der dem Regelwerk entsprechend dann ausgeführt werden muss, wenn ein Spieler den Ball ins eigene Toraus befördert. Implizit präsupponierend wird mit zur Ecke also sehr wohl eine lokale Spezifikation eines Schusses vorgenommen – man kann sich herleiten, dass der Ball die Torauslinie überquert hat –, die jedoch, darauf weisen auch die Kollokate folgend und anschließend hin, hinter der temporal-finalen Spezifikation zurücktritt. Die verteidigende Aktion und der anschließende Eckstoß bilden also eine Sequenz, die typischerweise als solche berichtet wird. Auf eine andere temporale Verkettung weist hingegen das Kollokat nach hin. Als spieleröffnende Standardsituation folgt auf den Eckstoß typischerweise eine Aktion im Strafraum, auf der der eigentliche Fokus liegt, so dass der Eckstoß gleichsam beiläufig in der Präpositionalphrase nach einer Ecke berichtet werden kann (12):

Schließlich finden sich auch im Kollokationsprofil zu Ecke noch Hinweise auf festgefügte Formulierungen. Für Eckstöße, die – wie die meisten ihrer Art – nicht zum Torerfolg führen, gibt es die Formulierung die Ecke bringt nichts ein. Freilich gibt es alternative Formulierungen, etwa dass eine Ecke verpufft, die gebräuchlichste und gleichsam schematische Formulierung ist jedoch nichts einbringen. Eine weitere interessante Formulierung ist Ecke herausholen, womit in stark verdichtender Weise ein Angriffszug bezeichnet wird, der von der gegnerischen Mannschaft nur so abgewehrt werden kann, dass sich daran mit einem Eckstoß eine erneute Chance für die angreifende Mannschaft ergibt. Wie Burkhardt (2006b: 60) zu Metonymien in der Fußballberichterstattung ausführt, wird bei ihnen die ganze Spielsituation – und man müsste wohl ergänzen: Spielsequenz – mitgedacht. Die Formulierung eine Ecke herausholen ist hierfür ein besonders treffendes Beispiel, das im Sprachunterricht auch als Anlass dienen kann, die semantischen Prinzipien der Fußballsprache insgesamt zu thematisieren.

Insgesamt zeigt das Beispiel der Differenzierung zwischen Eck und Ecke, wie mit einem korpusgestützten Zugang und entsprechenden Spezialkorpora die Bedeutungsunterschiede in ihrem Zusammenspiel mit je verschiedenen syntaktischen und textuellen Mustern detailreich erhoben werden können und hierin die verfügbaren lexikographischen Ressourcen übertreffen. Es dürfte eine didaktisch reizvolle Aufgabe sein, Lernende ausgehend von Kollokationsanalysen Belege für die jeweiligen Formulierungsmuster explorieren zu lassen, um auf diese Weise ein dichtes Bild von den Gebrauchsweisen dieser Termini zu erhalten.

4.4 Vierter Schritt: Sprachvergleichende Perspektiven

Die bisher beschriebenen didaktischen Zugänge waren einzelsprachlich orientiert. Für den Fremdsprachenunterricht bietet sich aber auch die sprachvergleichende Perspektive an, die sich beim Thema Fußball geradezu aufdrängt. Als global verbreitete, einem einheitlichen Regelwerk folgende und auch sonst international orientierte Sportart sind multilinguale Bezüge dieser Sondersprache eigen, wie auch das lebendige Forschungsinteresse an Lehnwörtern zeigt (vgl. Bergh / Ohlander 2020). Die Ausdrücke für die Ecke des Spielfeldes und den von dort geschlagenen Ball sind hierfür ein Paradebeispiel, hat sich doch der englische Terminus corner in vielen Sprachen wie etwa dem Niederländischen, dem Französischen, dem Spanischen und auch dem Schweizer Standarddeutschen erhalten.

Einen möglichen Zugriff für sprachvergleichende Untersuchungen, der sowohl für die Erstellung von Lehrmaterialien als auch für Anwendungen durch die Lernenden selbst genutzt werden kann, bieten abermals Kollokationsanalysen, aus denen typische Formulierungen in den jeweiligen Sprachen abgeleitet und dann kontrastiv zueinander in Bezug gesetzt werden können (vgl. Flinz / Perkuhn 2018). Exemplarisch sei dies hier für das Englische und Italienische durchgeführt, wo mit corner und angolo jeweils homonym das Toreck und der Eckstoß bezeichnet werden können.

Tabelle 4

Kollokationsprofile (lemmatisiert, Log Likelihood Ratio) von corner (englisch) und angolo (italienisch) im Vergleich

corner angolo
bottom d’
into calcio
a deviare
top in
towards sviluppo
behind favore
the guadagnare
from conquistare
far per
deflect rifugiare
clear battere
result mettere
win deviazione
for un
head primo
nothing .
meet fatto
which chiudere
header conquista
effort ospite

Es zeigt sich, dass die Referenz auf das Toreck auch im Englischen typischerweise durch räumliche Adjektive näher bestimmt wird, um damit Zielpunkte von Schüssen zu lokalisieren. Hier sind die Bezeichnungen bottom/top corner für die vertikale Orientierung üblich sowie far/short corner, um die Position des schießenden Spielers bzw. der schießenden Spielerin anzugeben. Typischerweise werden sie mit den Präpositionen into oder towards kombiniert. Im Italienischen hingegen sind Formulierungen wie nell’angolo basso (‚ins untere Eck‘) zwar möglich, aber eher selten. Hier überwiegt sehr deutlich die Referenz auf den Eckstoß (calcio d’angolo). In einem mit der deutschen Verwendung vergleichbaren metonymischen Verfahren steht angolo für den gesamten Spielzug, der – vergleichbar zum deutschen herausholen oder zum englischen to win – verdient (guadagnare) oder erobert (conquistare) werden kann. Den Ball einem Eckstoß zuführen, indem man ihn ins eigene Toraus spielt, wird hier mit der syntaktisch markierten, artikellosen Präpositionalphrase in angolo ausgedrückt, die sich mit weiteren Kollokaten wie deviare/mettere/chiudere in angolo (wörtlich: ‚umleiten‘, ‚schicken‘, ‚abschließen‘) verbindet (13):

Hier ist es gerade die artikellose Konstruktion, die die metonymische Lesart von angolo sicherstellt, während die kanonische Konstruktion nell’angolo auf die tatsächlich räumliche Ecke (des Tores oder des Spielfeldes) referieren würde.

Typische Verbindungen im Englischen, welche die metonymische Lesart von corner aufrufen, sind to deflect/to clear for a corner, wobei hier besonders die Präposition for aufschlussreich ist, die der im Deutschen üblichen Formulierung zur Ecke und der im Italienischen gebräuchlichen Formulierung in angolo gegenübersteht. Sehr frequent ist zudem die Kombination mit behind (14-15):

Diese Formulierung ist offenbar dadurch motiviert, dass das Spiel ins eigene Toraus, die gewöhnliche Orientierung aufs gegnerische Tor vorausgesetzt, nach hinten gerichtet ist. So naheliegend diese deiktische Markierung ist, so ist sie doch im Deutschen und Italienischen ungebräuchlich, wo stattdessen die oben beschriebene präsuppositionale Formulierung bevorzugt wird.

Schließlich zeigt sich im englischen Kollokationsprofil eine mit der deutschen Formulierung bringt nichts ein vergleichbare festgefügte Wortverbindung comes to nothing zur Referenz auf erfolglose Eckstöße (16):

Eine vergleichbare Formulierung im Italienischen, die sich jedoch nicht ganz so prägnant im Kollokationsprofil widerspiegelt, ist nulla di fatto (17):

Auf diese Weise können auf explorativem Wege typische Formulierungsmuster rund um den zentralen Spielzug des Eckstoßes erhoben und sprachvergleichend untersucht werden. In anderen Sprachen wie dem Spanischen oder dem Niederländischen gestaltet sich das noch einmal komplexer, weil hier mit corner einerseits und tiro de esquina bzw. hoekschop andererseits je verschiedene Ausdrücke für die Spielsituation als ganze und den geschlagenen Eckstoß zur Verfügung stehen. Aber gerade diese Differenzierung korpusgestützt erarbeiten zu lassen und, framesematisch gesprochen, die einzelsprachlichen lexikalischen Ausgestaltungen des Frames zu erheben, kann auch eine didaktisch reizvolle Aufgabe sein.

5. Fazit und Ausblick

In diesem Beitrag wurden die multilingualen Korpora zur Fußballlinguistik vorgestellt, welche als Ressourcen für korpusgestützte Didaktisierungen des Themas Fußballsprache im (Fremd-)Sprachunterricht verwendet werden können. Sowohl für indirekte, also die Erstellung von Lehrmaterialien und -konzepten anleitende Anwendungen, als auch für direkte, die Arbeit mit den Korpora in den Unterricht integrierende Anwendungen können die Korpora genutzt werden. Insbesondere die Kombination mit dem mehrsprachigen elektronischen Wörterbuch Kicktionary scheint ein geeigneter Zugang zu sein, um den stark ausdifferenzierten und sich von der Gemeinsprache deutlich abhebenden Fußballwortschatz zu vermitteln. Auch wenn hierbei die Lexik der primäre Vermittlungsgegenstand ist, erlaubt es der korpuslinguistische Zugang, über Einzellexeme und ihre Bedeutungsangaben und ggf. Übersetzungen hinauszugehen. Auch das grammatische Verhalten der Lexeme und sogar umfassendere, teilweise idiomatische Formulierungsmuster können und sollen adressiert werden, da diese erst den sicheren rezeptiven und produktiven Umgang mit dem Fußballwortschatz erlauben. Die multilinguale Anlage der Korpora, die Texte in zwölf europäischen Sprachen beinhalten, ermöglichen zudem sprachvergleichende Erkundungen, die vor allem für multinational zusammengesetzte Lernendengruppen interessant sein können.

Exemplifiziert wurden die didaktischen Potenziale der Korpora und des korpusgestützten Arbeitens anhand der für das deutsche charakteristischen Differenzierung zwischen den jeweils hochfrequenten Lexemen Ecke und Eck. Ein vergleichbarer Gegenstand wäre der Ausdruck Abschluss, der in einer Reihe von Wortverbindungen wie zum Abschluss kommen, den Abschluss suchen, am Abschluss hindern oder auch Präzision im Abschluss vorkommt, die übrigens in vielen Sprachen wie etwa dem Französischen oder Italienischen keine direkte Entsprechung haben. Natürlich bieten sich aber auch andere Zugriffsobjekte an, z.B. die fußballtypische Valenzreduktion frequenter Verben (vgl. Ebeling 2021) wie etwa im Deutschen klären, retten oder vollenden oder im Englischen to save oder span. despejar. Ein weiterer interessanter Anwendungsbereich wäre die Phraseologie, weisen doch Fußballliveticker und -spielberichte eine große Bandbreite idiomatischer oder auch metaphorischer Phraseme wie etwa auf des Messers Schneide stehen oder Sand im Getriebe auf (vgl. Meier 2019b). Zweifellos müssen phraseodidaktische Zugänge (vgl. Hallsteinsdóttir 2011) in der Vermittlung der Fußballsprache eine wichtige Rolle spielen, und umgekehrt können Texte der Fußballberichterstattung gerade in ihrer korpuslinguistischen Aufbereitung und der bequemen Durchsuchbarkeit eine äußerst ertragreiche Materialbasis für die Phraseodidaktik sein, an denen sich der phraseologische Dreischritt aus Erkennen, Entschlüsseln und Erwerben (vgl. Hallsteinsdóttir 2011: 7) vollziehen lässt. Schließlich sind auch im Bereich der Phraseologie sprachvergleichende Analysen möglich und finden in den Korpora eine geeignete Ressource. So kann etwa gefragt werden, wie sich metaphorische Projektionen aus dem Bildfeld der Technik (vgl. Beljutin 2014: 331) in verschiedenen Sprachen in Phrasemen sedimentieren (etwa dt. mit angezogener Handbremse, ndrl. duw- en trekwerk, ital. a trazione anteriore und span. sala de máquinas) (vgl. Meier-Vieracker 2022).

Abschließend sei noch auf eine weitere korpuslinguistische Ressource für die deutsche Fußballsprache hingewiesen. In den Korpora des Digitalen Wörterbuchs der deutschen Sprache dwds.de ist seit kurzem ein sehr großes Webkorpus Ballsportarten verfügbar mit rund 638.000 Texten im Umfang von knapp 375 Mio. Wörtern in annotierter Form4. Nach kostenloser Anmeldung kann im Korpus mit der bekannten Suchsyntax des dwds.de recherchiert werden. Rein von der Größe übertrifft das Korpus die hier vorgestellten Korpora zur Fußballlinguistik bei weitem. Der verwendeten Methode des vollautomatisierten Webscrapings entsprechend (vgl. Barbaresi 2019), die die kompletten Webseiten einschließlich der Nutzerkommentare erfasst, sind die Korpora jedoch thematisch sowie textsorten- und registerbezogen deutlich heterogener. Außerdem stehen für dieses Spezialkorpus die erweiterten statistischen Auswertungen wie etwa das auf Kollokationsanalysen beruhende Wortprofil nicht zur Verfügung. Gleichwohl sind die Korpora eine wertvolle Ressource für ergänzende Korpusabfragen. Nützlich ist auch das im Entstehen begriffene DWDS-Themenglossar Fußball5. Hier werden knapp 400 Wörter und Wendungen in kurzen Wörterbucheinträgen erläutert und mit den ausführlichen Wörterbucheinträgen verknüpft, die auch Korpusbelege führen.

Die Erstellung des Webkorpus Ballsportarten geschah übrigens mit der frei verfügbaren Software trafilatura (vgl. Barbaresi 2021), ein generisches, auf eine große Bandbreite unterschiedlicher Webseitenstrukturen passendes Scraping-Tool, das auch Nutzenden mit geringen Informatikkenntnissen die automatisierte Erstellung von Textkorpora erlaubt. Liveticker und Spielberichte von kicker.de, weltfussball.de oder auch fremdsprachigen Anbietern können so auf einfachem Wege selbst erhoben und korpuslinguistisch aufbereitet werden. Für erweiterte korpuslinguistische Anwendungen wie etwa Ngram-Analysen mit der freien Software AntConc6 oder auch die Berechnung von Word Embeddings (vgl. Bubenhofer 2020), die auch für die didaktische Exploration von domänenspezifischen Wortschätzen genutzt werden könnten (vgl. Meier-Vieracker 2021 a), stehen die Wege somit offen. Für alle an der Fußballsprache und ihrer Vermittlung Interessierten, die nicht in dieser Tiefe in die korpuslinguistische Arbeit einsteigen wollen, aber dennoch gut aufbereitete Korpusangebote nutzen wollen, stehen mit den Korpora zur Fußballlinguistik und mit dem Webkorpus Ballsportarten nützliche Ressourcen zur Verfügung.

Notes

  1. Neben bundesdeutschen Texten ist in einem Teilkorpus von Texten von nzz.ch auch das Schweizer Standarddeutsche erfasst, das in einigen lexikalischen und grammatischen Details Besonderheiten aufweist (vgl. Glauninger / Graf 2010). [^]
  2. Der im TreeTagger implementierte Lemmatisierer arbeitet lexikonbasiert und gibt bei unbekannten Wörtern die Wortform aus, so dass bei weniger frequenten Wörtern verschiedene Flexionsformen in die Lemmaliste eingehen können. [^]
  3. Die Belege (3) und (4) enthalten mit Schuss und 20-Meter-Freistoß noch weitere fußballtypische Metonymien, bezeichnen sie in diesen konkreten Fällen doch nicht die Schüsse selbst, sondern die in diesen Schüssen gespielten Bälle. [^]
  4. https://www.dwds.de/d/korpora/ballsport (15.10.2021). [^]
  5. https://www.dwds.de/themenglossar/Fu%C3%9Fball (15.10.2021). [^]
  6. https://www.laurenceanthony.net/software/antconc/ (15.10.2021). [^]

Literatur und Ressourcen

Aleixandre-Benavent, Rafael et al. (2007): Terminología y lenguaje deportivo del fútbol. In: Cultura, Ciencia y Deporte 2: 6, 117–123.

Barbaresi, Adrien (2019): The Vast and the Focused: On the need for thematic web and blog corpora. In: 7th Workshop on Challenges in the Management of Large Corpora (CMLC-7). Cardiff, United Kingdom: Leibniz-Institut für Deutsche Sprache, 29–32. https://hal.archives-ouvertes.fr/hal-02447305 (15.10.2021).

Barbaresi, Adrien (2021): trafilatura: Web scraping tool for text discovery and retrieval. https://github.com/adbar/trafilatura (15.10.2021).

Beljutin, Roman (2014): Metaphorische Projektionen im deutschen und russischen Sportdiskurs. In: Muttersprache 2014 Nr. 4, 322–341.

Benzer, Ahmet (2010): Türk Futbol Dili. İn: Journal of Language and Linguistic Studies 6: 2, 88–103.

Bergh, Gunnar / Ohlander, Sölve (2012): Free kicks, dribblers and WAGs. Exploring the language of “the people’s game”. In: Moderna språk 106: 1, 11–46.

Bergh, Gunnar / Ohlander, Sölve (2020): From National to Global Obsession: Football and Football English in the Superdiverse 21st Century. In: Nordic Journal of English Studies 19: 5, 359–383.

BNC Consortium (2007): The British National Corpus, XML Edition 2007, Oxford Text Archive, http://hdl.handle.net/20.500.12024/2554.

Bubenhofer, Noah (2020): Semantische Äquivalenz in Geburtserzählungen: Anwendung von Word Embeddings. In: Zeitschrift für germanistische Linguistik 48: 3, 562–589.

Burkhardt, Armin (2006a): Wörterbuch der Fußballsprache. Göttingen: Werkstatt.

Burkhardt, Armin (2006b): Sprache und Fußball. Linguistische Annäherung an ein Massenphänomen. In: Muttersprache 2006 Nr. 1, 53–73.

Burkhardt, Armin (2010): Der deutsche Fußball und seine Sprache. Ein Beitrag zur Fach- und Sondersprachendidaktik im DaF-Unterricht. In: Brünner Hefte zu Deutsch als Fremdsprache 3: 2, 149–166.

Carvalho, Nildemir Ferreira de (1996): Estruturas semânticas no léxico do futbol. In: Alfa: Revista de Lingüística Nr. 40, 75–102.

Chambers, Angela (2005): Integrating corpus consultation in language studies. In: Language Learning & Technology 9: 2, 111–125.

Ebeling, Signe Oksefjell (2021): To Score or to Score a Goal: Transitivity in Football Match Reports. In: English Studies 102: 2, 243–266.

Evert, Stefan (2009): Corpora and collocations. In: Lüdeling, Anke (Hrsg.): Corpus Linguistics. An International Handbook. Berlin / Boston: De Gruyter Mouton, 1212–1248.

Flinz, Carolina / Perkuhn, Rainer (2018): Wortschatz und Kollokationen in „Allgemeine Reisebedingungen“. Eine intralinguale und interlinguale Studie zum fachsprachlich-lexikographischen Projekt „Tourlex“. In: Cibej, Jaka / Gorjanc, Vojko / Kosem, Iztok / Krek, Simon (Hrsg.): Proceedings of the XVIII EURALEX International Congress Lexicography in Global Contexts 17–21 July 2018, Ljubljana. Ljubljana: Ljubljana University Press, 959–966.

Glauninger, Manfred Michael / Graf, Martin Hannes (2010): Österreichischer und schweizderdeutscher Fußball-Jargon. In: Der Deutschunterricht 62: 3, 66–75.

Häcki Buhofer, Annelies et al. (2014): Feste Wortverbindungen des Deutschen. Kollokationenwörterbuch für den Alltag. Tübingen: Francke.

Hallsteinsdóttir, Erla (2011): Aktuelle Forschungsfragen der deutschsprachigen Phraseodidaktik. In: Linguistik Online 47: 3, 3–31.

Hardie, Andrew (2012): CQPweb — combining power, flexibility and usability in a corpus analysis tool. In: International Journal of Corpus Linguistics 17: 3, 380–409.

Hausmann, Franz Josef (2004): Was sind eigentlich Kollokationen? In: Steyer, Kathrin (Hrsg.): Wortverbindungen - mehr oder weniger fest. Berlin / Boston: De Gruyter, 309–334.

Jackson, Ross / Penot, Erich (1983): Fussballterminologie (D-F-I-E). In: Lebende Sprachen 28: 2, 85–88.

Kern, Friederike / Siehr, Karl-Heinz (Hrsg.) (2016): Sport als Thema im Deutschunterricht. Fachliche Grundlagen – Unterrichtsanregungen – Unterrichtsmaterialien. Potsdam: Universitätsverlag Potsdam.

Knuchel, Daniel / Bubenhofer, Noah (2020): Korpuslinguistische Expeditionen als Anregung zur Reflexion über Sprachgebrauch – Forschendes Lernen mit dem DWDS und dem DeReKo. In: Der Deutschunterricht 76: 6, 63–76.

Lavric, Eva (2008): Introduction. In: Lavric, Eva (Hrsg.): The linguistics of football. (= Language in performance 38). Tübingen: Gunter Narr Verlag, 5–8.

Leibniz-Institut für Deutsche Sprache (2021): Deutsches Referenzkorpus / Archiv der Korpora geschriebener Gegenwartssprache 2021-I (Release vom 02.02.2021). Mannheim: Leibniz-Institut für Deutsche Sprache. www.ids-mannheim.de/DeReKo (15.10.2021).

Malloggi, Patrizio (2021): Zur Förderung der Kollokationskompetenz in der DaF-/DaZ-Didaktik für den Tourismus anhand von DWDS-Korpora. In: Korpora Deutsch als Fremdsprache 1: 1, 6–24.

Meier, Simon (2017): Korpora zur Fußballlinguistik – eine mehrsprachige Forschungsressource zur Sprache der Fußballberichterstattung. In: Zeitschrift für germanistische Linguistik 45: 2, 345–349.

Meier, Simon (2019a): mitfiebern – Mediatisierte emotionale Kommunikationspraktiken in Fußball-Livetickern und Livetweets. In: Hauser, Stefan / Luginbühl, Martin / Tienken, Susanne (Hrsg.): Mediale Emotionskulturen. Bern: Lang, 155–178.

Meier, Simon (2019b): Formulaic language and text routines in football live text commentaries and match reports – a cross- and corpus-linguistic approach. In: Callies, Marcus / Levin, Magnus (Hrsg.): Corpus approaches to the language of sport. Texts, media, modalities. London: Bloomsbury, 13–35.

Meier-Vieracker, Simon (2021a) Football Word Embeddings. In: Fußballlinguistik. https://fussballlinguistik.de/2021/10/football-word-embeddings/ (15.10.2021).

Meier-Vieracker, Simon (2021b). Diskurslinguistik für Fans. Kritisches Medienmonitoring von Fußballfans als Gegenstand und Ziel der Diskurslinguistik. In Zeitschrift für Diskursforschung 2020 (2/3), 118–140.

Meier-Vieracker, Simon (2022). Kontrastive Phraseologie des Fußballs. Ein korpuslinguistischer Zugang. In: Linguistische Treffen in Wroclaw 20: II, 133–146.

Oksefjell Ebeling, Signe (2019): The language of football match reports in a contrastive perspective. In: Callies, Marcus / Levin, Magnus (Hrsg.): Formulaic language and text routines in football live text commentaries and match reports – a cross- and corpus-linguistic approach. London: Bloomsbury, 37–62.

Roelcke, Thorsten (2015): Besondere Wörter II: Fachwörter, Termini. In: Haß, Ulrike / Storjohann, Petra (Hrsg.): Handbuch Wort und Wortschatz. Berlin / Boston: De Gruyter, 371–393.

Römer, Ute (2009): Corpora and language teaching. In: Lüdeling, Anke (Hrsg.): Corpus Linguistics. An International Handbook. Berlin / Boston: De Gruyter Mouton, 112–131.

Schmid, Helmut (2003): Probabilistic part-of-speech tagging using decision trees. In: Jones, D.B. / Somers H. (Hrsg.): New methods in language processing. London: Routledge, 154–164.

Schmidt, Thomas (2009a): The Kicktionary – a multilingual lexical resource of football language. In: Boas, Hans C. (Hrsg.): Multilingual FrameNets in Computational Lexicography. Methods and Applications. Berlin / Boston: De Gruyter Mouton, 101–132.

Schmidt, Thomas (2009b): Kicktionary. In: Burkhardt, Armin / Schlobinski, Peter (Hrsg.): Flickflack, Foul und Tsukahara. Der Sport und seine Sprache. Mannheim: Dudenverlag, 117–132.

Schönfelder, Karl-Heinz (1954): Englische Lehnwörter in der deutschen Fußballsprache. In: Zeitschrift für Anglistik und Amerikanistik 2: 3, 295–326.

Stefanowitsch, Anatol (2020): Corpus linguistics: A guide to the methodology. Berlin: Language Science Press.

Steyer, Kathrin (2002): Wenn der Schwanz mit dem Hund wedelt. Zum linguistischen Erklärungspotenzial der korpusbasierten Kookkurrenzanalyse. In: Ansichten der deutschen Sprache. Festschrift für Gerhard Stickel zum 65. Geburtstag. Tübingen: Narr, 215–236.

Valk, Melvin (1935): Die Entwicklung der Deutschen Fussballsprache. In: The Journal of English and Germanic Philology 34: 4, 567–571.

Vollmert-Spiesky, Sabine (1996): Vergleichende Untersuchung der Lexik des Fußballspiels im Russischen, Polnischen und Deutschen. Ein Beitrag zur Eurolinguistik. Wiesbaden: Harrassowitz.

Yıldırım, Kaya (2006): Fußball-Wörterbuch in 7 Sprachen: Deutsch – English – Français – Italiano - Español Türkçe. Bielefeld: Reise-Know-How.

Ziem, Alexander (2015): Fußball für Anfänger: Sieben Thesen zur Konzeption eines Online-Wörterbuches für den Sprachunterricht. In: Born, Joachim / Gloning, Thomas (Hrsg.): Sport, Sprache, Kommunikation, Medien. Interdisziplinäre Perspektiven. Gießen: Gießener Elektronische Bibliothek, 381–410.

Biographische Notiz

Simon Meier-Vieracker, Prof. Dr., Professor für Angewandte Linguistik am Institut für Germanistik der TU Dresden, zuvor wissenschaftlicher Mitarbeiter an der TU Berlin und wissenschaftlicher Assistent an der Universität Bern. Seine Forschungsschwerpunkte liegen in der Korpuslinguistik, der Medienlinguistik und der Diskurslinguistik.