<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Publishing DTD v1.2 20120330//EN" "http://jats.nlm.nih.gov/publishing/1.2/JATS-journalpublishing1.dtd">
<!--<?xml-stylesheet type="text/xsl" href="article.xsl"?>-->
<article article-type="research-article" dtd-version="1.2" xml:lang="de" xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id journal-id-type="issn">2749-4411</journal-id>
<journal-title-group>
<journal-title>Zeitschrift Korpora Deutsch als Fremdsprache</journal-title>
</journal-title-group>
<issn pub-type="epub">2749-4411</issn>
<publisher>
<publisher-name>Universit&#228;ts- und Landesbibliothek Darmstadt</publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id pub-id-type="doi">10.48694/tujournals-3739</article-id>
<article-categories>
<subj-group>
<subject>Section corpora</subject>
</subj-group>
</article-categories>
<title-group>
<article-title><italic>VIELKO</italic> - Vietnamesisches Lernerkorpus</article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname>Van Ho</surname>
<given-names>Thi Bao</given-names>
</name>
<email>vanhtb@ulis.vnu.edu.vn</email>
<xref ref-type="aff" rid="aff-1">1</xref>
</contrib>
</contrib-group>
<aff id="aff-1"><label>1</label>Universit&#228;t Leipzig / University of Languages and International Studies &#8211; VNU</aff>
<pub-date publication-format="electronic" date-type="pub" iso-8601-date="2023-07-27">
<day>27</day>
<month>07</month>
<year>2023</year>
</pub-date>
<pub-date pub-type="collection">
<year>2023</year>
</pub-date>
<volume>3</volume>
<issue>1</issue>
<fpage>152</fpage>
<lpage>158</lpage>
<permissions>
<copyright-statement>Copyright: &#x00A9; 2023 The Author(s)</copyright-statement>
<copyright-year>2023</copyright-year>
<license license-type="open-access" xlink:href="http://creativecommons.org/licenses/by/4.0/">
<license-p>CC BY 4.0 International - Creative Commons, Namensnennung. See <uri xlink:href="http://creativecommons.org/licenses/by/4.0/">http://creativecommons.org/licenses/by/4.0/</uri>.</license-p>
</license>
</permissions>
<self-uri xlink:href="https://kordaf.tujournals.ulb.tu-darmstadt.de/articles/10.48694/tujournals-3739"/>
<abstract>
<p>Das <italic>Vietnamesische Lernerkorpus</italic> (<italic>VieLko</italic>) wird seit 2017 im Rahmen eines laufenden, gemeinsamen Projekts zwischen zwei Hochschulen in Vietnam entwickelt und gilt als die erste landesweit, systematisiert aufgebaute Datensammlung mit sprachlichen Produkten von vietnamesischen Studierenden des Deutschen als Fremdsprache (DaF). Das Korpus umfasst sowohl geschriebene als auch gesprochene Lernerdaten: Die geschriebenen Daten wurden bisher mit vier Annotationsarten versehen, die gesprochenen Daten bleiben stets in ihrer digitaler Rohform. Seit Juni 2022 steht <italic>VieLko</italic> externen Forschenden sowie Interessierten mit beschr&#228;nkter Zug&#228;nglichkeit zur Verf&#252;gung: Mithilfe einer lokal gespeicherten Kopie des Korpus haben Nutzer*innen die M&#246;glichkeit, Konkordanzen in Bezug auf folgende Aspekte zu erstellen und auszusuchen: Tokenisierung, Lemmatisierung, Wortart, erste Zielhypothese. In der n&#228;chsten Entwicklungsphase (2023&#8211;2024) wird angestrebt, den freien Zugang zu den vorhandenen Korpusdaten auf einem Repositorium zu erm&#246;glichen, sowie den Umfang des Datenbestandes zu erweitern.</p>
</abstract>
<trans-abstract xml:lang="en">
<p>The <italic>Vietnamese Learner Corpus</italic> (<italic>VieLko</italic>) came into development in 2017 as a result of an on-going, joint project between two universities in Vietnam and is the first nationwide, systematically established database with data from Vietnamese students learning German as a Foreign Language. The corpus comprises not only written, but also spoken data: The written data have undergone linguistic processing and now contain four types of annotation, while the spoken data are left intact in their digital raw form. Since June 2022, <italic>VieLko</italic> has been, with limited access, available to the public through the use of a local copy that enables users to create and search for concordances with regard to the following aspects: tokenisation, lemmatisation, parts of speech, and first level target hypothesis. In the next phase of development (2023&#8211;2024), the existing corpus data will be published on a repository with free access to external users, while new data will also be collected to widen the scope of the corpus.</p>
</trans-abstract>
<kwd-group>
<kwd>Korpus</kwd>
<kwd>Lernerkorpus</kwd>
<kwd>Deutsch als Fremdsprache</kwd>
<kwd>Lernersprache</kwd>
</kwd-group>
<kwd-group xml:lang="en">
<kwd>corpus</kwd>
<kwd>learner corpus</kwd>
<kwd>German as a Foreign Language</kwd>
<kwd>learner language</kwd>
</kwd-group>
</article-meta>
</front>
<body>
<sec>
<title>1. &#220;ber das Projekt</title>
<p>Das Lernerkorpus <italic>VieLko</italic> entstand im Rahmen des DAAD-gef&#246;rderten bilateralen <italic>Germanistischen Partnerschaftsprogramms</italic> (<italic>GIP</italic>) zwischen zwei Hochschulen in Vietnam &#8211; n&#228;mlich der ULIS<xref ref-type="fn" rid="n1">1</xref> und der HANU<xref ref-type="fn" rid="n2">2</xref> &#8211; und der Universit&#228;t Leipzig sowie der Justus-Liebig-Universit&#228;t Gie&#223;en. Bei <italic>VieLko</italic> handelt es sich um die parallele Entwicklung von zwei Teilkorpora &#8211; n&#228;mlich dem ULIS-Teilkorpus und dem HANU-Teilkorpus, die dieselbe Infrastruktur teilen, aber einzelne Unterschiede bez&#252;glich des Umfangs der Prim&#228;rdaten sowie des Anteils der annotierten Daten aufweisen. Beide Teilkorpora verf&#252;gen &#252;ber ein sogenanntes &#8218;Kernkorpus&#8216;, das ausschlie&#223;lich aus schriftlichen Daten besteht und u. a. auf der Ebene der ersten Zielhypothese annotiert wird (s. <xref ref-type="fig" rid="F1">Abbildung 1</xref>).</p>
<p>Eine &#220;bersicht des Datenbestands beider Teilkorpora befindet sich im Folgenden:</p>
<fig id="F1">
<label>Abbildung 1</label>
<caption>
<p>&#220;bersicht &#252;ber die Daten in beiden Teilkorpora von <italic>VieLko</italic></p>
</caption>
<graphic xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="kordaf-3739_van-ho-g1.png"/>
</fig>
</sec>
<sec>
<title>2. Datenbestand</title>
<sec>
<title>2.1 Metadaten</title>
<p>Bei der Erhebung der <italic>VieLko</italic>-Metadaten wurde besonders auf den Bildungshintergrund bzw. auf sprachbiographische Daten der Studierenden geachtet. Dabei wurden folgende Arten von Metadaten erhoben:</p>
<list list-type="order">
<list-item><p>Allgemeine Daten zum Bildungshintergrund: Jahrgang, Studienrichtung, Institution, Art des Abschlusses, Studierendenmotivation</p></list-item>
<list-item><p>Allgemeine Daten zur Sprachbiographie: Muttersprache (L1) und Fremdsprachen (der Reihenfolge des Erwerbs nach jeweils gekennzeichnet als L2.1, L2.2, L2.3)</p></list-item>
<list-item><p>Spezifische Daten zum Fremdsprachenerwerb: Beginn des Spracherwerbs (an der Schule bzw. an der Universit&#228;t), durchschnittliche Stundenzahl des Sprachunterrichts auf jeder Bildungsebene (an der Schule bzw. an der Universit&#228;t), Stundenzahl des Sprachunterrichts bei Muttersprachler*innen (falls vorhanden);</p></list-item>
<list-item><p>Spezifische Daten zum DaF-Erwerb: Ort und Dauer von Aufenthalten im deutschsprachigen Raum (falls vorhanden).</p></list-item>
</list>
<p>Neben diesen Lerner-Metadaten wurden auch Daten zu den erhobenen Texten gesammelt, die auch in den annotierten Dateien mitkodiert wurden und daher aktuell in der frei zug&#228;nglichen Version des Korpus lesbar und durchsuchbar sind. Eine dritte Art von Metadaten ist im Projekt lediglich zur internen Nutzung archiviert, und beinhaltet Informationen zu den verantwortlichen Projekt-Mitwirkenden sowie Einzelheiten zum Format der Pr&#252;fungen.</p>
<fig id="F2">
<label>Abbildung 2</label>
<caption>
<p>Beispiel f&#252;r die Kodierung von Lerner-Metadaten in <italic>EXMARaLDA</italic> (<italic>Dulko</italic>)</p>
</caption>
<graphic xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="kordaf-3739_van-ho-g2.png"/>
</fig>
</sec>
<sec>
<title>2.2 Prim&#228;rdaten</title>
<p>Die Prim&#228;rdaten in <italic>VieLko</italic> sind vollst&#228;ndig digitalisiert und beinhalten Pr&#252;fungstexte sowie bewertete Pr&#252;fungsleistungen von vietnamesischen Studierenden, die ein Germanistikstudium an der ULIS bzw. an der HANU erfolgreich abgeschlossen haben. Zum Zweck der Datenerhebung haben sich die zwei Projekt-Teams auf eine Auswahl an Fachbereichen sowie Pr&#252;fungsarten geeinigt, die u. a. an beiden Hochschulen vorhanden sind und des Weiteren eine m&#246;glichst repr&#228;sentative &#220;bersicht &#252;ber den sprachlichen Erwerbsprozess der Proband*innen darstellen kann (s. <xref ref-type="fig" rid="F1">Abbildung 1</xref>): Die Daten in den Bereichen A1-B2 umfassen Texte aus den Abschlusspr&#252;fungen in den Sprachkursen, die sich nach den entsprechenden GER-Sprachniveaus richten<xref ref-type="fn" rid="n3">3</xref> und in den ersten vier Semestern des Bachelorprogramms an beiden Hochschulen zu besuchen sind. Ab dem f&#252;nften Semester beteiligen sich Studierende je nach Fachrichtung an verschiedenen Seminaren in den Bereichen Linguistik, Translation, Literatur- und Kulturstudien &#8211; und zus&#228;tzlich noch an einem Sprachkurs zum Zielniveau C1 an der HANU, wo sie weitere Pr&#252;fungsleistungen wie Vortr&#228;ge, Hausarbeiten, Portfolioarbeiten oder Klausuren abschlie&#223;en m&#252;ssen. Am Ende des Bachelorprogramms haben Studierende die Wahl, eine Abschlussarbeit zu schreiben. Im Gegensatz dazu gibt es im Master-Bereich eine geringere Anzahl von Leistungen: Als Korpusdaten wurden lediglich Hausarbeiten in den Fachseminaren und die obligatorischen Masterarbeiten erhoben. Diese Daten wurden wegen struktureller Unterschiede des Masterstudiengangs sowie der Vielzahl externer Studienbewerber*innen nur als Querschnittdaten erhoben, w&#228;hrend im Bachelor-Bereich die Erhebung von sowohl Querschnitt- als auch L&#228;ngsschnittdaten gelungen ist.</p>
<p>Die <italic>VieLko</italic>-Prim&#228;rdaten unterscheiden sich in einer weiteren fundamentalen Eigenschaft: So sind manche Daten gesprochensprachlicher Kommunikation entnommen, bei anderen handelt es sich um schriftliche Textdaten. M&#252;ndliche Daten sind nur im ULIS-Teilkorpus vorhanden und wurden in Pr&#252;fungen im DaF-Bereich (als Paarpr&#252;fung mit Aufgaben im Format des Goethe-Zertifikats), in Dolmetsch-Pr&#252;fungen (als Einzelpr&#252;fung mit Aufgaben zum simultanen Dolmetschen), sowie in linguistischen Seminaren (als Einzelleistung beim Gruppenvortrag) aufgenommen. Wegen technischer Beschr&#228;nkungen wurden diese in den vorgegangenen Entwicklungsphasen des Projekts au&#223;er Betracht gelassen. Die Daten bleiben daher aktuell in ihrer digitalen Rohform als <italic>mp3</italic>-Dateien, d. h. sie wurden weder transkribiert noch annotiert, und enthalten keine Metadaten.</p>
<p>Bei dem schriftlichen Datenbestand wurden alle Pr&#252;fungstexte vom Original abgescannt und zu <italic>txt</italic>-Dateien in <italic>UTF-8</italic> digitalisiert. Hausarbeiten und Abschlussarbeiten wurden als <italic>PDF</italic>- oder <italic>Word</italic>-Dateien erhoben. Pers&#246;nliche Daten und Eigennamen von Personen wurden vollst&#228;ndig anonymisiert. Zur weiteren Aufbereitung und Annotation wurde ein Ausschnitt der gesamten Daten f&#252;r das Kernkorpus gew&#228;hlt. Seitens der ULIS wurde eine gemischte Sammlung von Quer- und L&#228;ngsschnittdaten aus dem DaF-Bereich (A2, B1, B2) und aus dem &#220;bersetzen-Bereich ausgew&#228;hlt, w&#228;hrend sich das HANU-Team f&#252;r den ganzen Bestand seiner B1-Texte entschieden hat (s. <xref ref-type="fig" rid="F1">Abbildung 1</xref>). Da die Mehrheit dieser Texte aus verschiedenen Pr&#252;fungen stammte, l&#228;sst sich dabei eine Vielzahl an Textsorten finden: Briefe bzw. E-Mails, Blogkommentare, Forumsbeitr&#228;ge (bei den DaF-Texten); Zeitungsartikel, Gebrauchsanweisungen usw. (bei den &#220;bersetzungstexten).</p>
<p>Richtlinien zur Datenaufbereitung und -annotation des Kernkorpus wurden in Anlehnung an die fehlerannotierten Korpora <italic>MERLIN</italic> (vgl. <xref ref-type="bibr" rid="B1">Boyd et al. 2014</xref>) und <italic>FALKO</italic> (vgl. <xref ref-type="bibr" rid="B5">Reznicek et al. 2012</xref>; <xref ref-type="bibr" rid="B3">Hirschmann et al. 2022: 142&#8211;144</xref>) entworfen. Mithilfe des Korpuswerkzeugs <italic>EXMARaLDA</italic> (<italic>Dulko</italic>) (vgl. <xref ref-type="bibr" rid="B2">Hirschmann / Nolda 2019</xref>) wurden die Daten zweifach annotiert:</p>
<list list-type="order">
<list-item><p>Die vier ersten Annotationsspuren erfolgten automatisch anhand von <italic>Dulko</italic>-Transformationen. Das sind: Tokenisierung, Lemmatisierung, Satzspanne und POS-Tagging (<italic>parts of speech tagging</italic>). Diese Annotationsebenen (insbesondere die POS-Annotation) wurden nachgepr&#252;ft, um Fehler des automatischen Taggers vor dem n&#228;chsten Schritt der Annotation zu beheben.</p></list-item>
<list-item><p>Die Annotation der ersten Zielhypothese (ZH1) &#8211; in Anlehnung an das Konzept der minimalen Zielhypothese (vgl. <xref ref-type="bibr" rid="B4">L&#252;deling et al. 2008: 70</xref>; <xref ref-type="bibr" rid="B5">Reznicek 2012: 38&#8211;39</xref>) &#8211; wurde manuell anhand von mehreren Annotationsspuren in <italic>EXMARaLDA</italic> (<italic>Dulko</italic>) durchgef&#252;hrt. Als Triangulationsma&#223;nahme wurde jeder originale Text von zumindest drei Personen behandelt: Die ZH1-Annotation wurde zuerst von zwei vietnamesischen Mitwirkenden gemeinsam mit einem/einer muttersprachlichen Interrater*in erstellt, und schlie&#223;lich mit dem ganzen Team besprochen, bevor die Endversion in <italic>EXMARaLDA</italic> (<italic>Dulko</italic>) eingetragen werden durfte. Dann wurde zus&#228;tzlich dazu die ZH-Diff-Spur hinzugef&#252;gt, die die &#196;nderungen der ersten Zielhypothese im Vergleich zum Originaltext zeigt (s. <xref ref-type="fig" rid="F3">Abbildung 3</xref>).</p></list-item>
</list>
<fig id="F3">
<label>Abbildung 3</label>
<caption>
<p>Beispielannotation f&#252;r die Daten im Kernkorpus</p>
</caption>
<graphic xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="kordaf-3739_van-ho-g3.png"/>
</fig>
</sec>
</sec>
<sec>
<title>3. Korpusnutzung und Weiterentwicklung</title>
<p>Die bisherigen Entwicklungsphasen von <italic>VieLko</italic> wurden als Vorbereitung angedacht, daher lie&#223; sich der Fokus des Korpusaufbaus auf die Einrichtung grundlegender Infrastruktur sowie auf die Pilotierung des Annotationsschemas legen. Weil die bereits annotierten Daten nur einen kleinen Anteil der gesamten Prim&#228;rdaten ausmachen, und zumal das Annotationsschema selbst noch weiterer &#220;berpr&#252;fung bzw. Verfeinerung bedarf, schien es f&#252;r beide Projektteams nicht das vornehmliche Ziel zu sein, das Korpus in seinem aktuellen Zustand online bereitzustellen. Stattdessen wurde eine lokale Kopie mithilfe des <italic>EXMARaLDA</italic>-Begleitprogramms <italic>COMA</italic> erstellt, die auf Anfrage an Interessierte als Ganzes oder je nach individuellen Bed&#252;rfnissen distribuiert werden kann.</p>
<p>Um diese Kopie des Korpus zu durchsuchen, k&#246;nnten Nutzer*innen wieder ein Programm des <italic>EXMARaLDA</italic>-Toolsets verwenden (s. <xref ref-type="fig" rid="F4">Abbildung 4</xref>): Bei der Suche nach allen Infinitivkonstruktionen anhand einer <italic>RegEx</italic>-Anfrage auf der POS-Ebene ergeben sich z. B. 140 Treffer, unter denen nur eine kleine Minderheit Kollokationen mit Pr&#228;fixverben umfasst. Trotz begrenzter Suchm&#246;glichkeit bietet <italic>EXAKT</italic> grundlegende Funktionalit&#228;ten eines Korpusrecherchetools und wird daher f&#252;r Nutzer*innen mit geringen Erfahrungen in der Korpuslinguistik empfohlen (Die lokale <italic>VieLko</italic>-Kopie wird zusammen mit Anleitungen f&#252;r dieses Tool verteilt).</p>
<fig id="F4">
<label>Abbildung 4</label>
<caption>
<p>Korpussuche in <italic>EXAKT</italic> (<italic>EXMARaLDA</italic>) nach Infinitivkonstruktionen im gesamten Kernkorpus</p>
</caption>
<graphic xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="kordaf-3739_van-ho-g4.png"/>
</fig>
<p>F&#252;r komplexere Suchverfahren m&#252;ssten die Korpusdaten manuell exportiert und anhand von weiteren Softwares verarbeitet werden. Empfehlenswert sind u. a. der Texteditor <italic>Notepad</italic>++ (wegen dessen vollst&#228;ndiger Unterst&#252;tzung von <italic>RegEx</italic>-Suchen), oder das Korpusrecherchetool <italic>AntConc</italic>, das neben der Erstellung von Konkordanzen und <italic>RegEx</italic>-Kompatibilit&#228;t weitere analytische Funktionen wie Konkordanzenplot, <italic>n-gram</italic>-Suche oder Wortliste erm&#246;glicht. In <xref ref-type="fig" rid="F5">Abbildung 5</xref> lassen sich zwei Beispiele f&#252;r solche Suchanfragen finden. Beide Suchanfragen beziehen sich auf die ZH1-Diff-Spur (vgl. <xref ref-type="fig" rid="F3">Abbildung 3</xref>): Im Beispiel 5a wird nach allen Artikeln gesucht, die bei der Erstellung der Zielhypothese weggelassen wurden. Im Beispiel 5b wird anhand von einem Konkordanzenplot die Frequenz von syntaktischen &#196;nderungen in der Zielhypothese gezeigt.</p>
<fig id="F5">
<label>Abbildung 5</label>
<caption>
<p>Komplexe Suche der L&#228;ngsschnittdaten anhand von <italic>Notepad</italic>++ (5a, links) und <italic>AntConc</italic> (5b, rechts)</p>
</caption>
<graphic xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="kordaf-3739_van-ho-g5.png"/>
</fig>
<p>F&#252;r die n&#228;chste Phase des Projekts (2023&#8211;2024) ist geplant, den Umfang des Kernkorpus zu erweitern und dessen annotierte Daten, samt Metadaten frei zug&#228;nglich auf einer Online-Plattform zu ver&#246;ffentlichen, um die Nutzerfreundlichkeit beim Umgang mit dem Korpus zu erh&#246;hen. Erw&#252;nscht sind u. a. auch der Einsatz eines Versionisierungssystems und die Erhebung neuer Prim&#228;rdaten.</p>
</sec>
</body>
<back>
<fn-group>
<fn id="n1"><p>University of Languages and International Studies &#8211; Vietnam National University, Hanoi, Vietnam.</p></fn>
<fn id="n2"><p>Hanoi University, Hanoi, Vietnam.</p></fn>
<fn id="n3"><p>Dass sich diese Daten als A1-Texte, A2-Texte usw. bezeichnen lassen, bezieht sich direkt auf die Benennungen der Sprachpr&#252;fungen, bei denen die Texte erhoben wurden, und dient auf keinen Fall als Beweis, dass die Proband*innen zur Zeit der Erhebung die entsprechenden Niveaus erreicht haben.</p></fn>
</fn-group>
<ref-list>
<title>Literatur und Ressourcen</title>
<ref id="B1"><mixed-citation publication-type="book"><string-name><surname>Boyd</surname>, <given-names>Adriane</given-names></string-name> et al. (<year>2014</year>): <chapter-title>The MERLIN corpus: Learner Language and the CEFR</chapter-title>. In: <source>Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC&#8217;14), European Language Resources Association (ELRA)</source>. <publisher-loc>Reykjavik</publisher-loc>: <publisher-name>European Language Resources Association (ELRA)</publisher-name>, <fpage>1281</fpage>&#8211;<lpage>1288</lpage>.</mixed-citation></ref>
<ref id="B2"><mixed-citation publication-type="book"><string-name><surname>Hirschmann</surname>, <given-names>Hagen</given-names></string-name> / <string-name><surname>Nolda</surname>, <given-names>Andreas</given-names></string-name> (<year>2019</year>): <chapter-title>Dulko &#8211; auf dem Weg zu einem deutsch-ungarischen Lernerkorpus</chapter-title>. In: <string-name><surname>Eichinger</surname>, <given-names>Ludwig</given-names></string-name> / <string-name><surname>Plewnia</surname>, <given-names>Albrecht</given-names></string-name> (Hrsg.): <source>Neues vom heutigen Deutsch: Empirisch &#8211; methodisch &#8211; theoretisch</source>. <publisher-loc>Institut f&#252;r Deutsche Sprache</publisher-loc>: <publisher-name>Jahrbuch</publisher-name> 2018. Berlin u.a.: de Gruyter, <fpage>339</fpage>&#8211;<lpage>342</lpage>.</mixed-citation></ref>
<ref id="B3"><mixed-citation publication-type="journal"><string-name><surname>Hirschmann</surname>, <given-names>Hagen</given-names></string-name> / <string-name><surname>L&#252;deling</surname>, <given-names>Anke</given-names></string-name> / <string-name><surname>Shadrova</surname>, <given-names>Anna</given-names></string-name> / <string-name><surname>Bobeck</surname>, <given-names>Dominique</given-names></string-name> / <string-name><surname>Klotz</surname>, <given-names>Martin</given-names></string-name> / <string-name><surname>Akbari</surname>, <given-names>Roodabeh</given-names></string-name> / <string-name><surname>Schneider</surname>, <given-names>Sarah</given-names></string-name> / <string-name><surname>Wan</surname>, <given-names>Shujun</given-names></string-name> (<year>2022</year>): <article-title>FALKO. Eine Familie vielseitig annotierter Lernerkorpora des Deutschen als Fremdsprache</article-title>. In: <source>Korpora Deutsch als Fremdsprache</source> <volume>2</volume>: <issue>2</issue>, <fpage>139</fpage>&#8211;<lpage>148</lpage>. <pub-id pub-id-type="doi">10.48694/kordaf.3552</pub-id>.</mixed-citation></ref>
<ref id="B4"><mixed-citation publication-type="journal"><string-name><surname>L&#252;deling</surname>, <given-names>Anke</given-names></string-name> / <string-name><surname>Doolittle</surname>, <given-names>Seanna</given-names></string-name> / <string-name><surname>Hirschmann</surname>, <given-names>Hagen</given-names></string-name> / <string-name><surname>Schmidt</surname>, <given-names>Karin</given-names></string-name> / <string-name><surname>Walter</surname>, <given-names>Maik</given-names></string-name> (<year>2008</year>): <article-title>Das Lernerkorpus Falko</article-title>. In: <source>Deutsch als Fremdsprache</source> <volume>2</volume> (2008), <fpage>67</fpage>&#8211;<lpage>73</lpage>.</mixed-citation></ref>
<ref id="B5"><mixed-citation publication-type="webpage"><string-name><surname>Reznicek</surname>, <given-names>Marc</given-names></string-name> / <string-name><surname>L&#252;deling</surname>, <given-names>Anke</given-names></string-name> / <string-name><surname>Krummes</surname>, <given-names>Cedric</given-names></string-name> / <string-name><surname>Schwantuschke</surname>, <given-names>Franziska</given-names></string-name> / <string-name><surname>Walter</surname>, <given-names>Maik</given-names></string-name> / <string-name><surname>Schmidt</surname>, <given-names>Karin</given-names></string-name> / <string-name><surname>Hirschmann</surname>, <given-names>Hagen</given-names></string-name> / <string-name><surname>Andreas</surname>, <given-names>Torsten</given-names></string-name> (<year>2012</year>): <source>Das Falko-Handbuch. Korpusaufbau und Annotationen</source>. Version 2.01. HU Berlin. <uri>https://www.linguistik.hu-berlin.de/de/institut/professuren/korpuslinguistik/forschung/falko/FalkoHandbuchV2/</uri> (16.07.2023).</mixed-citation></ref>
</ref-list>
<sec>
<title>Biographische Notiz:</title>
<p>Ho, Thi Bao Van ist seit 2017 im ULIS-Korpusteam als Projektassistentin t&#228;tig. Seit 2020 promoviert sie am Herder-Institut der Universit&#228;t Leipzig zum Thema &#8222;Koh&#228;sion und Koh&#228;renz in Abschlussarbeiten vietnamesischer Studierenden&#8220;, wo sie auch mit Daten aus <italic>VieLko</italic> arbeitet.</p>
<p><styled-content style="text-align: right; display: block; line-height: 0.2"><bold>Kontaktanschrift:</bold></styled-content></p>
<p><styled-content style="text-align: right; display: block; line-height: 0.2">Thi Bao Van Ho</styled-content></p>
<p><styled-content style="text-align: right; display: block; line-height: 0.2">Universit&#228;t Leipzig</styled-content></p>
<p><styled-content style="text-align: right; display: block; line-height: 0.2">Arno-Nitzsche-Str. 40</styled-content></p>
<p><styled-content style="text-align: right; display: block; line-height: 0.2">542, 04277 Leipzig</styled-content></p>
<p><styled-content style="text-align: right; display: block; line-height: 0.2">Deutschland</styled-content></p>
<p><styled-content style="text-align: right; display: block; line-height: 0.2"><ext-link ext-link-type="uri" xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="mailto:vanhtb@ulis.vnu.edu.vn">vanhtb@ulis.vnu.edu.vn</ext-link> / <ext-link ext-link-type="uri" xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="mailto:van.ho@uni-leipzig.de">van.ho@uni-leipzig.de</ext-link></styled-content></p>
</sec>
</back>
</article>