<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Publishing DTD v1.2 20120330//EN" "http://jats.nlm.nih.gov/publishing/1.2/JATS-journalpublishing1.dtd">
<!--<?xml-stylesheet type="text/xsl" href="article.xsl"?>-->
<article article-type="research-article" dtd-version="1.2" xml:lang="de" xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id journal-id-type="issn">2749-4411</journal-id>
<journal-title-group>
<journal-title>Zeitschrift Korpora Deutsch als Fremdsprache</journal-title>
</journal-title-group>
<issn pub-type="epub">2749-4411</issn>
<publisher>
<publisher-name>Universit&#228;ts- und Landesbibliothek Darmstadt</publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id pub-id-type="doi">10.48694/tujournals-4130</article-id>
<article-categories>
<subj-group>
<subject>Section corpora</subject>
</subj-group>
</article-categories>
<title-group>
<article-title>DAS TWIBLOCOP</article-title>
<subtitle>Ein multimediales Korpus aus Blogposts und Tweets</subtitle>
</title-group>
<contrib-group>
<contrib contrib-type="author" corresp="yes">
<name>
<surname>Scheffler</surname>
<given-names>Tatjana</given-names>
</name>
<email>tatjana.scheffler@rub.de</email>
<xref ref-type="aff" rid="aff-1">1</xref>
</contrib>
<contrib contrib-type="author">
<name>
<surname>Seemann</surname>
<given-names>Hannah J.</given-names>
</name>
<email>hannah.seemann@rub.de</email>
<xref ref-type="aff" rid="aff-1">1</xref>
</contrib>
</contrib-group>
<aff id="aff-1"><label>1</label>Ruhr-Universit&#228;t Bochum</aff>
<pub-date publication-format="electronic" date-type="pub" iso-8601-date="2024-12-13">
<day>13</day>
<month>12</month>
<year>2024</year>
</pub-date>
<pub-date pub-type="collection">
<year>2024</year>
</pub-date>
<volume>4</volume>
<issue>2</issue>
<fpage>262</fpage>
<lpage>266</lpage>
<permissions>
<copyright-statement>Copyright: &#x00A9; 2024 The Author(s)</copyright-statement>
<copyright-year>2024</copyright-year>
<license license-type="open-access" xlink:href="http://creativecommons.org/licenses/by/4.0/">
<license-p>CC BY 4.0 International - Creative Commons, Namensnennung. See <uri xlink:href="http://creativecommons.org/licenses/by/4.0/">http://creativecommons.org/licenses/by/4.0/</uri>.</license-p>
</license>
</permissions>
<self-uri xlink:href="https://kordaf.tujournals.ulb.tu-darmstadt.de/articles/10.48694/tujournals-4130/"/>
<abstract>
<p>Das Korpus TwiBloCoP besteht aus deutschsprachigen Blogposts sowie Tweets von 44 Autor:innen, die parallel in beiden Plattformen aktiv waren. Es wurde 2017 erhoben und enth&#228;lt Beitr&#228;ge zum Familienalltag sowie zur Elternschaft. Insgesamt umfasst das Korpus &#252;ber 81.000 Tweets und fast 500 Blogposts. Die Posts wurden anonymisiert, jedoch bleiben Autorschaftsbez&#252;ge medien&#252;bergreifend durch zuf&#228;llige IDs erhalten. Im Korpus wurden drei zu den Medien quer stehende Register identifiziert: informierend, erz&#228;hlend und &#252;berzeugend. Modalpartikeln und Intensivierer wurden zus&#228;tzlich manuell annotiert. Alle Daten stehen auf Anfrage im XML-Format f&#252;r weitere Forschungen zur Verf&#252;gung.</p>
</abstract>
<trans-abstract xml:lang="en">
<p>The TwiBloCoP corpus consists of German blog posts and tweets from 44 authors who were active on both platforms at the same time. It was collected in 2017 and contains posts centered around everyday family life and parenting. In total, the corpus comprises over 81,000 tweets and almost 500 blog posts. The posts were anonymized, but common authorship information was retained across the media using random IDs. Three cross-media registers were identified in the corpus: informative, narrative and persuasive. In addition, modal particles and intensifiers were manually annotated. All data is available on request in XML format for further research.</p>
</trans-abstract>
<kwd-group>
<kwd>Soziale Medien</kwd>
<kwd>Twitter</kwd>
<kwd>Blog</kwd>
<kwd>Familie</kwd>
<kwd>Register</kwd>
<kwd>Modalpartikeln</kwd>
<kwd>Intensivierer</kwd>
</kwd-group>
<kwd-group xml:lang="en">
<kwd>social media</kwd>
<kwd>Twitter</kwd>
<kwd>blog</kwd>
<kwd>family</kwd>
<kwd>register</kwd>
<kwd>modal particles</kwd>
<kwd>intensifiers</kwd>
</kwd-group>
</article-meta>
</front>
<body>
<sec>
<title>1. Einleitung</title>
<p>Das TwiBloCoP (<italic>Twitter + Blog Corpus &#8211; Parenting</italic>) enth&#228;lt deutschsprachige Tweets und Blogposts von 44 Autor:innen aus der Elternblogger-Blogosph&#228;re. Die Autor:innen schreiben in beiden Kommunikationskan&#228;len &#252;ber kinder- und familienbezogene Themen oder berichten von ihrem (Familien-)Alltag. Eine spezifische Community von Autor:innen wurde gew&#228;hlt, um medienspezifische Variation im Inhalt der Texte zu minimieren. Das Thema Elternschaft bot sich an, da zum Zeitraum der Datenerhebung viele Personen zu diesem Themenbereich auf Twitter aktiv waren, die ebenfalls einen Blog betreiben.</p>
</sec>
<sec>
<title>2. Datensammlung und Inhalt</title>
<p>Die Daten wurden im Februar 2017 gesammelt und umfassen Posts aus den vier vorhergegangenen Monaten. Um jeweils sowohl Blogs als auch Tweets derselben Personen zu sammeln, extrahierten wir aus der Twitter-Liste <italic>Elternbloggerkarte</italic> eine Menge von Autor:innen, die sowohl auf Twitter aktiv waren, als auch einen eigenen Blog betreiben. Die Rohdaten aus beiden Medien wurden mithilfe von Python-Skripten gesammelt: Blogposts wurden (wenn m&#246;glich) &#252;ber einen RSS-Feed ausgelesen, die Tweets wurden durch die Twitter-API gesammelt. Die Verlinkung von Blogposts sowie Tweets erfolgte basierend auf der Selbst-Verlinkung des Blogs in der Twitter-Biografie der Autor:innen. Pro Autor:in sind ca. 10 Blogposts und ca. 1800 Tweets vorhanden.</p>
<p>Da die vorliegenden Daten m&#246;glicherweise sensible Inhalte enthalten, haben wir zwei Schritte zur Sicherung des Datenschutzes unternommen. Alle Autor:innen wurden per Opt-Out-Verfahren um Zustimmung zur Nutzung ihrer Texte gebeten. Nach Ausschluss der Personen, die nicht kontaktiert werden konnten oder der Datennutzung widersprachen, befinden sich Texte beider Medien von 44 Personen im Korpus. Die verbleibenden Texte wurden teils automatisch (Usernamen, E-Mailadressen, Telefonnummern, URLs), teils manuell (Personennamen, Ortsnamen) anonymisiert und Namen der Blogs pseudonymisiert. Namen von Personen der &#214;ffentlichkeit wie Politiker:innen oder historische Personen wurden nicht ersetzt.</p>
<p>Alle Texte wurden mithilfe des Python-Pakets SoMaJo<xref ref-type="fn" rid="n1">1</xref> (vgl. <xref ref-type="bibr" rid="B6">Proisl / Uhrig 2016</xref>) automatisch satzsegmentiert und tokenisiert. <xref ref-type="table" rid="T1">Tabelle 1</xref> zeigt eine &#220;bersicht &#252;ber die Gr&#246;&#223;e des resultierenden Korpus.</p>
<table-wrap id="T1">
<label>Tabelle 1</label>
<caption>
<p>Aufbau und Inhalt des TwiBloCoP</p>
</caption>
<table>
<tbody>
<tr>
<td align="left" valign="top"></td>
<td align="center" valign="top">Twitter</td>
<td align="center" valign="top">Blog</td>
</tr>
<tr>
<td align="left" valign="top">Posts</td>
<td align="right" valign="top">81.440</td>
<td align="right" valign="top">468</td>
</tr>
<tr>
<td align="left" valign="top">S&#228;tze</td>
<td align="right" valign="top">137.914</td>
<td align="right" valign="top">24.981</td>
</tr>
<tr>
<td align="left" valign="top">Token</td>
<td align="right" valign="top">1,2 Mio.</td>
<td align="right" valign="top">360.000</td>
</tr>
</tbody>
</table>
</table-wrap>
</sec>
<sec>
<title>3. Annotationen</title>
<p>Das Korpus umfasst Texte aus zwei unterschiedlichen Medien, die zus&#228;tzlich in ihrem Register variieren, wobei Register den situativen Kontext einer Kommunikation beschreibt (vgl. <xref ref-type="bibr" rid="B3">Biber / Conrad 2019</xref>). Autor:innen passen sich an ihre Gespr&#228;chspartner:innen und den Gespr&#228;chskontext an, ebenso variiert der Sprachgebrauch je nach kommunikativem Ziel. Basierend auf dieser Definition haben wir im Korpus drei Register identifiziert: INFORMIEREND, ERZ&#196;HLEND und &#220;BERZEUGEND. Diese unterscheiden sich im Grad der Involviertheit der Autor:innen sowie im emotionalen Gehalt der behandelten Themen. Die Registerdimensionen sind manuell f&#252;r jeden Blogpost annotiert, Tweet-Sammlungen (pro Autor:in) erhalten das Register als Label, welches den Gro&#223;teil der einzelnen Tweets am besten beschreibt.</p>
<fig id="F1">
<label>Abbildung 1</label>
<caption>
<p>Annotierte Registerdimensionen im Korpus (aus <xref ref-type="bibr" rid="B7">Scheffler / Kern / Seemann 2022</xref>).</p>
</caption>
<graphic xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="kordaf-4130_scheffler-g1.png"/>
</fig>
<p>Dar&#252;ber hinaus sind im Korpus Modalpartikeln sowie Intensivierer manuell annotiert. Modalpartikeln (1)-(2) dr&#252;cken Einstellungen von Autor:innen aus oder werden genutzt, um Erwartungen und Wissen im Diskurs zu verhandeln (vgl. <xref ref-type="bibr" rid="B11">Zimmermann 2011</xref>). Intensivierer (3)-(4) verst&#228;rken oder schw&#228;chen die Intensit&#228;t einer Aussage (vgl. <xref ref-type="bibr" rid="B4">Breindl 2007</xref>). Beide Ph&#228;nomene sind typisch f&#252;r informelle Sprache in sozialen Medien. Die H&#228;ufigkeit einzelner Modalpartikeln wie Intensivierer variiert zwischen den Registerdimensionen, teilweise auch zwischen den beiden im Korpus enthaltenen Medien (vgl. <xref ref-type="bibr" rid="B10">Seemann / Scheffler 2022</xref>).</p>
<list list-type="gloss">
<list-item>
<list list-type="wordfirst">
<list-item><p>(1)</p></list-item>
</list>
</list-item>
<list-item>
<list list-type="sentence-gloss">
<list-item>
<list list-type="final-sentence">
<list-item><p>@[USERNAME] Hier ist&#8217;s <bold>ja</bold> auch warm. Aber Fr&#252;hling ist ab Mai &#128532;</p></list-item>
<list-item><p><styled-content style="text-align: right; display: block">[tweets-6317]</styled-content></p></list-item>
</list>
</list-item>
</list>
</list-item>
</list>
<list list-type="gloss">
<list-item>
<list list-type="wordfirst">
<list-item><p>(2)</p></list-item>
</list>
</list-item>
<list-item>
<list list-type="sentence-gloss">
<list-item>
<list list-type="final-sentence">
<list-item><p>[&#8230;] Schaut euch <bold>doch</bold> nur diese Designs an!</p></list-item>
<list-item><p><styled-content style="text-align: right; display: block">[blogposts-9065]</styled-content></p></list-item>
</list>
</list-item>
</list>
</list-item>
</list>
<list list-type="gloss">
<list-item>
<list list-type="wordfirst">
<list-item><p>(3)</p></list-item>
</list>
</list-item>
<list-item>
<list list-type="sentence-gloss">
<list-item>
<list list-type="final-sentence">
<list-item><p>Einschlafgespr&#228;ch K2: &#39;K1 und mich hast du <bold>ganz doll</bold> lieb.</p></list-item>
<list-item><p><styled-content style="text-align: right; display: block">[tweets-1611]</styled-content></p></list-item>
</list>
</list-item>
</list>
</list-item>
</list>
<list list-type="gloss">
<list-item>
<list list-type="wordfirst">
<list-item><p>(4)</p></list-item>
</list>
</list-item>
<list-item>
<list list-type="sentence-gloss">
<list-item>
<list list-type="final-sentence">
<list-item><p>Sie ist <bold>so</bold> s&#252;&#223;!</p></list-item>
<list-item><p><styled-content style="text-align: right; display: block">[blogposts-4308]</styled-content></p></list-item>
</list>
</list-item>
</list>
</list-item>
</list>
<p>Eine detailliertere Beschreibung und Auswertung der Annotationen ist in Scheffler / Kern / Seemann (<xref ref-type="bibr" rid="B7">2022</xref>) zu finden.</p>
</sec>
<sec>
<title>4. Formate und Verf&#252;gbarkeit</title>
<p>Das Korpus liegt im Textformat und in einer XML-Struktur vor, welche sich am TEI-CMC Schema (vgl. <xref ref-type="bibr" rid="B1">Bei&#223;wenger et al. 2012</xref>; <xref ref-type="bibr" rid="B2">Bei&#223;wenger / L&#252;ngen 2020</xref>) orientiert. Als Metadaten sind der Titel des Dokuments, die den Autor:innen zugewiesene ID, das Medium des Dokuments, sowie Zeitraum der Erstellung sowie Erhebung des Dokuments verzeichnet. Weiterhin wurden in Blogposts Abs&#228;tze und S&#228;tze, bzw. in Tweets sowohl Posts als auch S&#228;tze sequenziell nummeriert und mit einer eindeutigen ID versehen. Verlinkte Medien wie Bilder, Videos und GIFs wurden nicht gespeichert und die zugeh&#246;rigen Links wurden entfernt. Ein Beispiel des Datenformats ist in Scheffler / Kern / Seemann (<xref ref-type="bibr" rid="B8">2023</xref>) abgebildet. Die annotierte Registerdimension ist am jeweils zugeh&#246;rigen Eintrag (Blogpost oder Tweetsammlung) vermerkt. Die Annotation von Modalpartikeln und Intensivierern liegen im CoNLL-Format<xref ref-type="fn" rid="n2">2</xref> mit Bezug auf die Dokument- und Satz-IDs vor.</p>
<p>Die Daten stehen zur wissenschaftlichen Forschung zur Verf&#252;gung und k&#246;nnen per Anfrage an tatjana.scheffler@rub.de erhalten werden. Aktuelle Informationen sind auf der Webseite des Korpus zu finden<xref ref-type="fn" rid="n3">3</xref>.</p>
</sec>
<sec>
<title>5. Nutzungsbeispiel mit DaF-Bezug</title>
<p>Durch die Sammlung von Texten verschiedener Medien und Register erm&#246;glich TwiBloCoP Untersuchungen von sprachlicher Variation auf verschiedenen Ebenen. So kann bspw. untersucht werden, wie einzelne Autor:innen ihren Sprachgebrauch an das Medium oder das kommunikative Ziel anpassen. In den Beispielen (5) und (6) behandelt Autor:in 6794 denselben Inhalt, die genutzte Sprache allerdings variiert zwischen den beiden Medien Tweet und Blogpost.</p>
<list list-type="gloss">
<list-item>
<list list-type="wordfirst">
<list-item><p>(5)</p></list-item>
</list>
</list-item>
<list-item>
<list list-type="sentence-gloss">
<list-item>
<list list-type="final-sentence">
<list-item><p>&#8220;Es ist nur eine Phase&#8230;&#8221; &#8211; wie mich dieser Satz nervt! [URL]</p></list-item>
<list-item><p><styled-content style="text-align: right; display: block">[tweets-6794]</styled-content></p></list-item>
</list>
</list-item>
</list>
</list-item>
</list>
<list list-type="gloss">
<list-item>
<list list-type="wordfirst">
<list-item><p>(6)</p></list-item>
</list>
</list-item>
<list-item>
<list list-type="sentence-gloss">
<list-item>
<list list-type="final-sentence">
<list-item><p>Nat&#252;rlich geht es nach der Geburt gleich weiter, all die gut gemeinten Ratschl&#228;ge und so. Mit der Zeit kam ich damit zurecht, aber einen Satz konnte und kann ich nicht leiden: &#8222;Es ist nur eine Phase!&#8220; [&#8230;] Ich meine dieses altkluge, veteranenm&#228;&#223;ige Es ist nur eine Phase, das kam wenn ich wirklich meine Sorgen und N&#246;te schilderte.</p></list-item>
<list-item><p><styled-content style="text-align: right; display: block">[blogposts-6794]</styled-content></p></list-item>
</list>
</list-item>
</list>
</list-item>
</list>
<p>Weiterhin bietet die vorhandene manuelle Annotation von Modalpartikeln eine Ressource, um diesen h&#228;ufig f&#252;r Lerner:innen schwierigen Gegenstand an authentischen Beispielen zu &#252;ben (s. bspw. <xref ref-type="bibr" rid="B5">Kresi&#263; / Batini&#263; 2014</xref> oder <xref ref-type="bibr" rid="B9">Schoonjans 2021</xref> f&#252;r entsprechende &#220;berlegungen).</p>
</sec>
</body>
<back>
<fn-group>
<fn id="n1"><p><ext-link ext-link-type="uri" xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="https://github.com/tsproisl/SoMaJo">https://github.com/tsproisl/SoMaJo</ext-link> (07.11.2024).</p></fn>
<fn id="n2"><p>siehe: <ext-link ext-link-type="uri" xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="https://universaldependencies.org/format.html">https://universaldependencies.org/format.html</ext-link> (07.11.2024).</p></fn>
<fn id="n3"><p><ext-link ext-link-type="uri" xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="https://staff.germanistik.rub.de/digitale-forensische-linguistik/forschung/textkorpus-sprachliche-variation-in-sozialen-medien/">https://staff.germanistik.rub.de/digitale-forensische-linguistik/forschung/textkorpus-sprachliche-variation-in-sozialen-medien/</ext-link> (07.11.2024).</p></fn>
</fn-group>
<ref-list>
<title>Literatur und Ressourcen</title>
<ref id="B1"><mixed-citation publication-type="journal"><string-name><surname>Bei&#223;wenger</surname>, <given-names>Michael</given-names></string-name> / <string-name><surname>Ermakova</surname>, <given-names>Maria</given-names></string-name> / <string-name><surname>Geyken</surname>, <given-names>Alexander</given-names></string-name> / <string-name><surname>Lemnitzer</surname>, <given-names>Lothar</given-names></string-name> / <string-name><surname>Storrer</surname>, <given-names>Angelika</given-names></string-name> (<year>2012</year>): <article-title>A TEI Schema for the Representation of Computer-mediated Communication</article-title>. In: <source>Journal of the Text Encoding Initiative</source> <volume>3</volume>. <pub-id pub-id-type="doi">10.4000/jtei.476</pub-id>.</mixed-citation></ref>
<ref id="B2"><mixed-citation publication-type="journal"><string-name><surname>Bei&#223;wenger</surname>, <given-names>Michael</given-names></string-name> / <string-name><surname>L&#252;ngen</surname>, <given-names>Harald</given-names></string-name> (<year>2020</year>): <article-title>CMC-core: a schema for the representation of CMC corpora in TEI</article-title>. In: <source>Corpus</source> <volume>20</volume>. <pub-id pub-id-type="doi">10.4000/corpus.4553</pub-id>.</mixed-citation></ref>
<ref id="B3"><mixed-citation publication-type="book"><string-name><surname>Biber</surname>, <given-names>Douglas</given-names></string-name> / <string-name><surname>Conrad</surname>, <given-names>Susan</given-names></string-name> (<year>2019</year>): <source>Register, Genre, and Style</source>. <publisher-loc>Cambridge</publisher-loc>: <publisher-name>Cambridge University Press</publisher-name>.</mixed-citation></ref>
<ref id="B4"><mixed-citation publication-type="book"><string-name><surname>Breindl</surname>, <given-names>Eva</given-names></string-name> (<year>2007</year>): <chapter-title>Intensit&#228;tspartikeln</chapter-title>. In: <string-name><surname>Hoffmann</surname>, <given-names>Ludger</given-names></string-name> (Hrsg.): <source>Handbuch der deutschen Wortarten</source>. <publisher-loc>Berlin /New York</publisher-loc>: <publisher-name>de Gruyter</publisher-name>, <fpage>397</fpage>&#8211;<lpage>422</lpage>.</mixed-citation></ref>
<ref id="B5"><mixed-citation publication-type="book"><string-name><surname>Kresi&#263;</surname>, <given-names>Marijana</given-names></string-name> / <string-name><surname>Batini&#263;</surname>, <given-names>Mia</given-names></string-name> (<year>2014</year>): <source>Modalpartikeln: Deutsch im Vergleich mit dem Kroatischen und Englischen</source>. <publisher-loc>Zadar</publisher-loc>: <publisher-name>Universit&#228;t Zadar</publisher-name>.</mixed-citation></ref>
<ref id="B6"><mixed-citation publication-type="book"><string-name><surname>Proisl</surname>, <given-names>Thomas</given-names></string-name> / <string-name><surname>Uhrig</surname>, <given-names>Peter</given-names></string-name> (<year>2016</year>): <chapter-title>SoMaJo: State-of-the-Art Tokenization for German Web and Social Media Texts</chapter-title>. In: <string-name><surname>Cook</surname>, <given-names>Paul</given-names></string-name> / <string-name><surname>Evert</surname>, <given-names>Stefanie</given-names></string-name> / <string-name><surname>Sch&#228;fer</surname>, <given-names>Roland</given-names></string-name> / <string-name><surname>Stemle</surname>, <given-names>Egon</given-names></string-name> (eds.): <source>Proceedings of the 10th Web as Corpus Workshop (WAC-X) and the EmpiriST Shared Task</source>. <publisher-loc>Berlin</publisher-loc>: <publisher-name>Association for Computational Linguistics</publisher-name>, <fpage>57</fpage>&#8211;<lpage>62</lpage>.</mixed-citation></ref>
<ref id="B7"><mixed-citation publication-type="journal"><string-name><surname>Scheffler</surname>, <given-names>Tatjana</given-names></string-name> / <string-name><surname>Kern</surname>, <given-names>Lesley-Ann</given-names></string-name> / <string-name><surname>Seemann</surname>, <given-names>Hannah</given-names></string-name> (<year>2022</year>): <article-title>The medium is not the message: Individual level register variation in blogs vs. tweets</article-title>. In: <source>Register Studies</source> <volume>4</volume>: <issue>2</issue>, <fpage>171</fpage>&#8211;<lpage>201</lpage>.</mixed-citation></ref>
<ref id="B8"><mixed-citation publication-type="book"><string-name><surname>Scheffler</surname>, <given-names>Tatjana</given-names></string-name> / <string-name><surname>Kern</surname>, <given-names>Lesley-Ann</given-names></string-name> / <string-name><surname>Seemann</surname>, <given-names>Hannah</given-names></string-name> (<year>2023</year>): <chapter-title>Individuelle linguistische Variabilit&#228;t in sozialen Medien. Ein multimediales Korpus</chapter-title>. In: <string-name><surname>Kupietz</surname>, <given-names>Marc</given-names></string-name> / <string-name><surname>Schmidt</surname>, <given-names>Thomas</given-names></string-name> (Hrsg.): <source>Neue Entwicklungen in der Korpuslandschaft der Germanistik. Beitr&#228;ge zur IDS-Methodenmesse 2022</source>. <publisher-loc>T&#252;bingen</publisher-loc>: <publisher-name>Narr</publisher-name>, <fpage>89</fpage>&#8211;<lpage>99</lpage>.</mixed-citation></ref>
<ref id="B9"><mixed-citation publication-type="journal"><string-name><surname>Schoonjans</surname>, <given-names>Steven</given-names></string-name> (<year>2021</year>): <article-title>Abt&#246;nungspartikeln im Deutschunterricht f&#252;r Niederl&#228;ndischsprachige</article-title>. In: <source>Germanistische Mitteilungen</source> <volume>47</volume>: <issue>47</issue>, <fpage>87</fpage>&#8211;<lpage>119</lpage>.</mixed-citation></ref>
<ref id="B10"><mixed-citation publication-type="webpage"><string-name><surname>Seemann</surname>, <given-names>Hannah</given-names></string-name> / <string-name><surname>Scheffler</surname>, <given-names>Tatjana</given-names></string-name> (<year>2022</year>): <chapter-title>Differentiating Social Media Texts via Clustering</chapter-title>. In: <string-name><surname>Karsdorp</surname>, <given-names>Folgert</given-names></string-name> / <string-name><surname>Lassche</surname>, <given-names>Alie</given-names></string-name> / <string-name><surname>Nielbo</surname>, <given-names>Kristoffer</given-names></string-name> (eds.): <source>CHR 2022: Computational Humanities Research 2022</source>, <fpage>177</fpage>&#8211;<lpage>188</lpage>. <uri>https://ceur-ws.org/Vol-3290/</uri> (07.11.2024).</mixed-citation></ref>
<ref id="B11"><mixed-citation publication-type="book"><string-name><surname>Zimmermann</surname>, <given-names>Malte</given-names></string-name> (<year>2011</year>): <chapter-title>Discourse Particles</chapter-title>. In: <string-name><surname>Maienborn</surname>, <given-names>Claudia</given-names></string-name> / <string-name><surname>Heusinger</surname>, <given-names>Klaus v.</given-names></string-name> / <string-name><surname>Portner</surname>, <given-names>Paul</given-names></string-name>. (eds.): <source>Semantics</source>. <publisher-loc>Berlin</publisher-loc>: <publisher-name>de Gruyter</publisher-name>, <fpage>2011</fpage>&#8211;<lpage>2038</lpage>.</mixed-citation></ref>
</ref-list>
<sec>
<title>Biographische Notiz</title>
<p>Tatjana Scheffler studierte Computerlinguistik in Saarbr&#252;cken, Shanghai und Peking und promovierte in Linguistik an der University of Pennsylvania, USA. Nach einer Zeit in der au&#223;eruniversit&#228;ren Forschung lehrte sie an den Universit&#228;ten Potsdam und Konstanz. Seit 2020 ist sie Professorin f&#252;r Digitale Forensische Linguistik an der Ruhr-Universit&#228;t Bochum und widmet sich der korpus- und computerlinguistischen Analyse von sprachlichen Daten aus sozialen Medien.</p>
<p><styled-content style="text-align: right; display: block; line-height: 0.5"><bold>Kontaktanschrift:</bold></styled-content></p>
<p><styled-content style="text-align: right; display: block; line-height: 0.5">Prof. Dr. Tatjana Scheffler</styled-content></p>
<p><styled-content style="text-align: right; display: block; line-height: 0.5">Digitale Forensische Linguistik</styled-content></p>
<p><styled-content style="text-align: right; display: block; line-height: 0.5">Germanistisches Institut</styled-content></p>
<p><styled-content style="text-align: right; display: block; line-height: 0.5">Ruhr-Universit&#228;t Bochum</styled-content></p>
<p><styled-content style="text-align: right; display: block; line-height: 0.5">Universit&#228;tsstra&#223;e 150</styled-content></p>
<p><styled-content style="text-align: right; display: block; line-height: 0.5">44801 Bochum</styled-content></p>
<p><styled-content style="text-align: right; display: block; line-height: 0.5"><ext-link ext-link-type="uri" xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="mailto:tatjana.scheffler@rub.de">tatjana.scheffler@rub.de</ext-link></styled-content></p>
</sec>
<sec>
<title>Biographische Notiz</title>
<p>Hannah J. Seemann studierte Germanistik an der Ruhr-Universit&#228;t Bochum und ist dort seit 2022 wissenschaftliche Mitarbeiterin am Lehrstuhl von Tatjana Scheffler. In ihrer Dissertation untersucht sie den Einfluss von Modalpartikeln auf die Interpretation von Diskursrelationen. Dar&#252;ber hinaus gilt ihr Forschungsinteresse dem Sprachgebrauch und der Variation in sozialen Medien.</p>
<p><styled-content style="text-align: right; display: block; line-height: 0.5"><bold>Kontaktanschrift:</bold></styled-content></p>
<p><styled-content style="text-align: right; display: block; line-height: 0.5">Hannah J. Seemann</styled-content></p>
<p><styled-content style="text-align: right; display: block; line-height: 0.5">Germanistisches Institut</styled-content></p>
<p><styled-content style="text-align: right; display: block; line-height: 0.5">Ruhr-Universit&#228;t Bochum</styled-content></p>
<p><styled-content style="text-align: right; display: block; line-height: 0.5">Universit&#228;tsstra&#223;e 150</styled-content></p>
<p><styled-content style="text-align: right; display: block; line-height: 0.5">44801 Bochum</styled-content></p>
<p><styled-content style="text-align: right; display: block; line-height: 0.5"><ext-link ext-link-type="uri" xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="mailto:hannah.seemann@rub.de">hannah.seemann@rub.de</ext-link></styled-content></p>
</sec>
</back>
</article>