<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Publishing DTD v1.2 20120330//EN" "http://jats.nlm.nih.gov/publishing/1.2/JATS-journalpublishing1.dtd">
<!--<?xml-stylesheet type="text/xsl" href="article.xsl"?>-->
<article article-type="research-article" dtd-version="1.2" xml:lang="de" xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id journal-id-type="issn">2749-4411</journal-id>
<journal-title-group>
<journal-title>Zeitschrift Korpora Deutsch als Fremdsprache</journal-title>
</journal-title-group>
<issn pub-type="epub">2749-4411</issn>
<publisher>
<publisher-name>Universit&#228;ts- und Landesbibliothek Darmstadt</publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id pub-id-type="doi">10.48694/tujournals-59</article-id>
<article-categories>
<subj-group>
<subject>Article</subject>
</subj-group>
</article-categories>
<title-group>
<article-title>REPR&#196;SENTATION VON TERMINOLOGISCHEN VARIANTEN IN RELATIONALEN TERMBANKEN</article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname>Giacomini</surname>
<given-names>Laura</given-names>
<prefix>Dr.</prefix>
</name>
<email>laura.giacomini@iued.uni-heidelberg.de</email>
<xref ref-type="aff" rid="aff-1">1</xref>
</contrib>
</contrib-group>
<aff id="aff-1">Universit&#228;t Heidelberg, Institut f&#252;r &#220;bersetzen und Dolmetschen, Pl&#246;ck 57a, 69117 Heidelberg</aff>
<pub-date publication-format="electronic" date-type="pub" iso-8601-date="2022-07-22">
<day>22</day>
<month>07</month>
<year>2022</year>
</pub-date>
<pub-date pub-type="collection">
<year>2022</year>
</pub-date>
<volume>2</volume>
<issue>1</issue>
<fpage>25</fpage>
<lpage>41</lpage>
<permissions>
<copyright-statement>Copyright: &#x00A9; 2022 The Author(s)</copyright-statement>
<copyright-year>2022</copyright-year>
<license license-type="open-access" xlink:href="http://creativecommons.org/licenses/by/4.0/">
<license-p>CC BY 4.0 International - Creative Commons, Namensnennung. See <uri xlink:href="http://creativecommons.org/licenses/by/4.0/">http://creativecommons.org/licenses/by/4.0/</uri>.</license-p>
</license>
</permissions>
<self-uri xlink:href="https://kordaf.tujournals.ulb.tu-darmstadt.de/articles/10.48694/tujournals-59"/>
<abstract>
<p>Thema des Beitrags ist die Erstellung relationaler Termbanken im Fach&#252;bersetzungsunterricht. Inhaltlich und methodisch nimmt der Beitrag Bezug auf Terminologiekurse am Institut f&#252;r &#220;bersetzen und Dolmetschen der Universit&#228;t Heidelberg. Der Fokus liegt dabei auf der Repr&#228;sentation von Termvarianten und deren Verbindung mit dom&#228;nenspezifischen Konzepten. Das korpusbasierte Verfahren wird anhand exemplarischer Eintr&#228;ge zu deutschen und italienischen Termini aus dem Fachgebiet der Immunologie dargestellt und umfasst folgende Schritte: Erstellung fachsprachlicher Korpora, Termextraktion, bottom-up Wissensmodellierung, konzeptioneller und logischer Termbankentwurf, Erstellung von Eintr&#228;gen. Ziel des Beitrags ist es, eine Methode vorzustellen, die es auf Basis von Korpora muttersprachlichen und nicht-muttersprachlichen &#220;bersetzungsstudierenden erm&#246;glicht, terminologische Variation in neuen Fachgebieten zu untersuchen und sie in einer terminografischen Ressource koh&#228;rent zu beschreiben.</p>
</abstract>
<trans-abstract xml:lang="en">
<p>The topic of the article is the creation of relational termbases in the teaching of technical translation. The article refers to courses in terminology offered at the Institute of Translation and Interpreting at Heidelberg University. The focus is on the representation of term variants and their connection with domain-specific concepts. The corpus-based method is presented on the basis of exemplary entries on German and Italian terms from the field of immunology and comprises the following steps: creation of specialised language corpora, term extraction, bottom-up knowledge modelling, conceptual and logical termbase design, creation of entries. The aim of this contribution is to present a introduce a method which enables native and non-native translation students to investigate terminological variation in new subject areas and to describe it coherently in a terminographic resource.</p>
</trans-abstract>
<kwd-group>
<kwd>Terminologie</kwd>
<kwd>Termbank</kwd>
<kwd>relationale Datenbank</kwd>
<kwd>terminologische Variation</kwd>
<kwd>Wissensmodellierung</kwd>
</kwd-group>
<kwd-group xml:lang="en">
<kwd>terminology</kwd>
<kwd>termbank</kwd>
<kwd>relational database</kwd>
<kwd>term variation</kwd>
<kwd>knowledge modeling</kwd>
</kwd-group>
</article-meta>
</front>
<body>
<sec>
<title>1. Einleitung</title>
<p>Ziel des Beitrags ist es, eine Methode vorzustellen, die es auf Basis von Korpora muttersprachlichen und nicht-muttersprachlichen &#220;bersetzungsstudierenden erm&#246;glicht, terminologische Variation in neuen Fachgebieten zu untersuchen und sie in einer terminografischen Ressource systematisch zu beschreiben.</p>
<p>Das korpusbasierte Verfahren wird anhand exemplarischer Eintr&#228;ge zu deutschen und italienischen Termini dargestellt. Die hier vorgestellten Daten stammen aus der Fachsprache der Immunologie, die in zwei aufeinanderfolgenden Lehrveranstaltungen analysiert wurde. Die Methode, die vor dem ersten Kurs entwickelt und w&#228;hrend der beiden Kurse verfeinert wurde, ist auf die Bed&#252;rfnisse von Muttersprachlern und Nicht-Muttersprachlern des Italienischen und Deutschen abgestimmt. Dies gew&#228;hrleistet eine gr&#246;&#223;ere Flexibilit&#228;t in Bezug auf die Zielgruppe. Das Verfahren umfasst eine Reihe von Schritten, die im Folgenden aufgef&#252;hrt und kurz beschrieben werden sollen.</p>
<p>Dieser Beitrag besch&#228;ftigt sich mit der Erstellung exemplarischer bzw. prototypischer relationaler Termbanken im Fach&#252;bersetzungsunterricht. Inhaltlich und methodisch nimmt der Beitrag Bezug auf Terminologiekurse f&#252;r Master-Studierende des Instituts f&#252;r &#220;bersetzen und Dolmetschen der Universit&#228;t Heidelberg Der Fokus liegt dabei auf der Repr&#228;sentation von Termvarianten und deren Verbindung mit dom&#228;nenspezifischen Konzepten. Dieser Schwerpunkt erm&#246;glicht es, den technischen Aspekt der Planung und Erstellung einer f&#252;r &#220;bersetzer konzipierten Datenbank mit einem heute besonders wichtigen theoretischen Aspekt der Fachkommunikation zu verbinden, n&#228;mlich dem Ph&#228;nomen der terminologischen Variation. Kapitel 2 f&#252;hrt die Ziele des Beitrags und die bei der Erstellung der Terminologiedatenbanken angewandte Methode ein. In Kapitel 3 werden Termvarianten als zentraler Datentyp aus theoretischer und anwendungsorientierter Sicht dargestellt. Kapitel 4 wird sich speziell mit dem Design und der Implementierung einer Datenbank in Xampp (s. Kap. 4.2) befassen. Schlie&#223;lich werden in Kapitel 5 die Vorteile und das Potenzial der Methode zusammengefasst.</p>
</sec>
<sec sec-type="methods">
<title>2. Hintergr&#252;nde und Methode</title>
<p>Eine der gr&#246;&#223;ten Herausforderungen bei der Vermittlung von Kompetenzen im Bereich Korpusarbeit in Studieng&#228;ngen f&#252;r &#220;bersetzer ist die zeitliche Begrenzung der einzelnen Lehrveranstaltungen. Der Erwerb von Wissen im Bereich der Korpuslinguistik beschr&#228;nkt sich daher in der Regel auf theoretische Grundlagen und Teilexperimente, die eventuell in BA- und MA-Arbeiten vertieft werden k&#246;nnen. F&#252;r k&#252;nftige &#220;bersetzer w&#228;re es jedoch sinnvoll, selbst im Rahmen eines Kurses umfassendere Kompetenzen zu erwerben und zu erfahren, wie man terminografische Prozesse plant und umsetzt, die in der heutigen Arbeitswelt von Bedeutung sind. Es ist demnach notwendig, Unterrichtsziele und -methoden zu entwickeln, die zu greifbaren und reproduzierbaren Ergebnissen in den Kursen f&#252;hren k&#246;nnen, und zwar durch Experimente, die zwar in ihrem Umfang klein, aber in ihrer Konzeption vollst&#228;ndig sind. Die Arbeit mit Korpora erfordert sowohl linguistisches als auch technisches Wissen, das beispielsweise von der Annotation eines Korpus bis zur Darstellung der aus Korpora extrahierten Daten in geeigneten Datenbanken reicht. Die Erstellung von Datenbanken wiederum ist ein Thema, das eng mit zahlreichen technisch-formalen Aspekten verbunden ist, z.B. g&#228;ngigen Datenrepr&#228;sentationsformaten.</p>
<sec>
<title>2.1 Erstellung fachsprachlicher Korpora</title>
<p>Die Wahl eines bestimmten Fachgebiets ist ein wichtiger Bestandteil der geplanten Terminologiearbeit. Im Rahmen einer Lehrveranstaltung ist es von Vorteil, sich f&#252;r ein relativ begrenztes Fachgebiet bzw. Teilgebiet mit einer spezifischen Terminologie zu entscheiden, f&#252;r das ausreichend Textmaterial verf&#252;gbar ist.</p>
<p>F&#252;r jede im Kurs festgelegte Sprache wird ein Korpus von Fachtexten zu dem gew&#228;hlten Fachgebiet mithilfe der Funktionen von <italic>Sketch Engine</italic> (vgl. <xref ref-type="bibr" rid="B9">Kilgarriff et al. 2014</xref>) erstellt, in dem vorhandene Fachtexte, z.B. aus Fach&#252;bersetzungskursen, verwendet oder Fachtexte online gesammelt werden. In beiden F&#228;llen wird die Textsammlung automatisch vorverarbeitet und annotiert, sodass sie sp&#228;ter mit den Werkzeugen von <italic>Sketch Engine</italic> abgefragt werden kann. Der Schwerpunkt dieser Arbeitsphase liegt auf der Erstellung repr&#228;sentativer und textsortenspezifisch homogener Korpora. Es muss also im Vorfeld die zu analysierende kommunikative Ebene bestimmt werden, die wiederum vom vorgesehenen Endnutzer/der vorgesehenen Endnutzerin der Termbank abh&#228;ngig ist. Jedes Korpus enth&#228;lt etwa 1 Million W&#246;rter, eine Gr&#246;&#223;e, die in der Regel sowohl hinsichtlich der verf&#252;gbaren Zeit als auch des beabsichtigten Zwecks angemessen ist. Die M&#246;glichkeit der Erstellung von Parallelkorpora bleibt bestehen, wenn Translation Memories verf&#252;gbar sind (z.B. tmx-Dateien aus fr&#252;heren &#220;bersetzungsprojekten). F&#252;r die Erfassung von Daten f&#252;r die vorgesehene Termbank ist dies jedoch nicht unbedingt erforderlich.</p>
</sec>
<sec>
<title>2.2 Term- und Variantenextraktion</title>
<p>Der Erstellung von Korpora folgt die Extraktion von Termini mithilfe des Keywords-Tools. Das Tool extrahiert automatisch aus einem Korpus Listen von Termkandidaten, die auf der Grundlage eines Vergleichs zwischen dem Fachkorpus und einem Referenzkorpus, in der Regel ein gemeinsprachliches Korpus, ermittelt wurden. Die extrahierten Kandidaten sind sowohl einfache als auch komplexe Termini, darunter Fachkollokationen und Mehrworttermini.</p>
<p>Die Validierung der Kandidaten ist eine zentrale Phase der Arbeit. Hier gilt es u.a., fehlende Fachkenntnisse durch die Dokumentation in lexikografischen und terminografischen Quellen und Paralleltexten auszugleichen. Ziel dieser Phase ist es, Termini und ihre Varianten zu sammeln, um sie als Lemmata in die Datenbank aufzunehmen. Der <italic>main term</italic> (i.S.v. Vorzugsbenennung), gegen&#252;ber dem alle Synonyme als Varianten zu betrachten sind, wird entweder auf qualitativer Basis (es handelt sich um die normierte Form) oder auf quantitativer Basis (es handelt sich um die h&#228;ufigste Form im Korpus) festgelegt.</p>
</sec>
<sec>
<title>2.3 Wissensmodellierung</title>
<p>Die Terminologiedatenbank enth&#228;lt nicht nur lexikalische Daten (Termini und Varianten), sondern auch konzeptuelle Daten, die mit ersteren verkn&#252;pft sind. Das Hauptziel besteht darin, die Beschreibung der Terminologie des gew&#228;hlten Bereichs koh&#228;rent und systematisch zu gestalten, indem die korrekte Zuordnung jedes Terminus zu einem oder mehreren Konzepten gew&#228;hrleistet wird. Auf diese Weise wird ein einfaches konzeptuelles Wissensmodell erstellt, das eine bestimmte Anzahl an Konzepten beinhaltet. Die Granularit&#228;t dieser Art von Daten wird auf der Grundlage verschiedener Kriterien gew&#228;hlt, z.B. der konzeptuellen Merkmale der Dom&#228;ne, des Umfangs des terminologischen Datenbestandes und der verf&#252;gbaren Zeit. Es ist daher m&#246;glich, sehr detaillierte oder allgemeinere konzeptuelle Netze zu erstellen, beispielsweise durch die Ermittlung von Makro-Konzepten, die man informell als &#8218;Themen&#8216; bezeichnen k&#246;nnte (z.B. GESUNDHEITSWESEN, KRANKHEITEN, MEDIKAMENTE, THERAPIEN).</p>
<p>Je detaillierter die konzeptuelle Datenbasis, desto aufwendiger ist es, Relationen zwischen den Konzepten zu ermitteln. Diese Relationen erm&#246;glichen u.a., lexikalische Zusammenh&#228;nge zwischen den Termini zu identifizieren. In vielen F&#228;llen kann ein an semantischen Rollen oder an Frames orientierter Ansatz dabei sehr hilfreich sein. Semantische Rollen erm&#246;glichen es, Konzepte mit bestimmten Rollenprofilen in der Dom&#228;ne zu gruppieren, z.B. AGENT, PATIENT, BENEFICIARY. Frames erlauben es, typische Szenarien innerhalb einer Dom&#228;ne zu identifizieren (z.B. ZULASSUNG EINES MEDIKAMENTS oder THERAPIE GEGEN EINE VIRUSINFEKTION), mit denen eine typische Konstellation von Konzepten und Begriffen verbunden ist (vgl. <xref ref-type="bibr" rid="B5">Faber 2015</xref>; <xref ref-type="bibr" rid="B6">Giacomini 2018</xref>, <xref ref-type="bibr" rid="B7">2019</xref>). Konzepte, die ein Frame identifizieren, sind seine Elemente, die durch logische und funktionale Beziehungen miteinander verbunden sind. Einige m&#246;gliche Elemente des Frames THERAPIE GEGEN EINE VIRUSINFEKTION k&#246;nnten z.B. sein: MEDIZINISCHES PERSONAL, MEDIKAMENTE, PATIENTEN. Im Wesentlichen handelt es sich um Konzepte, die in Texten auf unterschiedliche Weise lexikalisiert werden. Auch bei einem frame-orientierten Ansatz kann diejenige Granularit&#228;t festgelegt werden, die f&#252;r das Experiment am besten geeignet ist.</p>
<p>&#196;hnlich komplexeren Wissensmodellen wie Ontologien, geht es auch bei einfacheren Begriffssystemen nicht nur um die Beschreibung von (Klassen von) Objekten &#8211; in diesem Fall Konzepten &#8211;, sondern auch um deren Relationen. Unabh&#228;ngig davon, welches konzeptuelle Modell f&#252;r das jeweilige Experiment am besten geeignet ist, m&#252;ssen Relationen zwischen Konzepten explizit dargelegt und benannt werden, gegebenenfalls auf informelle Weise. Neben grundlegenden hierarchischen konzeptuellen Relationen wie den Typ-von- und Teil-von-Relationen kann es eine Vielzahl anderer nicht-hierarchischer Relationen geben, z.B. funktionaler oder kausaler Natur (vgl. <xref ref-type="bibr" rid="B1">Arntz et al. 2014</xref>; <xref ref-type="bibr" rid="B7">Giacomini 2019</xref>).</p>
<p>Die Identifizierung von Konzepten ist ein Verfahren, das mit der Analyse der Texte aus den Korpora beginnt und mit der Beobachtung der extrahierten Termini fortgesetzt wird. Diese k&#246;nnen zun&#228;chst in breite semantische Felder gruppiert und dann schrittweise eingegrenzt werden. Dieses Bottom-up-Verfahren ist grundlegend, um eine lexikalische Ressource zu schaffen, die das in den Korpora enthaltene Fachvokabular lexikalisch und konzeptuell widerspiegelt. Das Verfahren muss allerdings durch die Dokumentation in externen Quellen (Paralleltexten, lexikografischen und terminografischen Quellen, Handb&#252;chern usw.) unterst&#252;tzt werden. W&#228;hrend diese Aufgabe im Kontext gr&#246;&#223;erer Forschungsvorhaben idealerweise von einem Top-Down-Verfahren begleitet werden sollte &#8211; d.h. ausgehend von bestehenden konzeptuellen Systemen, z.B. Ontologien &#8211;, ist dieser Weg in eng begrenzten Experimenten, wie wir sie hier beschreiben, weniger praktikabel, da er komplex und zeitaufw&#228;ndig ist.</p>
</sec>
<sec>
<title>2.4 Entwurf eines konzeptionellen, eines logischen und eines physischen Datenmodells f&#252;r die relationale Termbank</title>
<p>Eine relationale Datenbank ist z. Z. neben dokumentorientierten XML-Datenbanken ein gebr&#228;uchliches Mittel zur Repr&#228;sentation lexikografischer bzw. terminografischer Daten. In diesem Datenbankmodell werden Daten in Tabellen gespeichert, die Attribute enthalten und miteinander &#252;ber Relationen verkn&#252;pft sind. Daten werden dabei durch ein Datenbankmanagementsystem (DBMS) verwaltet und ausgelesen.</p>
<p>Bevor die Eintr&#228;ge in der Terminologiedatenbank erfasst werden k&#246;nnen, m&#252;ssen die Struktur der Datenbank und die Art der darin enthaltenen Daten jedoch festgelegt werden. Dies h&#228;ngt im Wesentlichen von den Bed&#252;rfnissen des idealen Benutzers/der idealen Benutzerin der geplanten lexikalischen Ressource ab. Die Erstellung einer Terminologiedatenbank erfordert also ein Datenmodell, das die zu beschreibenden und zu verarbeitenden Daten innerhalb einer Dom&#228;ne sowie deren Relationen untereinander festlegt. Der Zweck der Datenmodellierung ist also die Sortierung und Strukturierung von Daten und man unterscheidet zwischen konzeptioneller, logischer und physischer Modellierung &#8211; dabei handelt es sich um Begriffe, die gr&#246;&#223;tenteils aus den Bereichen der Softwaretechnik und der Wirtschaftsinformatik stammen.</p>
<p>Ein konzeptionelles Datenmodell ist ein &#8222;Datenmodell, das die globale logische Struktur aller Daten [&#8230;] (oder zumindest eines mit einem Datenbanksystem erfassten Teilbereichs) implementierungsunabh&#228;ngig beschreibt und diese in einer fassbaren und systematischen Form strukturiert darstellt&#8220; (Gabler Wirtschaftslexikon, <ext-link ext-link-type="uri" xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="https://wirtschaftslexikon.gabler.de">https://wirtschaftslexikon.gabler.de</ext-link>). In unserem Falle spezifiziert das konzeptionelle Datenmodell lexikografische bzw. terminografische Angabetypen und ihre Beziehungen zueinander. Hierf&#252;r stehen n&#252;tzliche Beschreibungsformate, etwa UML-Klassendiagramme oder Entity-Relationship-Diagramme, zur Verf&#252;gung.</p>
<p>Diagramme in der Unified Modelling Language (UML) dienen zur grafischen Darstellung von Klassen von Objekten (hier: Typen von lexikalischen bzw. konzeptuellen Daten). Im Falle einer relationalen Terminologiedatenbank entspricht jede Klasse einer bestimmten Tabelle, die wiederum eine Reihe von Attributen enth&#228;lt (<xref ref-type="fig" rid="F1">Abbildung 1</xref>).</p>
<fig id="F1">
<label>Abbildung 1</label>
<caption>
<p>Klassen, Attribute, Operationen und Relationen in UML-Diagrammen. Zu jedem Attribut geh&#246;rt auch ein Datentyp.</p>
</caption>
<graphic xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="kordaf-2-1-59-g1.png"/>
</fig>
<p>Attribute einer Klasse sind nichts anderes als lexikografische oder terminografische Angaben, die in einer bestimmten Tabelle enthalten sind (z.B. grammatische Angabe, Aussprachenangabe, Definition, Beispielangabe, pragmatische Angabe usw.). Die Klassen, grafisch durch Rechtecke dargestellt, sind durch Relationen miteinander verbunden, grafisch durch Linien dargestellt. W&#228;hrend das UML-Modell im Allgemeinen auch die M&#246;glichkeit bietet, Relationen der Generalisierung, Aggregation und Komposition zu identifizieren, gibt es im hier vorgestellten lexikografischen Modell nur Assoziationsrelationen, d.h. jede Tabelle in der Datenbank muss mit mindestens einer anderen Tabelle assoziiert sein. In <xref ref-type="fig" rid="F1">Abbildung 1</xref> wird auch gezeigt, welche Operationen f&#252;r eine bestimmte Menge von Attributen in einer Datenbank m&#246;glich sein werden.</p>
<p>Bei den Verbindungslinien zwischen Klassen k&#246;nnen dar&#252;ber hinaus Namen f&#252;r die Relationen eingef&#252;gt und sog. Multiplizit&#228;ten angegeben werden. Hierbei handelt es sich um Werte, die die Assoziationen in beiden Richtungen &#8218;quantifizieren&#8216;. Multiplizit&#228;ten dr&#252;cken folgende Informationen aus:</p>
<list list-type="simple">
<list-item><p>0..*: ein Objekt einer Klasse verweist auf eine beliebige Zahl von Objekten einer anderen Klasse.</p></list-item>
<list-item><p>1..*: ein Objekt einer Klasse entspricht mindestens einem, ansonsten aber beliebig vielen Objekten einer anderen Klasse.</p></list-item>
<list-item><p>1: ein Objekt einer Klasse entspricht genau einem Objekt einer anderen Klasse.</p></list-item>
</list>
<p>Die Verwendung von Multiplizit&#228;ten erm&#246;glicht es, fr&#252;hzeitig &#252;ber die Zusammenh&#228;nge zwischen den verschiedenen lexikografischen Angaben eines Datenbankeintrags nachzudenken und fundierte Entscheidungen zu treffen. In dieser Phase wird zum Beispiel festgelegt, ob es f&#252;r ein Lemma mehr als eine Definition geben darf oder ob Beispiele obligatorisch sind.</p>
<p>Im n&#228;chsten Schritt wird ein logisches Datenmodell entworfen, d.h. ein &#8222;auf die sp&#228;tere Implementierung ausgerichtetes Datenmodell, das die Daten f&#252;r den sp&#228;teren Einsatz bereits vorstrukturiert&#8220; (Gabler Wirtschaftslexikon, <ext-link ext-link-type="uri" xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="https://wirtschaftslexikon.gabler.de">https://wirtschaftslexikon.gabler.de</ext-link>). Dabei wird das konzeptionelle Datenmodell f&#252;r ein bestimmtes Datenformat und das damit verbundene Datenbanksystem spezifiziert. Bei relationalen Datenbanken geht es meistens um eine Strukturierung der Datenelemente, z.B. die Bestimmung der einzelnen attributbezogenen Datentypen. So k&#246;nnen beispielsweise Art und L&#228;nge von lemma-, definitions- und kollokationsidentifizierenden Strings bestimmt werden. Prim&#228;rschl&#252;ssel zu jeder Klasse (Tabelle) k&#246;nnen w&#228;hrend dieser Phase bestimmt werden.</p>
<p>Der Entwurf des physischen Datenmodells schlie&#223;t diesen Prozess ab und definiert die endg&#252;ltige Form der Datenbank. Klassen- und Attributnamen werden auf reservierte W&#246;rter gepr&#252;ft und gegebenenfalls angepasst, damit sie f&#252;r das DBMS lesbar sind. Prim&#228;rschl&#252;ssel, falls noch nicht vorhanden, Fremdschl&#252;ssel und Einschr&#228;nkungen (<italic>constraints</italic>) f&#252;r die Schl&#252;ssel werden ebenfalls eingef&#252;hrt.</p>
<p>Sobald alle Schl&#252;ssel festgelegt worden sind und somit die (noch leeren) Tabellen der relationalen Datenbank im DBMS erstellt werden, kann die Datenbank normalisiert werden. Die Normalisierung impliziert die Anwendung bestimmter Regeln zur sinnvollen Aufteilung von Attributen in mehreren Tabellen. Ziel dabei ist die grunds&#228;tzliche Vermeidung von Redundanzen und Anomalien (insbesondere funktioneller und transitiver Abh&#228;ngigkeiten), die das Datenbankschema unn&#246;tig erschweren w&#252;rden.</p>
<p>In Kapitel 4 wird auch dargelegt, wie bei der Terminologiearbeit die Erstellung einer vorl&#228;ufigen Gesamttabelle die Modellierungsphase unterst&#252;tzen kann, weil sie auf der Grundlage einer ersten Datensammlung die Diskussion &#252;ber Ziele, m&#246;gliche Probleme und geeignete Strategien f&#246;rdert. Diese Gesamttabelle, die sp&#228;ter in mehrere Tabellen gespalten werden soll, dient der Erg&#228;nzung der konzeptionellen, logischen und physischen Modelle, kann aber diese nicht ersetzen.</p>
</sec>
<sec>
<title>2.5 Erstellung von Termbank-Eintr&#228;gen</title>
<p>Sobald die Modellierung der Daten abgeschlossen ist, erfolgt die Erstellung der einzelnen Tabellen der Datenbank, die mit den zuvor erhobenen und validierten lexikalischen und konzeptuellen Daten gef&#252;llt werden. Ein Eintrag im lexikografischen und terminografischen Sinne entspricht der Vereinigung der Datens&#228;tze, die in verschiedenen, durch Fremdschl&#252;ssel miteinander verbundenen Tabellen und ausgehend von einer Haupttabelle identifiziert werden k&#246;nnen. Die Tabelle, die wir als <italic>Haupttabelle</italic> definieren, enth&#228;lt alle Lemmata, also die Daten, die typischerweise im Mittelpunkt einer lexikalischen Ressource stehen. In dieser Phase verf&#252;gen wir bereits &#252;ber Konzepte, Termini und Varianten, die in die Tabellen als Lemmata oder als sonstige Angaben (z.B. Synonyme, Kollokationen, Verweise) eingef&#252;gt werden k&#246;nnen. Nun m&#252;ssen aber auch andere Arten von Angaben, die im Modell der Terminologiedatenbank vorgesehen sind, je nach Bedarf aus den Korpora gewonnen werden.</p>
<p>Aus Korpora k&#246;nnen nicht nur Daten &#252;ber die Kollokationen von Lemmata (in <italic>Sketch Engine</italic> durch das <italic>Word Sketch Tool</italic>) und Beispiele (durch Konkordanzen) gewonnen werden, sondern auch Daten &#252;ber semantische Relationen. Diese k&#246;nnen durch die Analyse bestimmter Textmuster erhoben werden, die f&#252;r eine Textdom&#228;ne typisch sein k&#246;nnen (z.B. Synonymie in Mustern wie <italic>ein X ist auch als Y bekannt</italic> oder Hyperonymie in Mustern wie <italic>X ist eine Art von Y</italic>).</p>
<p>Der Prozess der Akquisition von &#196;quivalenten h&#228;ngt von der Art der verwendeten Korpora ab. Im Falle von Parallelkorpora k&#246;nnen &#196;quivalentkandidaten extrahiert und validiert werden. Stehen hingegen nur einsprachige Korpora zur Verf&#252;gung, so k&#246;nnen diese in der Regel nur zur Validierung von &#196;quivalenten genutzt werden, die in Paralleltexten und durch den Austausch mit Fachexperten gesucht werden. Im Mittelpunkt dieses Beitrags stehen der vierte und der f&#252;nfte Schritt (Kap. 2.4 und 2.5), die sich speziell auf die Erstellung der terminologischen Datenbank beziehen.</p>
</sec>
</sec>
<sec>
<title>3. Terminologische Variation</title>
<p>Das Thema der terminologischen Variation in der Terminologieforschung hat in den letzten zwanzig Jahren grundlegende Bedeutung erlangt. Zahlreiche Forscher:innen haben das nat&#252;rliche Vorkommen synonymischer Varianten im fachspezifischen Lexikon vieler Disziplinen zunehmend hervorgehoben und dieses Ph&#228;nomen kann somit bei der Terminologie- und der Korpusarbeit nicht mehr ignoriert werden. Eine strikte, standardisierende und eher an der traditionellen Terminologielehre orientierte Perspektive von Variation als unerw&#252;nschte Erscheinung ist heutzutage aus vielen Gr&#252;nden nicht mehr praktikabel. Die heutige Forschungsrichtung wurde von teilweise sehr unterschiedlichen Anliegen angetrieben, etwa der Suche nach einem geeigneten Modell f&#252;r die Extraktion von Termini in der Computerlinguistik bzw. f&#252;r die Repr&#228;sentation von Termini in lexikografischen und terminografischen Ressourcen (vgl. <xref ref-type="bibr" rid="B8">Giacomini 2021</xref>). Die verf&#252;gbaren Klassifikationsmodelle f&#252;r terminologische Varianten sind entsprechend heterogen, funktional ausgerichtet und weisen meistens nur partielle &#220;berschneidungen auf.</p>
<p>In diesem Beitrag wird der Fokus auf nicht-diasystemischer Variation liegen, d.h. auf Varianten, die grunds&#228;tzlich keine diachronischen, diatopischen, diamesischen, diastratischen oder diaphasischen Unterschiede aufweisen und innerhalb desselben Textes vorkommen k&#246;nnen. Diese Art der Variation ist in der naturwissenschaftlichen und technischen Fachsprache weit verbreitet. Registerunterschiede k&#246;nnen dabei vorkommen, meistens geht es allerdings um einfache Synonyme bzw. Quasi-Synonyme, die in der gleichen Situation und unter den gleichen Kommunikationspartner:innen verwendet werden. Diese Synonyme stellen f&#252;r &#220;bersetzer auch deshalb eine Herausforderung dar, weil sie in der Regel nicht von lexikografischen bzw. terminografischen Ressourcen verzeichnet werden. Ihre Identifizierung und &#220;bersetzung erfordert oft zeitaufw&#228;ndige Dokumentationsarbeit, insbesondere durch die Recherche in Paralleltexten. Dies geschieht nicht nur bei der &#220;bersetzung in die Fremdsprache, sondern auch in die Muttersprache, sobald die fachlichen Kompetenzen des &#220;bersetzers nicht ausreichen, um Fragen wie diese zu beantworten: Ist eine bestimmte terminologische Variante in Gebrauch? Ist sie in einem bestimmten Fachgebiet, in einer bestimmten Textsorte, auf einer bestimmten Ebene der Fachkommunikation verwendbar?</p>
<p>In diesem Artikel beziehen wir uns auf die in Giacomini (<xref ref-type="bibr" rid="B7">2019</xref>) entwickelte Variantentypologie, die f&#252;r jedes Paar aus Hauptterminus (i.S.v. Vorzugsbenennung) und Variante die Angabe der Werte von drei Variationstypen vorsieht, n&#228;mlich der orthografischen Variation (OV), der syntaktischen Variation (SV) und der lexikalisch-morphologischen Variation (MV). Angaben zur lexikalisch-morphologischen Variation orientieren sich an der &#220;bereinstimmung oder Nicht&#252;bereinstimmung von lexikalischen Morphemen innerhalb der gegen&#252;bergestellten Termini.</p>
<p>W&#228;hrend die ersten beiden Typen einfach vorhanden (+) oder nicht-vorhanden (-) sein k&#246;nnen, ist es im Fall der lexikalisch-morphologischen Variation m&#246;glich, den zus&#228;tzlichen Wert des partiellen Auftretens (/) der Variation anzugeben. Im Folgenden werden zwei Beispiele f&#252;r Varianten und Variationstypen aus dem Bereich der Immunologie genannt:</p>
<table-wrap>
<table>
<tr>
<td align="left" valign="top">(a)</td>
<td align="left" valign="top">Reproduktionszahl &#8211; R-Wert</td>
<td align="left" valign="top">MV+</td>
<td align="left" valign="top">SV-</td>
<td align="left" valign="top">OV-</td>
</tr>
<tr>
<td align="left" valign="top">(b)</td>
<td align="left" valign="top">Linfocita T &#8211; cellula T</td>
<td align="left" valign="top">MV/</td>
<td align="left" valign="top">SV-</td>
<td align="left" valign="top">OV-</td>
</tr>
<tr>
<td align="left" valign="top">(c)</td>
<td align="left" valign="top">COVID-19 &#8211; Covid-19</td>
<td align="left" valign="top">MV-</td>
<td align="left" valign="top">SV-</td>
<td align="left" valign="top">OV+</td>
</tr>
<tr>
<td align="left" valign="top">(d)</td>
<td align="left" valign="top">WHO &#8211; World Health Organization</td>
<td align="left" valign="top">MV+</td>
<td align="left" valign="top">SV+</td>
<td align="left" valign="top">OV-</td>
</tr>
</table>
</table-wrap>
<p>In Beispiel (a) finden wir ein Terminuspaar ohne syntaktische oder orthografische Variation, jedoch mit vollst&#228;ndiger lexikalisch-morphologischer Variation. Bei Beispiel (b) ist eine partielle lexikalisch-morphologischer Variation vorhanden: Das Element <italic>T</italic> tritt in beiden Formen auf, w&#228;hrend <italic>linfocita</italic> und <italic>cellula</italic> andere lexikalische Morpheme aufweisen. Im dritten Beispiel (c) sind keine morphologischen oder syntaktischen Unterschiede zwischen Hauptterminus und Variante zu erkennen. Die Variation ist lediglich orthografischer Natur und betrifft die Gro&#223;- bzw. Kleinschreibung in den zwei Termini. Das letzte Terminuspaar (d) zeigt hingegen ein Beispiel f&#252;r syntaktische Variation, das typischerweise bei der Aufl&#246;sung eines Initialismus oder eines Akronyms auftritt. Gleichzeitig ist eine vollst&#228;ndige lexikalisch-morphologische Variation zu sehen.</p>
<p>Bei dieser Auffassung von Variation finden sich gr&#246;&#223;tenteils Fachkollokationen, deren Varianten auf die relative Modifizierbarkeit und Ersetzbarkeit der Kollokationsbestandteile zur&#252;ckzuf&#252;hren sind. Diese Varianten treten als Koreferenten in einem Text oder als Alternativen in verschiedenen kommunikativen Kontexten, Genres und Texttypen auf.</p>
</sec>
<sec>
<title>4. Die Erstellung einer relationalen Termbank der Immunologie</title>
<p>In diesem Kapitel wird der Schwerpunkt auf den Entwurf von ImmunoTerm, der Terminologiedatenbank f&#252;r das Fachgebiet der Immunologie, und die Erfassung ihrer Eintr&#228;ge gelegt. Der Bereich der Immunologie wurde gew&#228;hlt, um den Kurs &#252;ber Datenbanken thematisch mit einer parallelen Fach&#252;bersetzungs&#252;bung Deutsch-Italienisch zu begleiten, die dasselbe Thema zum Inhalt hatte. Aufgrund der aktuellen Pandemie ist die Immunologie zu einem bekannten Thema geworden. Dies hat m&#246;glicherweise dazu beigetragen, dass die Terminologie des Fachgebiets auf der untersten kommunikativen Ebene der vertikalen Gliederung der medizinischen Fachsprache, d.h. auf der Ebene der Kommunikation mit Patienten oder interessierten Nichtexperten, ausgeweitet wurde. Im Allgemeinen weist die Fachlexik der Immunologie in den untersuchten Sprachen die typischen Merkmale der medizinischen Fachsprache auf, u.a. die starke Pr&#228;senz von lexikalischen Formen neoklassischen Ursprungs und Fachphrasemen, sowie die ausgepr&#228;gte Dualit&#228;t zwischen Sprache der Wissenschaft und Sprache der Popularisierung (vgl. <xref ref-type="bibr" rid="B11">Serianni 2005</xref>; <xref ref-type="bibr" rid="B10">Pera / Schmiedebach 2007</xref>; <xref ref-type="bibr" rid="B4">Cortelazzo 2009</xref>; <xref ref-type="bibr" rid="B3">Busch / Spranz-Fogasy 2015</xref>).</p>
<sec>
<title>4.1 Termbankentwurf</title>
<p>Das hier beschriebene Beispiel einer terminologischen Datenbank basiert auf einer zweisprachigen Ressource f&#252;r Italienisch und Deutsch, die bidirektional und bifunktional angelegt ist. Dies setzt eine strukturelle Gleichheit der Eintr&#228;ge in den beiden Sprachen voraus.</p>
<p>Die ImmunoTerm Datenbank soll als Grundlage f&#252;r ein zweisprachiges Fachw&#246;rterbuch dienen. Der ideale Benutzer/die ideale Benutzerin ist der Fach&#252;bersetzer/die Fach&#252;bersetzerin, dessen/deren Muttersprache Deutsch oder Italienisch ist und der Texte typischerweise in die L1, manchmal aber auch in die L2 oder Fremdsprache &#252;bersetzt. Dieser Benutzer/diese Benutzerin verf&#252;gt &#252;ber fortgeschrittene Sprachkenntnisse in beiden Sprachen und &#252;ber durchschnittliche Fachkenntnisse: Er/Sie kann das Thema und die Fachsprache weitgehend verstehen, jedoch nicht auf demselben Niveau wie ein Fachexperte. Die in der Datenbank enthaltene Terminologie ist in Bezug auf das kommunikative Niveau &#252;bergreifend, d.h. sie umfasst sowohl hochspezialisierten Wortschatz als auch das f&#252;r popularisierende Textsorten typische Fachvokabular.</p>
<p>Lexikalische und konzeptuelle Daten (in unserem Fall: lexikografische Angaben) sind in <xref ref-type="table" rid="T1">Tabelle 1</xref> aufgelistet und werden nach dem Mikrostrukturmodell von Wiegand (vgl. <xref ref-type="bibr" rid="B2">Bergenholtz et al. 2008</xref>) in Formkommentar und semantischen Kommentar unterteilt:</p>
<table-wrap id="T1">
<label>Tabelle 2</label>
<caption>
<p>Liste der Datentypen in der Termbank.</p>
</caption>
<table>
<tr>
<td align="left" valign="top">Formkommentar:</td>
<td align="left" valign="top" colspan="2">Semantischer Kommentar:</td>
</tr>
<tr>
<td colspan="3"><hr/></td>
</tr>
<tr>
<td align="left" valign="top">Terminus (mit TermID)</td>
<td align="left" valign="top">Kommunikative Ebene/Register</td>
<td align="left" valign="top">Verweis</td>
</tr>
<tr>
<td align="left" valign="top">Sprache</td>
<td align="left" valign="top">Definition</td>
<td align="left" valign="top">Abbildung</td>
</tr>
<tr>
<td align="left" valign="top">IPA</td>
<td align="left" valign="top">Definitionsquelle</td>
<td align="left" valign="top">KONZEPT</td>
</tr>
<tr>
<td align="left" valign="top">Wortklasse</td>
<td align="left" valign="top">Variante</td>
<td align="left" valign="top"></td>
</tr>
<tr>
<td align="left" valign="top">Genus</td>
<td align="left" valign="top">&#196;quivalent</td>
<td align="left" valign="top"></td>
</tr>
<tr>
<td align="left" valign="top">Genitiv</td>
<td align="left" valign="top">Beispiel</td>
<td align="left" valign="top"></td>
</tr>
<tr>
<td align="left" valign="top">Plural</td>
<td align="left" valign="top">Beispielquelle</td>
<td align="left" valign="top"></td>
</tr>
</table>
</table-wrap>
<p>Im semantischen Kommentar geben wir auch an, welches Konzept (in Gro&#223;buchstaben) durch einen Terminus ausgedr&#252;ckt wird. Bei den lexikografischen Angaben, die speziell f&#252;r unser Experiment erstellt wurden, f&#228;llt auf, dass es kein Attribut gibt, das der Angabe der Kollokationen des Lemmas dient. Diese Wahl l&#228;sst sich damit begr&#252;nden, dass wir beabsichtigen, Kollokationen als Lemmata (Attribut &#8222;Terminus&#8220;) in gleicher Weise zu behandeln wie einfache Termini. Die Beziehung zwischen einem einfachen (Fach-)Wort und seinen Kollokationen wird durch Querverweisangaben (Attribut &#8222;Verweis&#8220;) ausgedr&#252;ckt. Diese Angabetypen sind, wie in Kapitel 2.4 erl&#228;utert, in einer einzelnen, allgemeinen Tabelle zusammengefasst, die alle dargestellten Attribute enth&#228;lt und die f&#252;r eine erste Einsch&#228;tzung der Datenabdeckung n&#252;tzlich ist.</p>
<p>Bei der Modellierung der Daten wird auch der Datentyp jedes Attributs festgelegt, der in unserem Fall VARCHAR(n) ist, d.h. eine Zeichenkette mit einer variablen L&#228;nge. Die einzige Ausnahme bildet das Attribut TermID, der numerische Bezeichner jedes Terminus, der vom Typ INTEGER(n) ist, d.h. eine Ganzzahl.</p>
<p>Jede Klasse im UML-Diagramm entspricht einer Tabelle in der Datenbank. Insgesamt besteht die relationale Datenbank aus 8 Tabellen. Die Struktur der normalisierten Tabellen ist nachstehend aufgef&#252;hrt (jedem Tabellennamen geht ein &#8222;t_&#8220; vor):</p>
<p>(1) t_haupttabelle:</p>
<p><graphic xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="kordaf-2-1-59-g2.png"/></p>
<p>Prim&#228;rschl&#252;ssel wurden durch Unterstreichen des Namens des entsprechenden Attributs gekennzeichnet, z.B. <underline>TermID</underline> in t_varianten. In einigen F&#228;llen gibt es zusammengesetzte Schl&#252;ssel, die mehr als einem Attribut entsprechen, z.B. <underline>TermID</underline> und <underline>Sprache</underline> in t_haupttabelle. Diese L&#246;sung ist n&#252;tzlich, wenn ein Datensatz (d.h. eine Zeile in einer Tabelle) nicht durch ein einziges Attribut eindeutig identifiziert werden kann. Dies ist bei der t_haupttabelle der Fall, bei der ein deutscher Terminus und ein italienischer Terminus potenziell homonym sein k&#246;nnten (siehe Eigennamen, Abk&#252;rzungen, Fremdw&#246;rter usw.) und daher nur anhand der Kombination von Terminus und Sprache zu unterscheiden sind.</p>
<p>Das UML-Diagramm in <xref ref-type="fig" rid="F2">Abbildung 2</xref> veranschaulicht die Struktur der Terminologiedatenbank mit s&#228;mtlichen Klassen, Attributen, Datentypen und Prim&#228;rschl&#252;sseln.</p>
<fig id="F2">
<label>Abbildung 2</label>
<caption>
<p>UML-Diagramm mit dem physischen Datenmodell, aus dem Klassen, Attribute, Datentypen und Relationen mit Multiplizit&#228;ten ersichtlich sind. PK: Primary Key (Prim&#228;rschl&#252;ssel).</p>
</caption>
<graphic xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="kordaf-2-1-59-g3.png"/>
</fig>
<p>Es werden auch Multiplizit&#228;ten angezeigt, die die Art der Relationen zwischen den Klassen angeben. Aus dem UML-Diagramm wird nun deutlich, dass eine Terminologiedatenbank geplant ist, in der das Lemma mindestens eine Definition, ein &#196;quivalent und ein Beispiel haben muss. Das Lemma muss allerdings nicht unbedingt eine Variante haben oder auf etwas verweisen. Jede Definition und jedes Beispiel hat genau eine Quelle, w&#228;hrend dieselbe Quelle mit mehr als einer Definition und mehr als einem Beispiel verbunden sein kann.</p>
<p>Der &#220;bersichtlichkeit halber wurde beschlossen, eine ID nur mit dem Attribut &#8222;Terminus&#8220; zu verkn&#252;pfen, w&#228;hrend in anderen F&#228;llen der Prim&#228;rschl&#252;ssel dem Attribut selbst entspricht.</p>
<p>Die Datenbank enth&#228;lt zwei Arten von Tabellen: Tabellen mit Prim&#228;rschl&#252;sseln bzw. Fremdschl&#252;sseln (1, 3, 7) und Verbindungstabellen, bei denen das Schl&#252;sselattribut aus einer Verkn&#252;pfung von zwei Schl&#252;sseln besteht (2, 4, 5, 6, 8). Diese verschiedenen Typen spiegeln die in <xref ref-type="fig" rid="F2">Abbildung 2</xref> gezeigten unterschiedlichen Multiplizit&#228;ten wider, d.h. die verschiedenen Relationen zwischen den Tabellen.</p>
<p>Die t_haupttabelle enth&#228;lt Attribute, mit denen das Lemma (TermID/Terminus) folgende Relationen aufweist:</p>
<disp-quote>
<p>1:1 (ggf. 1:0), d.h. einem und nur einem Lemma entspricht genau eine Pluralform, eine Genitivform bzw. eine Abbildung;</p>
<p>n:1 (ggf. n:0), d.h. einer bestimmten Anzahl n von Lemmata entspricht genau eine Sprache, eine Wortklasse, eine kommunikative Ebene bzw. ein Konzept.</p>
</disp-quote>
<p>An diesem Beispiel wird deutlich, dass diese Struktur das Resultat gezielter Entscheidungen ist, z.B. bei der Zuordnung von Termini zu Konzepten. In einer anderen Terminologiedatenbank k&#246;nnte man sich daf&#252;r entscheiden, mehr als ein Konzept f&#252;r denselben Terminus zuzulassen.</p>
<p>Die Tabellen t_definitionsquelle und t_beispielquelle haben die gleiche Art von Relation wie t_haupttabelle, d.h. die Quelle kann einer oder mehreren Definitionen bzw. einem oder mehreren Beispielen zugeordnet werden. Der Unterschied zur Haupttabelle besteht darin, dass die Quelle nicht ein Attribut des Lemmas, sondern der Definition oder des Beispiels ist. Durch Anwendung der dritten Normalform auf die urspr&#252;ngliche Gesamttabelle werden zwei getrennte Tabellen erstellt, in die die Quellen f&#252;r Definitionen und Beispiele eingef&#252;gt werden k&#246;nnen.</p>
<p>Verbindungstabellen weisen hingegen eine n:m-Relation zwischen ihren Attributen auf, d.h. eine n-Anzahl von Instanzen eines bestimmten Attributs entspricht einer m-Anzahl von Instanzen eines anderen Attributs. Dies ist bei den Tabellen t_definitionen, t_varianten, t_&#228;quivalent, t_beispiele und t_verweise der Fall: Z.B. kann ein Terminus die Variante mehrerer Lemmata sein, so wie ein Lemma mehrere Varianten haben kann.</p>
<p>An dieser Stelle soll noch einmal auf die Anwendung und N&#252;tzlichkeit der Normalisierung von Tabellen ausgehend von einer Gesamttabelle eingegangen werden. Bei einer Tabelle in der ersten Normalform sind die Wertebereiche aller Attribute atomar. Das bedeutet, dass jedes Feld eines jeden Attributs einen einzigen Wert enthalten darf: jede Definition, jedes Beispiel, jede Variante usw. muss in ein separates Feld eingetragen werden. Das hat zur Folge, dass jeder einzelne Wert unabh&#228;ngig in der Datenbank gesucht werden kann.</p>
<p>Eine Tabelle ist in der zweiten Normalform, wenn sie sich in der ersten Normalform befindet und jedes Nichtschl&#252;sselattribut voll funktional abh&#228;ngig von jedem Schl&#252;sselkandidaten ist, d.h. es ist vom gesamten Schl&#252;sselkandidaten funktional abh&#228;ngig, aber nicht bereits von Teilen davon. Eine funktionale Abh&#228;ngigkeit liegt wiederum vor, wenn zu jedem Wert eines Attributs h&#246;chstens ein Wert von einem anderen Attribut vorhanden ist. Bei unserem Experiment ist die zweite Normalform bereits gegeben, deshalb wurde direkt zur dritten Normalform &#252;bergegangen.</p>
<p>Die dritte Normalform besagt, dass eine Tabelle in der zweiten Normalform sein muss und keine transitiven Abh&#228;ngigkeiten zwischen Nichtschl&#252;sselattributen und Schl&#252;sselkandidaten bestehen d&#252;rfen. Das f&#252;hrt zur Aufteilung von Tabellen, wenn ein Attribut (z.B. Quelle) nicht unmittelbar vom Schl&#252;sselkandidaten (z.B. TermID) abh&#228;ngig ist, sondern von einem anderen Attribut (z.B. Definition). Diese Regel stellt sicher, dass die Tabellen einer relationalen Datenbank nur direkte Abh&#228;ngigkeiten enthalten.</p>
<p>In der Praxis finden am h&#228;ufigsten die ersten drei Normalformen Anwendung, da sie die wesentlichen Problematiken ansprechen. W&#228;hrend des Normalisierungsprozesses besteht die M&#246;glichkeit, weitere Regeln anzuwenden, ein Thema, auf das in diesem Beitrag jedoch nicht eingegangen wird. Wie in Abschnitt 2.4 erw&#228;hnt, findet die Umwandlung der Tabellen in die ersten drei Normalformen w&#228;hrend der Erstellung des Datenmodells statt.</p>
</sec>
<sec>
<title>4.2. Erstellung von Eintr&#228;gen</title>
<p>Nachdem die Anzahl und Struktur der einzelnen Tabellen festgelegt und die Zusammenh&#228;nge zwischen den verschiedenen Tabellen in der Datenbank anhand von Schl&#252;sseln sichergestellt wurden, werden alle Tabellen mit den zuvor gesammelten und aufbereiteten lexikalischen und konzeptuellen Daten gef&#252;llt. Die Tabellen werden im CSV-Format angelegt, einem Tabellenformat, das sich zum Import oder zur direkten Erstellung im Datenbankmanagementsystem eignet.</p>
<p>Zu jeder Tabelle werden nun Ausz&#252;ge aus den Daten f&#252;r die Fachsprache der Immunologie angezeigt. Aus Gr&#252;nden der Lesbarkeit wird die Tabelle t_haupttabelle im Folgenden aufgeteilt.</p>
<p>(1) t_haupttabelle:</p>
<table-wrap>
<table>
<tr>
<td colspan="8"><hr/></td>
</tr>
<tr>
<td align="left" valign="top"><underline>TermID</underline></td>
<td align="left" valign="top">Terminus</td>
<td align="left" valign="top"><underline>Sprache</underline></td>
<td align="left" valign="top">IPA</td>
<td align="left" valign="top">Wortklasse</td>
<td align="left" valign="top">Genus</td>
<td align="left" valign="top">Genitiv</td>
<td align="left" valign="top">Plural</td>
</tr>
<tr>
<td colspan="8"><hr/></td>
</tr>
<tr>
<td align="left" valign="top">1</td>
<td align="left" valign="top">anticorpi</td>
<td align="left" valign="top">IT</td>
<td align="left" valign="top"></td>
<td align="left" valign="top">N</td>
<td align="left" valign="top">m.</td>
<td align="left" valign="top"></td>
<td align="left" valign="top">(-)</td>
</tr>
<tr>
<td colspan="8"><hr/></td>
</tr>
<tr>
<td align="left" valign="top" style="background-color:#e1e1e1;">2</td>
<td align="left" valign="top" style="background-color:#e1e1e1;">agente patogeno</td>
<td align="left" valign="top" style="background-color:#e1e1e1;">IT</td>
<td align="left" valign="top" style="background-color:#e1e1e1;"></td>
<td align="left" valign="top" style="background-color:#e1e1e1;">N + A</td>
<td align="left" valign="top" style="background-color:#e1e1e1;">m.</td>
<td align="left" valign="top" style="background-color:#e1e1e1;"></td>
<td align="left" valign="top" style="background-color:#e1e1e1;">agenti patogeni</td>
</tr>
<tr>
<td colspan="8"><hr/></td>
</tr>
<tr>
<td align="left" valign="top">3</td>
<td align="left" valign="top">Antik&#246;rper</td>
<td align="left" valign="top">DE</td>
<td align="left" valign="top"></td>
<td align="left" valign="top">N</td>
<td align="left" valign="top">m.</td>
<td align="left" valign="top">Antik&#246;rper</td>
<td align="left" valign="top">(-)</td>
</tr>
<tr>
<td colspan="8"><hr/></td>
</tr>
<tr>
<td align="left" valign="top">4</td>
<td align="left" valign="top">impfen</td>
<td align="left" valign="top">DE</td>
<td align="left" valign="top"></td>
<td align="left" valign="top">V</td>
<td align="left" valign="top"></td>
<td align="left" valign="top"></td>
<td align="left" valign="top"></td>
</tr>
<tr>
<td colspan="8"><hr/></td>
</tr>
<tr>
<td align="left" valign="top">5</td>
<td align="left" valign="top">COVID-19</td>
<td align="left" valign="top">DE</td>
<td align="left" valign="top">[&#716;ko&#720;v&#618;t&#712;n&#596;&#618;&#815;nt&#865;se&#720;n]</td>
<td align="left" valign="top">N</td>
<td align="left" valign="top">m./n./f.</td>
<td align="left" valign="top">COVID-19</td>
<td align="left" valign="top"></td>
</tr>
<tr>
<td colspan="8"><hr/></td>
</tr>
<tr>
<td align="left" valign="top">6</td>
<td align="left" valign="top">COVID-19</td>
<td align="left" valign="top">IT</td>
<td align="left" valign="top"></td>
<td align="left" valign="top">N</td>
<td align="left" valign="top">m.</td>
<td align="left" valign="top"></td>
<td align="left" valign="top"></td>
</tr>
<tr>
<td colspan="8"><hr/></td>
</tr>
</table>
</table-wrap>
<table-wrap>
<table>
<tr>
<td colspan="4"><hr/></td>
</tr>
<tr>
<td align="left" valign="top"><underline>TermID</underline></td>
<td align="left" valign="top">Kommunikative Ebene</td>
<td align="left" valign="top">Konzept</td>
<td align="left" valign="top">Abbildung</td>
</tr>
<tr>
<td colspan="4"><hr/></td>
</tr>
<tr>
<td align="left" valign="top">1</td>
<td align="left" valign="top">esperti/non-esperti</td>
<td align="left" valign="top">SISTEMA IMMUNITARIO</td>
<td align="left" valign="top"></td>
</tr>
<tr>
<td colspan="4"><hr/></td>
</tr>
<tr>
<td align="left" valign="top" style="background-color:#e1e1e1;">2</td>
<td align="left" valign="top" style="background-color:#e1e1e1;">esperti</td>
<td align="left" valign="top" style="background-color:#e1e1e1;">AGENTI PATOGENI</td>
<td align="left" valign="top" style="background-color:#e1e1e1;"><ext-link ext-link-type="uri" xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="https://st3.depositphotos.com/2731675/35262/i/600/depositphotos_352621372-stock-photo-conceptual-illustrative-virus-image-of.jpg">https://st3.depositphotos.com/2731675/35262/i/600/depositphotos_352621372-stock-photo-conceptual-illustrative-virus-image-of.jpg</ext-link></td>
</tr>
<tr>
<td colspan="4"><hr/></td>
</tr>
<tr>
<td align="left" valign="top">3</td>
<td align="left" valign="top">Experten/Nicht-Experten</td>
<td align="left" valign="top">IMMUNSYSTEM</td>
<td align="left" valign="top"><ext-link ext-link-type="uri" xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="https://static.spektrum.de/fm/912/thumbnails/6813384933_166d8e7f29_o.jpg.3113806.jpg">https://static.spektrum.de/fm/912/thumbnails/6813384933_166d8e7f29_o.jpg.3113806.jpg</ext-link></td>
</tr>
<tr>
<td colspan="4"><hr/></td>
</tr>
<tr>
<td align="left" valign="top">4</td>
<td align="left" valign="top">Experten/Nicht-Experten</td>
<td align="left" valign="top">PROZESSE</td>
<td align="left" valign="top"></td>
</tr>
<tr>
<td colspan="4"><hr/></td>
</tr>
<tr>
<td align="left" valign="top">5</td>
<td align="left" valign="top">Experten/Nicht-Experten</td>
<td align="left" valign="top">KRANKHEITEN</td>
<td align="left" valign="top"></td>
</tr>
<tr>
<td colspan="4"><hr/></td>
</tr>
<tr>
<td align="left" valign="top">6</td>
<td align="left" valign="top">Experten/Nicht-Experten</td>
<td align="left" valign="top">PATOLOGIE</td>
<td align="left" valign="top"></td>
</tr>
<tr>
<td colspan="4"><hr/></td>
</tr>
</table>
</table-wrap>
<p>Felder, die sich auf ein bestimmtes Attribut beziehen, k&#246;nnen den Null-Wert annehmen bzw. leer bleiben, wenn kein Wert anzugeben ist (z.B. die Genitivform bei italienischen Substantiven). Im Falle von Lemmata, die haupts&#228;chlich im Plural verwendet werden, z.B. <italic>Antik&#246;rper</italic>, wird beim Attribut &#8222;Plural&#8220; die Angabe &#8222;(-)&#8220; gemacht. Die Angaben werden jeweils in der Sprache des Lemmas gemacht, auch im Falle der Konzepte. F&#252;r unser Experiment wurden sechs Konzepte ausgew&#228;hlt, die den gesamten Fachwortschatz der ausgew&#228;hlten Texte abdecken: CORPO E ORGANI / K&#214;RPER UND ORGANE, SISTEMA IMMUNITARIO / IMMUNSYSTEM, PROCESSI / PROZESSE, PATOLOGIE / KRANKHEITEN, AGENTI PATOGENI / KRANKHEITSERREGER, AGENTI / AGENTEN.</p>
<p>(2) t_definitionen:</p>
<table-wrap>
<table>
<tr>
<td colspan="2"><hr/></td>
</tr>
<tr>
<td align="left" valign="top"><underline>TermID</underline></td>
<td align="left" valign="top"><underline>Definition</underline></td>
</tr>
<tr>
<td colspan="2"><hr/></td>
</tr>
<tr>
<td align="left" valign="top">1</td>
<td align="left" valign="top">Proteina diretta contro una sostanza riconosciuta come estranea (antigene) che contribuisce alla difesa immunitaria dell'organismo.</td>
</tr>
<tr>
<td colspan="2"><hr/></td>
</tr>
<tr>
<td align="left" valign="top" style="background-color:#e1e1e1;">2</td>
<td align="left" valign="top" style="background-color:#e1e1e1;">Microrganismo in grado di causare malattie.</td>
</tr>
<tr>
<td colspan="2"><hr/></td>
</tr>
<tr>
<td align="left" valign="top">3</td>
<td align="left" valign="top">Antik&#246;rper oder Immunglobuline sind globul&#228;re <underline>Proteine</underline>, die von zu Plasmazellen differenzierten B-Lymphozyten produziert und sezerniert werden. Sie sind gegen Bestandteile eines Antigens gerichtet und besitzen die F&#228;higkeit an dieses zu binden.</td>
</tr>
<tr>
<td colspan="2"><hr/></td>
</tr>
</table>
</table-wrap>
<p>Einem Lemma entspricht meistens eine einzige Definition. In manchen F&#228;llen ist es allerdings notwendig, Teildefinitionen bzw. Definitionen aus unterschiedlichen Quellen anzugeben.</p>
<p>(3) t_definitionsquellen:</p>
<table-wrap>
<table>
<tr>
<td colspan="2"><hr/></td>
</tr>
<tr>
<td align="left" valign="top"><underline>Definition</underline></td>
<td align="left" valign="top">Quelle</td>
</tr>
<tr>
<td colspan="2"><hr/></td>
</tr>
<tr>
<td align="left" valign="top">Proteina diretta contro una sostanza riconosciuta come estranea (antigene) che contribuisce alla difesa immunitaria dell'organismo.</td>
<td align="left" valign="top"><ext-link ext-link-type="uri" xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="http://www.paginesanitarie.com/anticorpo.htm">http://www.paginesanitarie.com/anticorpo.htm</ext-link></td>
</tr>
<tr>
<td colspan="2"><hr/></td>
</tr>
<tr>
<td align="left" valign="top" style="background-color:#e1e1e1;">Microrganismo in grado di causare malattie.</td>
<td align="left" valign="top" style="background-color:#e1e1e1;"><ext-link ext-link-type="uri" xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="http://www.paginesanitarie.com/agentepatogeno.htm">http://www.paginesanitarie.com/agentepatogeno.htm</ext-link></td>
</tr>
<tr>
<td colspan="2"><hr/></td>
</tr>
<tr>
<td align="left" valign="top">Antik&#246;rper oder Immunglobuline sind globul&#228;re <underline>Proteine</underline>, die von zu Plasmazellen differenzierten B-Lymphozyten produziert und sezerniert werden. Sie sind gegen Bestandteile eines Antigens gerichtet und besitzen die F&#228;higkeit an dieses zu binden.</td>
<td align="left" valign="top"><ext-link ext-link-type="uri" xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="https://flexikon.doccheck.com/de/Antik%C3%B6rper">https://flexikon.doccheck.com/de/Antik%C3%B6rper</ext-link></td>
</tr>
<tr>
<td colspan="2"><hr/></td>
</tr>
</table>
</table-wrap>
<p>In einem sp&#228;teren Schritt ist es m&#246;glich, Definitionen mit Identifikationsnummern zu versehen. Dies w&#252;rde allerdings die Erstellung einer neuen Tabelle mit den Attributen &#8222;Definition&#8220; und &#8222;DefinitionID&#8220; erfordern. Darauf wurde hier aus Gr&#252;nden besserer Nachvollziehbarkeit verzichtet.</p>
<p>(4) t_varianten:</p>
<table-wrap>
<table>
<tr>
<td colspan="3"><hr/></td>
</tr>
<tr>
<td align="left" valign="top"><underline>TermID</underline></td>
<td align="left" valign="top"><underline>Variante</underline></td>
<td align="left" valign="top">Variationstyp</td>
</tr>
<tr>
<td colspan="3"><hr/></td>
</tr>
<tr>
<td align="left" valign="top" style="background-color:#e1e1e1;">2</td>
<td align="left" valign="top" style="background-color:#e1e1e1;">agente infettivo</td>
<td align="left" valign="top" style="background-color:#e1e1e1;">MV/ SV- OV-</td>
</tr>
<tr>
<td colspan="3"><hr/></td>
</tr>
<tr>
<td align="left" valign="top">3</td>
<td align="left" valign="top">Immunglobuline</td>
<td align="left" valign="top">MS+ SV- OV-</td>
</tr>
<tr>
<td colspan="3"><hr/></td>
</tr>
<tr>
<td align="left" valign="top">6</td>
<td align="left" valign="top">Covid-19</td>
<td align="left" valign="top">MV- SV- OV+</td>
</tr>
<tr>
<td colspan="3"><hr/></td>
</tr>
</table>
</table-wrap>
<p>Wie in Abschnitt 3 erl&#228;utert, beschreibt das Attribut &#8222;Variationstyp&#8220; die Kombination aus einem bestimmten Terminus und einer spezifischen Variante. Um die Konstellation der drei Variationsm&#246;glichkeiten (morphologisch, syntaktisch und orthografisch) anzugeben, verwenden wir die oben vorgeschlagene Notation.</p>
<p>(5) t_&#228;quivalente:</p>
<table-wrap>
<table>
<tr>
<td colspan="2"><hr/></td>
</tr>
<tr>
<td align="left" valign="top"><underline>TermID</underline></td>
<td align="left" valign="top"><underline>&#196;quivalent</underline></td>
</tr>
<tr>
<td colspan="2"><hr/></td>
</tr>
<tr>
<td align="left" valign="top">1</td>
<td align="left" valign="top">Antik&#246;rper</td>
</tr>
<tr>
<td colspan="2"><hr/></td>
</tr>
<tr>
<td align="left" valign="top" style="background-color:#e1e1e1;">2</td>
<td align="left" valign="top" style="background-color:#e1e1e1;">Krankheitserreger</td>
</tr>
<tr>
<td colspan="2"><hr/></td>
</tr>
<tr>
<td align="left" valign="top" style="background-color:#e1e1e1;">2</td>
<td align="left" valign="top" style="background-color:#e1e1e1;">Erreger</td>
</tr>
<tr>
<td colspan="2"><hr/></td>
</tr>
<tr>
<td align="left" valign="top">3</td>
<td align="left" valign="top">anticorpo</td>
</tr>
<tr>
<td colspan="2"><hr/></td>
</tr>
<tr>
<td align="left" valign="top">4</td>
<td align="left" valign="top">vaccinare</td>
</tr>
<tr>
<td colspan="2"><hr/></td>
</tr>
<tr>
<td align="left" valign="top">5</td>
<td align="left" valign="top">COVID-19</td>
</tr>
<tr>
<td colspan="2"><hr/></td>
</tr>
<tr>
<td align="left" valign="top">5</td>
<td align="left" valign="top">Covid-19</td>
</tr>
<tr>
<td colspan="2"><hr/></td>
</tr>
</table>
</table-wrap>
<p>Ein Lemma darf mehrere &#196;quivalente haben &#8211; z.B. hat der Terminus <italic>agente patogeno Krankheitserreger</italic> und <italic>Erreger</italic> als &#196;quivalente. Es ist hier kein Null-Wert zul&#228;ssig: Falls ein Lemma keine Entsprechung in der Zielsprache hat, soll beispielsweise eine Paraphrase angeboten bzw. der Terminus aus der Ausgangssprache als Fremdwort &#252;bernommen werden.</p>
<p>(6) t_beispiele:</p>
<table-wrap>
<table>
<tr>
<td colspan="2"><hr/></td>
</tr>
<tr>
<td align="left" valign="top"><underline>TermID</underline></td>
<td align="left" valign="top"><underline>Beispiel</underline></td>
</tr>
<tr>
<td colspan="2"><hr/></td>
</tr>
<tr>
<td align="left" valign="top">1</td>
<td align="left" valign="top">L&#8217;AIFA ha aggiornato le modalit&#224; di utilizzo degli anticorpi monoclonali anti COVID-19 in relazione alle nuove evidenze di letteratura che si sono rese recentemente disponibili.</td>
</tr>
<tr>
<td colspan="2"><hr/></td>
</tr>
<tr>
<td align="left" valign="top" style="background-color:#e1e1e1;">2</td>
<td align="left" valign="top" style="background-color:#e1e1e1;">La percentuale di popolazione che deve divenire immune per proteggere anche chi &#232; ancora suscettibile varia a seconda dell&#8217;agente patogeno.</td>
</tr>
<tr>
<td colspan="2"><hr/></td>
</tr>
<tr>
<td align="left" valign="top">4</td>
<td align="left" valign="top">Wie sollen Personen sich impfen lassen, die an klinischen Impfstoffstudien teilgenommen haben?</td>
</tr>
<tr>
<td colspan="2"><hr/></td>
</tr>
</table>
</table-wrap>
<p>&#196;hnlich wie bei Definitionen d&#252;rfen einem Lemma mehrere Beispiele zugeordnet werden.</p>
<p>(7) t_beispielquellen:</p>
<table-wrap>
<table>
<tr>
<td colspan="2"><hr/></td>
</tr>
<tr>
<td align="left" valign="top"><underline>Beispiel</underline></td>
<td align="left" valign="top">Quelle</td>
</tr>
<tr>
<td colspan="2"><hr/></td>
</tr>
<tr>
<td align="left" valign="top">L&#8217;AIFA ha aggiornato le modalit&#224; di utilizzo degli anticorpi monoclonali anti COVID-19 in relazione alle nuove evidenze di letteratura che si sono rese recentemente disponibili.</td>
<td align="left" valign="top"><ext-link ext-link-type="uri" xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="https://www.aifa.gov.it/-/definizione-delle-modalit%C3%A0-ottimali-d-uso-degli-anticorpi-monoclonali-anti-covid-19">https://www.aifa.gov.it/-/definizione-delle-modalit%C3%A0-ottimali-d-uso-degli-anticorpi-monoclonali-anti-covid-19</ext-link></td>
</tr>
<tr>
<td colspan="2"><hr/></td>
</tr>
<tr>
<td align="left" valign="top" style="background-color:#e1e1e1;">La percentuale di popolazione che deve divenire immune per proteggere anche chi &#232; ancora suscettibile varia a seconda dell&#8217;agente patogeno.</td>
<td align="left" valign="top" style="background-color:#e1e1e1;"><ext-link ext-link-type="uri" xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="https://www.iss.it/documents/20126/0/Glossario.pdf/fe8c209d-33b7-dbc4-b324-44eee879895f?t=1585325504835">https://www.iss.it/documents/20126/0/Glossario.pdf/fe8c209d-33b7-dbc4-b324-44eee879895f?t=1585325504835</ext-link></td>
</tr>
<tr>
<td colspan="2"><hr/></td>
</tr>
<tr>
<td align="left" valign="top">Wie sollen Personen sich impfen lassen, die an klinischen Impfstoffstudien teilgenommen haben?</td>
<td align="left" valign="top"><ext-link ext-link-type="uri" xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="https://www.rki.de/SharedDocs/FAQ/COVID-Impfen/FAQ_Liste_Durchfuehrung_Impfung.html">https://www.rki.de/SharedDocs/FAQ/COVID-Impfen/FAQ_Liste_Durchfuehrung_Impfung.html</ext-link></td>
</tr>
<tr>
<td colspan="2"><hr/></td>
</tr>
</table>
</table-wrap>
<p>Auch hier k&#246;nnen Identifikationsnummern f&#252;r die Beispiele (BeispielID) vergeben werden.</p>
<p>(8) t_verweise:</p>
<table-wrap>
<table>
<tr>
<td colspan="2"><hr/></td>
</tr>
<tr>
<td align="left" valign="top"><underline>TermID</underline></td>
<td align="left" valign="top"><underline>Verweis</underline></td>
</tr>
<tr>
<td colspan="2"><hr/></td>
</tr>
<tr>
<td align="left" valign="top" style="background-color:#e1e1e1;">2</td>
<td align="left" valign="top" style="background-color:#e1e1e1;">6</td>
</tr>
<tr>
<td colspan="2"><hr/></td>
</tr>
<tr>
<td align="left" valign="top">5</td>
<td align="left" valign="top">4</td>
</tr>
<tr>
<td colspan="2"><hr/></td>
</tr>
<tr>
<td align="left" valign="top">6</td>
<td align="left" valign="top">2</td>
</tr>
<tr>
<td colspan="2"><hr/></td>
</tr>
</table>
</table-wrap>
<p>Verweise erfolgen zwischen Lemmata der gleichen Sprache und werden daher in der Tabelle t_verweise nur durch die TermID dieser Lemmata identifiziert. In den vorliegenden Daten wird vom italienischen Lemma <italic>agente patogeno</italic> auf das italienische Lemma <italic>COVID-19</italic> verwiesen. Je nach Fall erfolgt die Verweisung unidirektional (nur eines der Lemmata fungiert als Verweisziel &#8211; hier <italic>impfen</italic>) oder bidirektional (beide Lemmata sind Verweisziele &#8211; hier <italic>agente patogeno</italic> und <italic>COVID-19</italic>).</p>
<p>Ein terminologischer Eintrag besteht aus der Vereinigung der Datens&#228;tze, die sich auf ein bestimmtes Lemma beziehen und auf die verschiedenen Tabellen verteilt sind. Zur Veranschaulichung sind in allen Tabellen die Datens&#228;tze, die sich auf den Terminus (Lemma) mit TermID 2 beziehen, grau hinterlegt. Weitere Attribute w&#228;ren notwendig, um die lexikografischen Eintr&#228;ge zu vervollst&#228;ndigen, insbesondere wenn bestimmte Lemmata mehr Details erfordern. N&#252;tzlich w&#228;ren z.B. grammatikalische Angaben und Disambiguatoren zu den &#196;quivalenten, die Kennzeichnung von Wortfamilien (<italic>impfen, Impfung, Impfstoff</italic>, &#8230;), pragmatische Angaben verschiedener Art, Anmerkungen bei unregelm&#228;&#223;igem Gebrauch und Ph&#228;nomenen wie Pluralia tantum (vgl. <italic>Antik&#246;rper</italic>) sowie die Angabe des Bearbeitungsstatus eines Eintrags.</p>
<p>Die Datenbank wird im phpMyAdmin-Datenbankmanagementsystem implementiert, das auf der Open-Source-Plattform Xampp, Version 8.0.10 (<ext-link ext-link-type="uri" xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="https://www.apachefriends.org">https://www.apachefriends.org</ext-link>) verf&#252;gbar ist. Nachdem eine Datenbank erstellt und benannt wurde, k&#246;nnen die Tabellen direkt in phpMyAdmin erstellt und strukturiert und im Anschluss mit Daten gef&#252;llt werden, oder sie k&#246;nnen im CSV-Format erstellt, ausgef&#252;llt und in phpMyAdmin importiert werden.</p>
<fig id="F3">
<label>Abbildung 3</label>
<caption>
<p>Struktur von ImmunoTerm im phpMyAdmin-Datenbankmanagementsystem.</p>
</caption>
<graphic xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="kordaf-2-1-59-g4.png"/>
</fig>
<p><xref ref-type="fig" rid="F3">Abbildung 3</xref> ist ein Screenshot von ImmunoTerm in phpMyAdmin, der die allgemeine Struktur der Datenbank f&#252;r immunologische Sprachen zeigt. Tabellen und Collations sind sichtbar. Collations sind Regeln in der Datenbank f&#252;r die Sortierung und den Vergleich von Daten im SQL-Server. <xref ref-type="fig" rid="F4">Abbildung 4</xref> zeigt die Struktur der Tabelle t_haupttabelle, aus der man die den einzelnen Attributen zugeordneten Datentypen, den Prim&#228;rschl&#252;ssel und weitere Indizes erkennen kann.</p>
<fig id="F4">
<label>Abbildung 4</label>
<caption>
<p>Struktur der Haupttabelle in ImmunoTerm. Es sind u.a. Attribute, Datentypen von Attributen und Schl&#252;ssel sichtbar.</p>
</caption>
<graphic xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="kordaf-2-1-59-g5.png"/>
</fig>
<p>Aus den letzten Abbildungen geht hervor, dass Deutsch als Metasprache verwendet wurde, z.B. bei der Benennung der Tabellen und der Attribute der einzelnen Tabellen. Diese Wahl ist auf &#220;berlegungen zur&#252;ckzuf&#252;hren, die mit dem Kurs zusammenh&#228;ngen. Die Metasprache hat allerdings keinen Einfluss auf den Inhalt und die Struktur der Terminologiedatenbank, die die gleiche Art der Arbeit durch Muttersprachler und Nicht-Muttersprachler voraussetzt.</p>
<p>Es gibt inzwischen verschiedene Methoden zur Erstellung einer lexikografischen Ressource auf der Grundlage der relationalen Terminologiedatenbank. Die aufwendigste und zeitintensivste Methode, gleichzeitig aber auch die geeignetste f&#252;r fachlexikografische Projekte, mit denen auch unter dem Gesichtspunkt des W&#246;rterbuchdesigns eine neue Ressource geschaffen werden soll, ist die Erstellung einer Weboberfl&#228;che, die die Daten der Termbank &#252;ber php/SQL einliest und individualisiert bzw. dynamisch darstellt. Dar&#252;ber hinaus k&#246;nnen phpMyAdmin-Tabellen in verschiedenen Formaten exportiert werden, einschlie&#223;lich XML. Dies bedeutet, dass es m&#246;glich ist, Terminologiedaten in ein W&#246;rterbuchredaktionssystem zu importieren, das XML unterst&#252;tzt.</p>
</sec>
</sec>
<sec>
<title>5. Fazit: Die Arbeit mit fachsprachlichen Korpora und ihr Mehrwert f&#252;r den &#220;bersetzungsunterricht</title>
<p>Bei dem hier beschriebenen Experiment liegt der theoretische Schwerpunkt auf dem Thema der terminologischen Variation. Die Methode ist jedoch hinreichend flexibel, um die Untersuchung anderer Ph&#228;nomene zu erm&#246;glichen, z.B. fachsprachlicher Kollokationen, lexikografischer und terminografischer Definitionen sowie semantischer Relationen. Dar&#252;ber hinaus besteht die M&#246;glichkeit, die Anzahl der in der Datenbank erfassten Sprachen zu erweitern, indem beispielsweise Englisch als einzige Ausgangssprache neben Italienisch und Deutsch als Zielsprache aufgenommen wird. Bei mehrsprachigen Datenbanken kann Englisch ggf. als Metasprache eingesetzt werden, etwa zur Bezeichnung von Klassen- und Attributnamen.</p>
<p>Wie bereits erw&#228;hnt, ist das Experiment f&#252;r Muttersprachler/Muttersprachlerinnen und Nicht- Muttersprachler/Nicht-Muttersprachlerinnen gleicherma&#223;en geeignet. Im Falle einer zweisprachigen relationalen Datenbank wird diese in der Regel in beide Sprachrichtungen entwickelt. Somit ist die Datenbank bidirektional. Gleichzeitig ist sie bifunktional, d.h. sie unterst&#252;tzt sowohl das passive als auch das aktive &#220;bersetzen. Dies bedeutet, dass an beiden Korpora die gleiche Art von Analyse durchgef&#252;hrt wird.</p>
<p>Eine L&#246;sung, die sich als besonders interessant erwiesen hat, ist die Kombination der &#220;bung zur Erstellung von Terminologiedatenbanken mit einem Fach&#252;bersetzungskurs unter Verwendung der entsprechenden Ausgangs- und Zieltexte. Auf diese Weise kann die N&#252;tzlichkeit solcher auf die Bed&#252;rfnisse von &#220;bersetzern zugeschnittenen Datenbanken beim &#220;bersetzungsprozess direkt demonstriert werden.</p>
<p>Die Erstellung einer relationalen Datenbank in einer Umgebung wie Xampp ist der erste Schritt zur Schaffung einer lexikalischen Online-Ressource. Obwohl dies nicht im Rahmen eines einzigen Kurses erreicht werden kann, erhalten die Studierenden Informationen &#252;ber den gesamten lexikografischen bzw. terminografischen Prozess. In diesem Zusammenhang soll noch einmal auf die N&#252;tzlichkeit von <italic>Sketch Engine</italic> im Unterricht hingewiesen werden: Die benutzerfreundliche Online-Plattform mit ihren unterschiedlichen Korpusabfragetools erm&#246;glicht die Anwendung einfacher Pipelines bei der Durchf&#252;hrung von korpusbasierten Experimenten. Dar&#252;ber hinaus bieten Redaktionssysteme f&#252;r Lexikografie und Terminografie, etwa Lexonomy und Terminologue, zus&#228;tzliche M&#246;glichkeiten der Erstellung von fertigen Ressourcen basierend auf einer terminologischen Datenbank.</p>
<p>Die Arbeit mit fachsprachlichen Korpora ist nicht nur ein unverzichtbares Werkzeug bei der Erstellung von Ressourcen zur Unterst&#252;tzung der &#220;bersetzung. Sie kann in den &#220;bersetzungsunterricht integriert werden, um die Prozesse zu veranschaulichen, die mit der Erstellung solcher Ressourcen verbunden sind. Bei der Umsetzung dieser Prozesse erm&#246;glicht die Korpusarbeit angehenden &#220;bersetzerInnen, theoretisch relevante Aspekte der Fachkommunikation wie das Ph&#228;nomen der terminologischen Variation, anhand von Textdaten in ihrer Mutter- oder Fremdsprache zu erforschen.</p>
</sec>
</body>
<back>
<ref-list>
<title>6. Literatur und Ressourcen</title>
<ref id="B1"><mixed-citation publication-type="book"><string-name><surname>Arntz</surname>, <given-names>Reiner</given-names></string-name> / <string-name><surname>Picht</surname>, <given-names>Herbert</given-names></string-name> / <string-name><surname>Schmitz</surname>, <given-names>Klaus-Dirk</given-names></string-name> (<year>2014</year>): <source>Einf&#252;hrung in die Terminologiearbeit</source>. <publisher-loc>Hildesheim</publisher-loc>: <publisher-name>Georg Olms Verlag</publisher-name>.</mixed-citation></ref>
<ref id="B2"><mixed-citation publication-type="book"><string-name><surname>Bergenholtz</surname>, <given-names>Henning</given-names></string-name> / <string-name><surname>Tarp</surname>, <given-names>Sven</given-names></string-name> / <string-name><surname>Wiegand</surname>, <given-names>Herbert Ernst</given-names></string-name> (<year>2008</year>): <chapter-title>Daten Distributionsstrukturen, Makro- und Mikrostrukturen in neueren Fachw&#246;rterb&#252;chern</chapter-title>. In: <string-name><surname>Hoffmann</surname>, <given-names>Lothar</given-names></string-name> et al. (Hrsg.): <source>Ein internationales Handbuch zur Fachsprachenforschung und Terminologiewissenschaft</source>, <volume>2</volume>. Halbband. <publisher-loc>Berlin, New York</publisher-loc>: <publisher-name>De Gruyter Mouton</publisher-name>, <fpage>1762</fpage>&#8211;<lpage>1832</lpage>.</mixed-citation></ref>
<ref id="B3"><mixed-citation publication-type="book"><string-name><surname>Busch</surname>, <given-names>Albert</given-names></string-name> / <string-name><surname>Spranz-Fogasy</surname>, <given-names>Thomas</given-names></string-name> (Hrsg.) (<year>2015</year>): <source>Handbuch Sprache in der Medizin</source>. <publisher-loc>Berlin</publisher-loc>: <publisher-name>De Gruyter Mouton</publisher-name>.</mixed-citation></ref>
<ref id="B4"><mixed-citation publication-type="book"><string-name><surname>Cortelazzo</surname>, <given-names>Michele A.</given-names></string-name> (<year>2009</year>): <source>Lingue speciali. La dimensione verticale</source>. <publisher-loc>Padova</publisher-loc>: <publisher-name>Unipress</publisher-name>.</mixed-citation></ref>
<ref id="B5"><mixed-citation publication-type="journal"><string-name><surname>Faber</surname>, <given-names>Pamela</given-names></string-name> (<year>2015</year>): <article-title>Frames as a framework for terminology</article-title>. In: <source>Handbook of terminology</source> <volume>1</volume>: <issue>14</issue>, <fpage>14</fpage>&#8211;<lpage>33</lpage>.</mixed-citation></ref>
<ref id="B6"><mixed-citation publication-type="journal"><string-name><surname>Giacomini</surname>, <given-names>Laura</given-names></string-name> (<year>2018</year>): <article-title>Frame-based Lexicography: Presenting Multiword Terms in a Technical E-dictionary</article-title>. In: <source>Proceedings of the XVIII EURALEX International Congress. Lexicography in Global Contexts</source>, <fpage>309</fpage>&#8211;<lpage>318</lpage>.</mixed-citation></ref>
<ref id="B7"><mixed-citation publication-type="book"><string-name><surname>Giacomini</surname>, <given-names>Laura</given-names></string-name> (<year>2019</year>). <source>Ontology &#8211; Frame &#8211; Terminology. A method for extracting and modelling variants of technical terms</source>. <publisher-loc>Habilitationsschrift</publisher-loc>, <publisher-name>Universit&#228;t Hildesheim</publisher-name>.</mixed-citation></ref>
<ref id="B8"><mixed-citation publication-type="book"><string-name><surname>Giacomini</surname>, <given-names>Laura</given-names></string-name> (<year>2021</year>, i.E.): <chapter-title>Terminologiearbeit und Wissensmanagement</chapter-title>. In: <string-name><surname>Atayan</surname>, <given-names>Varham</given-names></string-name> / <string-name><surname>Metten</surname>, <given-names>Thomas</given-names></string-name> / <string-name><surname>Schmidt</surname>, <given-names>Vasco Alexander</given-names></string-name> (Hrsg.): <source>Handbuch Sprache in Mathematik, Naturwissenschaften und Technik. Handb&#252;cher Sprachwissen (HSW)</source>, Band 15. <publisher-name>De Gruyter</publisher-name>.</mixed-citation></ref>
<ref id="B9"><mixed-citation publication-type="journal"><string-name><surname>Kilgarriff</surname>, <given-names>Adam</given-names></string-name> et al. (<year>2014</year>): <article-title>The Sketch Engine: Ten years on</article-title>. In: <source>Lexicography</source> <volume>1</volume>, <fpage>7</fpage>&#8211;<lpage>36</lpage>.</mixed-citation></ref>
<ref id="B10"><mixed-citation publication-type="book"><string-name><surname>Pera</surname>, <given-names>Franz</given-names></string-name> / <string-name><surname>Schmiedebach</surname>, <given-names>Hans-Peter</given-names></string-name> (<year>2007</year>): <source>Medizinischer Wortschatz: Terminologie kompakt</source>. <publisher-loc>Berlin</publisher-loc>: <publisher-name>de Gruyter</publisher-name>.</mixed-citation></ref>
<ref id="B11"><mixed-citation publication-type="book"><string-name><surname>Serianni</surname>, <given-names>Luca</given-names></string-name> (<year>2005</year>): <source>Un treno di sintomi. I medici e le parole: percorsi linguistici nel passato e nel presente</source>, <publisher-name>Garzanti</publisher-name>.</mixed-citation></ref>
</ref-list>
<sec>
<title>Biographische Notiz</title>
<p>Laura Giacomini lehrt und forscht am Institut f&#252;r &#220;bersetzen und Dolmetschen (I&#220;D) der Universit&#228;t Heidelberg und am Institut f&#252;r Informationswissenschaft und Sprachtechnologie (IWiST) der Universit&#228;t Hildesheim. Sie hat einen PhD in Angewandter Linguistik und eine Habilitation in Fachkommunikation und NLP. Ihre Forschungsinteressen umfassen die Bereiche (computergest&#252;tzte) Terminologie und Lexikographie, Wissensrepr&#228;sentation, Phraseologie sowie korpuslinguistische Ans&#228;tze zur Translationswissenschaft.</p>
</sec>
</back>
</article>
