Inhaltsverzeichnis

Roboter und Mensch bei der Arbeit.

Mensch vs. Maschine: Ersetzen AI-Translator menschliche Übersetzer?

6 min.

Führt der Aufstieg von KI-Übersetzungsmaschinen zu einem Showdown für den menschlichen Übersetzer? Finde es in diesem fesselnden Artikel heraus, der die uralte Debatte zwischen Mensch und Maschine im Bereich der Übersetzung beleuchtet.

Die Künstliche-Intelligenz-Technologie erweist sich in zahlreichen Aspekten des alltäglichen Lebens als gewinnbringend. Sie kann unterstützen bei Aufgaben wie der Montage von Maschinen, der Verkehrssteuerung, medizinischen Diagnosen und anderen. Kritikern zufolge kann sie aber auch eine Gefahr darstellen, insofern sie Menschen in oft althergebrachten Berufen ersetzen und so viele Menschen ohne eine feste Arbeitsstelle lassen kann. Ein Beispiel eines solchen Berufs ist der des Übersetzers bzw. Dolmetschers, und zwar wegen der kontinuierlichen Fortschritte, die darin gemacht wurden, Künstliche Intelligenz dazu zu bringen, Sätze und Texte mit der gleichen Genauigkeit wie der von Menschen aus einer Sprache in eine andere zu übersetzen. Doch besteht wirklich die Gefahr, dass Übersetzer obsolet werden oder kann Technologie nicht eher als Untersützung dienen?

 

Was bedeutet KI-Übersetzung & wie funktioniert sie?

KI-Übersetzung ist eine Form der maschinellen Übersetzung, die Sätze oder Texte von einer Sprache in eine andere mit einer Methode namens neuronaler maschineller Übersetzung übersetzt. Dies wird erreicht durch Konvertierung einer satzbildenden Wortsequenz in einer anderen Sprache mittels tiefer neuronaler Netzwerke. Bei tiefen neuronalen Netzwerken handelt es sich um architektonische Computermodelle, die aus einer großen Menge an nicht standardisierten Schichten bestehen – mit unterschiedlichen Varianten wie dem rekursiven Netzwerk, dem Netzwerk der Zeiger, dem Faltungsnetzwerk und anderen. Diese Architekturen können bestimmte Klassen von Aufgaben lösen und dabei von einer kleinen Datenmenge lernen. Die Modelle sind das Ergebnis der Ausgereiftheit und Entwicklung der ersten neuronalen Netzwerke, welche auf Warren McCulloch und Walter Pitts zurückgehen, die in einer gemeinsamen Studie Anfang der 1940er-Jahre ein formales Modell des menschlichen Gehirns vorschlugen. Frank Rosenblatt, ein amerikanischer Psychologe, fasste ihre Arbeit zusammen und schuf ein Modell eines neuronalen Netzwerks an einem Computer. Das primordiale neuronale Netzwerk verwendet einen Algorithmus der umgekehrten Fehlerfortpflanzung, der aus zwei Schritten besteht – eine Prognose der Zielfunktion, die dann mit dem wirklichen Wert verglichen wird, wobei der Fehler als Differenz zwischen dem prognostizierten und wirklichen Wert berechnet wird. Der zweite Schritt besteht darin, die Berechnungen und Werte des Netzwerks anzupassen, um den Fehler zu reduzieren, wobei ein zusätzlicher Algorithmus, der dem Netzwerk beibringt, die erforderlichen Werte korrekt zu prognostizieren, weitere Unterstützung bietet. Zu diesem Zweck müssen große Datenmengen eingegeben werden.

Solche tiefen neuronalen Netzwerke finden außerdem in der automatischen Textverarbeitung Verwendung. Die automatische Textverarbeitung entstand als Kombination aus Computer- bzw. mathematischer Linguistik und maschinellem Lernen, wobei eines der primären Probleme darin besteht, wie Texte an den Computerspeicher bei Erhalt der Struktur und Semantik transferiert werden. Hinsichtlich dieses Problems wurden zwei wesentlich verschiedene Methoden als Lösungen eingesetzt: ein linear-algebraisches Vektormodell und ein stochastisches Sprachmodell. Das Vektormodell arbeitet nach dem Prinzip, Texte in einen Vektor von Wortfrequenzen umzuwandeln, die dann durch Verfahren des traditionellen Maschinenlernens, wie das Verfahren der Referenzvektoren oder der hierarchischen Clusteranalyse, genutzt werden Diese Methode ermöglicht es allerdings nicht, die Reihenfolge der Wörter zu speichern – im Unterschied zum Sprachmodell, das bei der Lösung der Fragen beiträgt: “Was ist die Wahrscheinlichkeit einer bestimmten Wortsequenz und welche Werte werden am wahrscheinlichsten auf die betreffende Wortsequenz folgen?”.

Vor der Entwicklung der neuronalen Netzwerke ließ dieses Modell seine Parameter über die Verwendung von Markovs Kettenapparat festlegen. Allerdings waren diese Modelle unvollkommen, da sie sich an eine relative kleine und feste Anzahl an vorherigen Wörtern erinnern. Neben dem Problem der Textrepräsentation besteht zudem das Problem der Wortbedeutung und dessen Repräsentation. Innerhalb der kognitiven und traditionellen Linguistik wird angenommen, dass eine Person die Bedeutung des Wortes über dessen Kontext bzw. die Anzahl der bestehenden Worte und deren Bedeutungen versteht. Auf der Grundlage dieser Annahme sind Linguisten zu dem Schluss gekommen, dass die Bedeutung der Wörter durch Vektoren repräsentiert werden kann. So können Kontextvektoren dazu beitragen zu bestimmen, welche Wörter am besten zu den Daten passen. Solche Lösungen in Kombination mit tiefem maschinellem Lernen helfen bei der Übersetzung von Texten. In Bezug auf Übersetzungen gibt es einen primären Unterschied zwischen dem traditionellen Ansatz und dem Deep-Learning-Ansatz. Hierbei handelt es sich um das Prinzip, wie der Funktionsraum zur Beschreibung von wesentlichen Elementen wie Wörten definiert wird. Das traditionelle maschinelle Lernen stützt sich auf komplexe sprachliche Funktionen wie spezialisierte Datenbanken oder affektive Wörterbücher. Das Zusammenstellen solcher großer Datenbanken verlangen beträchtliche Hingabe, die bis zu ein Jahr in Anspruch nehmen kann. Das tiefe maschinelle Lernen hingegen verlangt die Nutzung spezialisierter externer Ressourcen, trotzdem begegnet es einem anderen Problem in Verbindung mit dem Bedarf an umfangreichen Datenmengen zum Lernen. Gemeint ist das Problem, die besagten Daten auszuzeichnen. Zu diesem Zweck wählen die Kommentatoren Wörter in jedem neuen Dokument aus, die das neuronale Netzwerk dann lernt zu extrahieren.

Gegenwärtig finden neuronale Netzwerke in zahlreichen Projekten in diesem Bereich Verwendung. Zu den primär verwendeten Architekturen zählen die Convolutional Neural Networks und die rekurrenten neuronalen Netze, insbesondere die Doppelschichtausführung, die langfristige Speicherzellen verwendet. Eine solche Struktur erlaubt das Lesen von Eingabesätzen und die Erhaltung der Bedeutung jedes einzelnen Wortes sowie des Satzes selbst in getrennten Vektoren. Daraus ergibt sich das Netzwerk, das entscheidet, ob zum Beispiel ein bestimmtes Wort der Name einer Stadt oder einer Person ist. Sie kann zudem dazu beitragen, dass das neuronale Netz lernt, eine Übersetzung in einer anderen Sprache vorzunehmen. Recht häufig kommt bei dieser Art der Architektur der Aufmerksamkeitsmechanismus zum Einsatz: eine einfache übergeordnete Struktur wird den Rekurrenzschichten des Netzes hinzugefügt, damit das System lernt, sich auf wichtige Elemente im Satz zu fokussieren. Zum Beispiel wird das System mit einem solchen Mechanismus sich zunächst auf das Subjekt und Prädikat fokussieren und dann auf das Objekt, das Komplement, den Modifikator etc. Sehr häufig umfassen neuronale Netze eine spezielle Art von Operator, die bekannt ist als Brikett. Hierbei handelt es sich um einen Operatortyp, der mit mehreren skalaren Vektoren übereinstimmt. Dann werden mehrere Falten mit dem sich in einer Reihe von Skalaren ergebenden Output verwendet. Derartige neuronale Netze, insbesondere innerhalb der Faltenvarianten, suchen nach stabilen N-Grammen (Sequenzen von N-Wörtern, die für die vorliegende Aufgabe von Bedeutung sind). Diese N-Gramme reichen von Begriffen über Namen bis hin zu festen Kollokationen. Während N-Gramme breite Verwendung schon vor der Entwickung von neuronalen Netzen fanden, so ist es ihre Nutzung in Kombination mit der Faltung – ein Verfahren bzw. Begriff, der sich aus der Computer Vision ableitet –,  die eine Steigerung der Übersetzungsqualität erreicht. Sehr häufig leisten diese Netze mehr als eine Klassifikationsaufgabe: so muss das System eine thematische Klassifikation vornehmen, gefolgt oder begleitet von einer sinngemäßen Definition und einer Extrahierung von Relationen zwischen Wörtern. Beispielsweise erhält ein neuronales Netz dieser Art mehrere Sätze: “Ich habe eine schwarz-weiße Katze” und “Meine Katze ist schwarzweiß”. Das System muss entscheiden, ob beide Sätze die gleiche Bedeutung haben. Zu diesem Zweck wird es den Sinn der Sätze sowie die Bedeutungen der einzelnen Wörter analysieren, beginnend mit wesentlichen Elementen wie “Ich”, “habe”, “Meine”, “Katze” etc. Danach führt es mehrere Algorithmen aus, um auf der Grundlage gewisser Parameter festzustellen, ob die Bedeutungen der Sätze übereinstimmen. Das gleiche neuronale Netz kann außerdem feststellen, ob zwei bzw. mehr Objekte eine bestimmte Relation aufweisen (Beispiele: Befindet sich “Pferd” in Relation zu dem Wort “Tier” in “Ein Pferd ist ein Tier, das man auf Farmen antrifft”, und um welche Art der Relation handelt es sich?).

Recht oft werden diese Netze mit Bündelnetzen kombiniert, wobei die Verteilung folgendermaßen ist: Die Hauptaufgabe wird gelöst oder bewältigt durch die Rekurrenzschicht; die Mittlerrolle zwischen der Hauptaufgabenschicht und den Eingabewörtern wird durch die Faltungsschicht ausgeführt, und die Bündelschicht analysiert die Eingabewörter Zeichen für Zeichen unter Berücksichtigung der Wortänderung und Wortbildung, was die Bestimmung von Redeteilen ohne die Verwendung von externen morphologischen Prozessoren wie großen kompilierten Datenbanken ermöglicht. Zu beachten ist, dass ein Großteil der qualitativen Verbesserung in Bezug auf maschinelle Übersetzung aufgrund der zahlreichen Forschungsprojekte zur Anpassung solcher Architekturen an die Bewältigung von Textdaten erfolgt, da bis vor einigen Jahren solche Netze selten für Texte Verwendung fanden, weil Vektoren keine geringfügigen Änderungen erlauben, die wiederum das Erlangen einer anderen diskreten Funktion wie einem weiteren Buchstaben oder einem weiteren Wort ermöglichen würden. Ein Beispiel für ein derartiges Projekt ist die Einbindung eines Variationsautokoders, der dann bei den morphologischen Analyseaufgaben mitwirkt und das Finden von Regularitäten bei der Wortbildung ermöglicht. Darüber hinaus gibt es Projekte, die dazu beigetragen haben, konkurrierende Netze upzugraden oder in ihrer Fähigkeit zu steigern, Texte eines bestimmten Genres oder Stils zu generieren und so bei der Schaffung personalisierter Assistenten mitgewirkt haben, die in der Lage sind, unter Verwendung von Lieblingswörtern oder Witzen zu kommunizieren.

Neben dem bereits erwähnten Nachteil hinsichtlich der Vektorinflexibilität besteht zudem das Problem der Geräusche. Daten aus sozialen Netzwerken können Problemen mit zufälligen oder absichtlichen Druckfehlern von Nutzern begegnen, und diese Fehldrucke sind nicht immer korrigierbar. Zusätzlich zu solchen Fehlern beinhalten Daten, die aus sozialen Netzwerken erlangt werden, eine Mischung verschiedener Sprachen, ungewöhnlicher Zeichensetzung und Pseudo-Grafiken. Sprachverarbeitungsaufgaben hingegen haben das Problem, unterschiedliche Stimmen wie die des Hauptsprechers, Hintergrundmusik oder Dialoge von nicht wesentlichen Geräuschen zu trennen. Bei solchen beeinträchtigten Daten kann es für die neurnalen Netze eine ziemliche Herausforderung darstellen, Regularitäten festzustellen. Ein derartiges Problem lässt sich ausgleichen, indem das System mit größeren Mengen markierter Daten trainiert wird.

 

Ist KI-Übersetzung eine Bedrohung oder eine Hilfe für menschliche Übersetzer?

KI-Maschinen mit Deep-Learning- und neuronalen Netzen werden fast seit ihrer Konzipierung als eine Bedrohung für viele menschliche Berufe betrachtet. Dies gilt bis zu einem gewissen Grad auch für menschliche Übersetzer, wobei die Hauptsorge darin besteht, dass Künstliche Intelligenz Übersetzer von Texten und gesprochener Sprache ersetzen kann. Allerdings ist es denkbar, dass KI-Übersetzungsmaschinen keine Gefahr darstellen, sondern eher eine Hilfe sind.

 

Warum KI-Übersetzung als Bedrohung angesehen werden könnte

Manche befürchten, dass die KI-Übersetzung aus mehreren Gründen imstande ist, menschliche Übersetzer zu ersetzen. So ermöglichen solche Systeme die Übersetzung von Texten oder gesprochener Sprache mit weniger Zeitaufwand als bei menschlichen Übersetzern, weil KI-Übersetzungsgeräte weniger Minuten benötigen, um geeignete Worte für die Übersetzung ausfindig zu machen und auszuwählen sowie zu logisch sinnvollen Sätzen zu verknüpfen. Als Folge davon, dass die Geräte weniger Zeit für die Übersetzung von Texten benötigen, können Kunden das Dokument früher erhalten als beim Einsatz von menschlichen Übersetzern. Überdies können solche Maschinen eine relativ hohe Konstanz bieten, insbesondere wenn sie Dokumente aus dem gleichen Bereich übersetzen bzw. jedes Mal, wenn sie eingesetzt werden, in dem gleichen Stil übersetzen. Aufgrund einer solchen Konstanz wird es für Unternehmen weniger schwierig sein, ihren Kunden Texte mit exzellenter Qualität zu liefern bzw. Fehler zu vermeiden, die die Qualität mindern.

Neben den bereits genannten Gründen gilt die KI-Übersetzung als Bedrohung für menschliche Übersetzer auch wegen ihrer Fähigkeit, Unternehmen schnelleren Umsatz sowie beträchtliche Einsparungen zu ermöglichen. Solche Einsparungen lassen sich dadurch erreichen, dass man die Maschinen den Text übersetzen lässt und ihn dann individuell anpasst, ohne stundenlang daran arbeiten zu müssen, wodurch die anfallenden Kosten reduziert werden, insbesondere was die Bezahlung kostspieliger Honorare angeht. Zudem: Da diese Systeme und Geräte in der Lage sind, anhand verschiedener Parameter aus ihren früheren Fehlern zu lernen, werden sie relativ schnell ihre Datenbank anpassen und erweitern. Dies ermöglicht den KI-Übersetzungsmaschinen, rasch die Informationsmenge zu gewinnen, die ein erfahrener Übersetzer aufgrund von Ausbildung sowie jahrelanger Ausübung des Berufs besitzt.

 

Wie KI-Übersetzung eine Unterstützung sein kann

KI-Übersetzungsgeräte lassen sich als hilfreiche Systeme einsetzen, die zur Steigerung der Produktivität beitragen können. Wie bereits erwähnt, können neuronale Netzwerkübersetzungsmaschinen eine Übersetzung eines Textes oder von gesprochener Sprache schneller erzeugen als ihre menschlichen Pendants. Dies kann menschliche Übersetzer dahingehend unterstützen, dass sie mehr Projekte in verhältnismäßig weniger Zeit fertigstellen. Des Weiteren können solche Systeme darauf trainiert werden, Übersetzern eine Datenbank zur Verfügung zu stellen, die dann bei der Übersetzung von Texten genutzt wird, insbesondere solche, die Ausdrücke beinhalten, welche schwer in eine andere Sprache zu übertragen sind, indem die besagten Systeme in computergestützte Übersetzungstools integriert werden. Ebenso kann eine derartige Technologie eine Hilfestelllung bei der Übersetzung von ressourcenschwachen Sprachen wie Rumänisch oder Irisch sein. Erreicht werden kann dies dadurch, dass man die Systeme darauf trainiert, Texte unter Verwendung von Datenbanken zu übersetzen, die Wörter und Wendungen aus den betreffenden Sprachen enthalten. Alternativ lassen sich KI-Übersetzungsgeräte zur Übersetzung von ressourcenstarken Sprachen verwenden, während menschliche Übersetzer sich auf ressourcenschwache Sprachen konzentrieren. Außerdem können diese Maschinen nützlich sein in Situationen, in denen der Tonfall neutral oder höflich ist, insofern es nicht nötig ist, Intonation zu übersetzen. Da sich diese Systeme zudem in tragbare Geräte wie Tablet, Kopfhörer oder Handy integrieren lassen, können sie jederzeit genutzt werden.

 

Wann man KI-Übersetzungsgeräte nutzen sollte

KI-Übersetzungsgeräte bieten derzeit eine relativ hohe Qualität bei der Übersetzung von klar gesprochener Sprache bzw. Texten, die keine idiomatischen Wendungen oder Redensweisen beinhalten. Dank ihres gegenwärtigen Entwicklungs- und Komplexitätsniveaus lassen sie sich in mehreren Situationen einsetzen. Zu den Situationen, in denen die Verwendung dieser Geräte empfehlenswert ist, gehören:

  • Geschäftliche Besprechungen wie die Aushandlung eines Vertrags mit einem tragbaren Tablet bzw. zwei Tablets, die als Enkoder und Dekoder fungieren und in gleichem Abstand von den Verhandlungspartnern positioniert werden
  • Während der Vorlesungen, um den Vortrag des Dozenten zu übersetzen, insbesondere wenn Ausdrücke und Wörter vorkommen, die dem Studierenden fremd oder neu sind
  • Auf Reisen, zum Beispiel beim Kauf von Reisetickets, im Hotel oder im Restaurant
  • Im Gespräch mit ausländischen Ärzten im Krankenhaus oder mit Angestellten in Geschäften oder Einrichtungen.

KI-Übersetzungsgeräte können Menschen eine kommunikative Hilfe sein, aber sie nicht ersetzen

KI-Übersetzungsgeräte haben sich in den letzten Jahren deutlich verbessert, wenn es darum geht, Text- und Sprachübersetzungen von guter Qualität zu bieten. Dies liegt an der Nutzung von neuronalen Netzwerken, welche neben anderen nicht-linearen Funktionen und Tools, welche Sätze und Texte analysieren und aus aktuell und vorher eingegebenen Daten lernen, eine große Anzahl an nicht-standardmäßigen Schichten verwenden. Da diese Systeme von früheren Informationen und Fehlern lernen können sowie die Qualität des Ausgabetextes verbessern und dabei Geschwindigkeit und Konstanz bewahren, betrachten manche sie als Bedrohung für menschliche Übersetzer.

Auch wenn neuronale Netzwerkübersetzungssysteme diese Vorteile haben, so können sie jedoch derzeit nicht menschliche Übersetzer ersetzen und werden es voraussichtlich auch für mindestens weitere zehn Jahre nicht tun. Denn diese Geräte haben mehrere Nachteile, die verhindern, dass sie erfahrene menschliche Übersetzer vollständig ersetzen können. Während neuronale Netzwerkübersetzungsgeräte Texte mit vergleichsweise hoher Qualität übersetzen können, erreichen sie nicht immer solche Spitzenleistungen, wenn es um die Flüssigkeit und den natürlichen Klang des Textes bzw. der Sprechaktes geht. Wenn sie zum Beispiel einen künstlerischen Text oder die Rede eines Redners übersetzen sollen, dann wird die generierte Übersetzung wahrscheinlich weniger natürlich und flüssig klingen als bei einem erfahrenen menschlichen Übersetzer. Dies liegt daran, dass KI-Übersetzungsysteme Schwierigkeiten haben bzw. außerstande sind, kulturelle Unterschiede und Nuancen sowie Redensarten und idiomatische Wendungen zu begreifen, welche recht häufig einen großen Anteil bzw. den Kern des Textes/der Rede ausmachen. Ebenso berücksichtigen neuronale Netze nicht den Tonfall, der sich selbst in schriftlichen Texten erkennen lässt. Wegen dieser Nachteile kann die KI-Übersetzung menschliche Übersetzer nicht ersetzen, insbesondere bei der Übersetzung von Rednern wie Politikern oder bei der Übersetzung von fiktionaler Literatur.

Aber auch wenn sie weit davon entfernt sind, den Komplexitätsgrad zu erreichen, der es ihnen erlaubte, menschliche Übersetzer zu ersetzen, können diese Maschinen zur Produktivitätssteigerung beitragen. Darüber hinaus können sie eine Hilfestellung in der Alltagskommunikation bieten, so zum Beispiel in Restaurants, Hotels, Geschäftsmeetings etc.

16.11.2020

Entdecke weitere spannende Beiträge

Hochvalyrisch & Dothraki für Anfänger

7 inspirierende Neujahrsvorsätze für ein erfülltes Jahr

Die 10 schönsten Urlaubsorte Italiens

Telefonhörer und Brief.
Damit wir auf unserer Webseite verschiedene Funktionen anbieten, die Aktivitäten auf unserer Webseite besser auswerten und Ihnen immer passende Angebote präsentieren können, setzen wir Cookies ein. Entscheiden Sie in der Folge selbst, welche Cookies Sie zulassen möchten. Sobald Sie den jeweiligen Regler auf blau schieben und unten „Einstellungen speichern“ klicken, ist der dazugehörige Cookie aktiviert und Sie haben zugestimmt, dass dieser Cookie gesetzt werden darf. Sie können dies auf dieser Seite jederzeit wieder rückgängig machen.