Ging es im ersten Teil der Serie noch um die harten Anfänge und gescheiterten Träume der maschinellen Übersetzung, haben wir diesen historischen Abschnitt nun hinter uns gelassen. Willkommen in der Gegenwart der Machine Translation!

white space shuttle indoors
Photo by SpaceX / Unsplash

Die neuronale maschinelle Übersetzung

Aktuell konzentriert sich ein großer Teil der Forschung auf neuronale maschinelle Übersetzungen (NMÜ). Mit diesem Verfahren ist es künstlichen Intelligenzen möglich, auch längere Sätze korrekt zu übersetzen und mehr über grammatikalische Abhängigkeiten von Wörtern zu erlernen. Die netzartigen Strukturen, auf denen die die neuronale maschinelle Übersetzung basiert, sind der Struktur und Funktionsweise des menschlichen Gehirns nachempfunden. Genau das macht Deep Learning überhaupt erst möglich. Anders als bei vielen der ursprünglichen Verfahren (direkte maschinelle Übersetzung, Interlingua-Methode, beispielbasierte Übersetzung, ...) sind die eingesetzten künstlichen Intelligenzen nun dazu imstande, flexibel auf die zu übersetzenden Texte zu reagieren. Dabei lernen sie immer wieder Neues über grammatikalische Strukturen, anstatt nur auf Basis bereits vorhandenen Wissens zu arbeiten.

Veranschaulichen lässt sich dies gut am Beispiel von Brettspielen, die wohl etwas greifbarer und populärer sind als Übersetzungen: Einen großen Erfolg feierte unter anderem die künstliche Intelligenz AlphaGo, als sie im Jahr 2016 mehrfach das südkoreanische Go-Genie Lee Sedol übertrumpfte. Im Schach geschah dieser "Mensch vs. Maschine"-Durchbruch bereits im Jahr 1997, als der Schachcomputer Deep Blue den damaligen Schachweltmeister Garri Kasparow schlug - nur ein Jahr nachdem Kasparow selbst noch den Sieg gegen den Computer davongetragen hatte.
Während Deep Blue ein vergleichsweise simpler (wenn auch beim besten Willen kein platzsparender) Schachcomputer war, der mit Algorithmen arbeitete, basiert die Software AlphaGo vor allem auf ihren neuronalen Netzen und der Fähigkeit zum maschinellen Lernen. Aufgrund der größeren Komplexität von Go galt dieser Erfolg als bedeutender. Ein auf einfachen Algorithmen basierendes Programm hätte bei diesem Spiel keine Chance gegen menschliche Intelligenz gehabt.

gray spacecraft taking off during daytime
Photo by SpaceX / Unsplash

Das Gegenstück zur NMÜ ist die sogenannte SMÜ - die statistische maschinelle Übersetzung, die beliebt ist, da sie keinerlei Kenntnisse der Ausgangs- oder Zielsprache voraussetzt. Im Rahmen der SMÜ analysiert die AI möglichst viele Texte, die bereits auf zwei Sprachen vorliegen, und ordnet selbstständig Wörter und grammatikalische Strukturen ihren passenden Gegenstücken zu. Auch im Rahmen der SMÜ sind Programme dazu imstande, selbst immer mehr über Grammatik und Vokabular zu lernen. Das endgültige Niveau ist aber abhängig von der Übersetzungsqualität der Texte, von denen die AI lernt. Sobald der zu übersetzende Text (egal ob durch neuronale, statistische oder jede andere maschinelle Übersetzung) in der Zielsprache angelangt ist, empfiehlt sich immer noch eine Überarbeitung durch menschliche Übersetzer. Diese Korrektur wird sich - allein weil Sprache und Ausdruck immer auch Geschmackssache sind - auch in ferner Zukunft noch anbieten.

Etwas neuer als NMÜ und SMÜ sind Recurrent Neural Networks (RNN), mit denen in den letzten Jahren unter anderem Google viel gearbeitet hat. Diese funktionieren im Grunde wie andere neuronale Netze auch, sind aber - wie der Name sagt - rückgekoppelt: Die Neuronen jeder Ebene sind auch mit Neuronen ihrer eigenen oder der vorhergegangenen Schicht verbunden, anstatt nur mit Neuronen der nächsten Schicht. Dieser Aufbau ähnelt dem Gehirn von Säugetieren.

Die aktuellste Entwicklung in der Welt der Machine Translation ist die sogenannte Attention-Based Machine Translation. Im Rahmen dieser wird zwar weiterhin mit neuronalen Netzwerken gearbeitet, der Fokus fällt nun aber auf einzelne Teile der zu übersetzenden Sätze. Grob basiert diese Idee auf der visuellen Aufmerksamkeit die Menschen ihrer Umgebung schenken. Unser Fokus liegt nie auf allem in unserem Sichtfeld, sondern auf einem bestimmten Punkt. Dieser Idee folgend sollen neuronale Netze nun selbst entscheiden, welchem Teil des Satzes sie sich zuerst widmen. Bei Sprachen die sich in ihrer Struktur ähneln, bleibt der Ablauf so meist sequentiell. Bei unterschiedlich strukturierten Sprachen kann es aber auch sein, dass das Netzwerk sich zuerst auf die Mitte oder das Ende eines Satzes konzentriert.

view of Earth and satellite
Photo by NASA / Unsplash

Machine Translation Today

Die Existenz der maschinellen Übersetzung wird oft entweder übersehen (da man eigentlich längst an sie gewöhnt ist und sie benutzt ohne darüber nachzudenken), oder etwas zu kritisch betrachtet (da sie vermeintlich alle Übersetzer um ihre Jobs bringen wird). Der weltweite Übersetzungsmarkt verzeichnet jedes Jahr etwa 40 Milliarden Dollar Umsatz und soll bis 2021 auf über 56 Milliarden Dollar wachsen. Regierungen, Unternehmen und auch Privatpersonen in unterschiedlichen Ländern wachsen durch die fortschreitende Globalisierung immer enger zusammen, und der stetig steigende Bedarf an Übersetzungen ist durch Menschen allein nicht mehr zu erfüllen.
Nehmen wir ein alltägliches Beispiel: Maschinelle Übersetzungsfunktionen verschiedener sozialer Netzwerke oder in E-Mail-Eingängen sind längst weit verbreitet und funktionieren immer besser. Auch Online-Videos können schon automatische Untertitel in ihrer Ausgangssprache erhalten, und es wird daran gearbeitet, diese direkt in anderen Sprachen anzeigen zu können, ohne hierfür Armeen an Übersetzern beschäftigen zu müssen - nicht, weil man keine Übersetzer beschäftigen möchte, sondern weil es so viele Übersetzer gar nicht gibt. Man denke nur an die 400 Stunden Videomaterial, die jede Minute auf YouTube hochgeladen werden.
Aber nicht nur in sozialen Netzwerken, sondern auch in "handfesten" Bereichen wie der technischen Dokumentation wächst der Bedarf nach Übersetzungen immer weiter. In je mehr Länder etwas exportiert wird, in umso mehr Sprachen werden auch sämtliche Dokumente benötigt. Viele dieser Dokumente verlangen dabei nicht nach wortgewandten und kulturell angepassten Texten, die man zum Beispiel fürs Marketing benötigt (und die definitiv von Menschen formuliert werden müssen), sondern nach Listen von Bestandteilen, Bestell- und Lieferdaten. Repetitive, aber immens zeitaufwändige Arbeiten wie diese können durch den Einsatz maschineller Übersetzung menschlichen Übersetzern wenigstens teilweise abgenommen werden, sodass diese sich um Texte kümmern können, die wirklich ihre Zeit und Aufmerksamkeit benötigen.

Die Zukunft der Machine Translation

Die maschinelle Übersetzung ist offensichtlich weit gekommen. Während es in den 1950ern noch einen Computer gab, der essentiell nur so tun sollte als könnte er russische Texte übersetzen, haben wir mittlerweile neuronale Netze, welche von ganz allein wissen welchem Satzteil sie zuerst ihre Aufmerksamkeit schenken sollten. Nächste Woche - im dritten und letzten Teil unserer Serie zu Meilensteinen der Machine Translation - werfen wir einen kurzen Blick in die Zukunft. Wohin wird uns die Forschung noch führen?