Meilensteine der Machine Translation: Teil 1 - Am Anfang war das Wörterbuch

Die Entstehungsgeschichte der maschinellen Übersetzung ähnelt einer Heldenreise - Bewährungsproben und entscheidende Prüfungen inbegriffen.

Meilensteine der Machine Translation: Teil 1 - Am Anfang war das Wörterbuch
By:
Lengoo Marketing Team
Date:
Sep 15, 2020

The path of research

Die Entstehungsgeschichte der maschinellen Übersetzung ähnelt einer Heldenreise - Bewährungsproben und entscheidende Prüfungen inbegriffen. Der Höhepunkt der Geschichte und das Ende der Forschung sind allerdings noch längst nicht erreicht. In diesem Artikel werfen wir einen Blick auf einige der größten Meilensteine der Machine Translation, von 1930 bis heute.

Der Verlauf der Forschung

1930: Im Jahr 1933 begannen der Franzose Georges Artsrouni und der Russe Peter Trojanskij unabhängig voneinander mit der Entwicklung maschinengestützter Übersetzungssysteme. Ihre Ideen basierten auf einem maschinellen Vergleich verschiedener Lexika, bei welchem jeweils nur die Grundformen von Wörtern, nicht aber verschiedene Fälle, Zeiten oder Personen berücksichtigt werden konnten. Ihre Arbeit blieb lange weitestgehend unbekannt. Von Trojanskijs Projekt (welches er durch seinen frühen Tod nie fertigstellen konnte) erfuhr die Welt erst in den 1950ern, als Trojanskijs Patent auf eines der wohl ersten MÜ-Systeme der Welt bekannt wurde.

1950: In den 1950ern begann nun auch an US-amerikanischen Universitäten die Entwicklung erster Übersetzungssysteme. IBM stellte 1954 in New York ein erstes Ergebnis vor - ein Event, über welches amerikanische Medien zu der Zeit viel berichteten. IBMs System war jedoch nicht mehr als eine Art beispielhaft fungierendes Spielzeug. Es beherrschte lediglich 250 Wörter - allein zur Kommunikation im Alltag benötigen Menschen 750 - und übersetzte 49 vorausgewählte russische Sätze ins Englische. IBMs Vorführung bestätigte den Glauben daran, dass hochwertige und umfangreiche maschinelle Übersetzungssysteme bereits in greifbarer Nähe lagen - ein Glaube, der sich als Irrtum erwies.

1960: Nachdem die ersten tatsächlichen Versuche der Übersetzungen vom Russischen ins Englische eher holprig verliefen, berichtete das US Verteidigungsministerium in den 1960ern schließlich, dass maschinelle Übersetzungen nicht realisierbar seien, und dass aufgrund der immensen Kosten nicht weiter an den Projekten gearbeitet werden solle. Der Großteil der Forschung stoppte in den USA für viele Jahre, und auch das Vereinigte Königreich und die damalige Sowjetunion gaben nach dieser schlechten Prognose große Teile ihrer Arbeit an maschinellen Übersetzungen auf. Andere Länder, allen voran Frankreich, Kanada und Deutschland, steckten jedoch weiterhin viel Zeit und Geld in die Entwicklung von Methoden zur maschinellen Übersetzung.

1980: In den 80er Jahren erreichte vor allem Japan viele technologische Fortschritte. Durch die Arbeit an einer Art "Supercomputer" im Rahmen der Fifth Generation Computer Systems Initiative der japanischen Regierung flossen viele Fördermittel in die maschinelle Übersetzung - der erwünschte Erfolg blieb jedoch aus. Ende der 1980er hatte die Forschung weltweit einen stark fragmentierten Punkt erreicht: Unterschiedliche Teams arbeiteten in unterschiedlichen Ländern mit völlig verschiedenen Ansätzen. Der erwünschte Erfolg rückte nur langsam in Sicht.

1990 bis heute: Als Computer in den 1990ern in Form von PCs endlich platzsparender, günstiger und leistungsstärker wurden, erleichterte dies den Entwicklern ihre Arbeit. Es gab in den letzten Jahren bereits Berichte über hochwertige Übersetzungen auf fast menschlichem Niveau. Während Systeme zu Anfang der Forschung nur zwei Sprachen verwendeten und ein kleines Vokabular hatten (meist in den Feldern der Technik und Chemie), können heutige Systeme oft mehrere Sprachkombinationen anbieten und zudem themenübergreifend arbeiten. Durch das wachsende Feld der Computerlinguistik ist es heute zudem möglich, linguistische Kenntnisse in den Programmier-Prozess einfließen zu lassen. Diese Hybrid-Methode verspricht qualitativ weitaus hochwertigere Resultate als ihre oft rein statistischen Vorgänger. Der Gipfel der Forschung ist zwar noch nicht erreicht, befindet sich aber immerhin in Sichtweite.

In Teil 2 der Serie widmen wir uns Schachpartien und neuronalen Netzwerken. Seien Sie beruhigt: Die Gegenwart und Zukunft der MÜ sehen um einiges rosiger aus als ihre Vergangenheit.