|
|
Maschinelle ÜbersetzungEin Bericht über Sprachübersetzer im PC EinleitungProfessionelle maschinelle Übersetzung von Texten übersetzt nicht nur Wort für Wort, sondern übersetzt Satzweise und analysiert auch Grammatik und Satzaufbau, unter Umständen sogar Bedeutungs-Spezifika. Unter guter maschineller Übersetzung versteht man also die sinngemäße Übersetzung ganzer Sätze. Eine wörtliche Übersetzung oder eine Verarbeitung nach einem Phrasenwörterbuch genügt also nicht. GeschichteIn den Sechzigerjahren wurde auf Großrechnern mit maschineller Übersetzung begonnen. In den Achtzigern kam der Personal Computer in Mode - und wurde erschwinglich - und so wurden Übersetzungsprogramme für den PC entwickelt. Mit der Verbreitung des Internet kamen Online-Übersetzungsdienste (Webübersetzung) hinzu. Firmen boten diesen Service an, um konkrete Anforderungen kennen zu lernen und Erfahrungen zu sammeln. Die übersetzten Texte wurden analysiert und die Übersetzungssoftware auf Basis der gewonnenen Erfahrungen verbessert. Erwähnenswert ist das Projekt für maschinelle Übersetzung der Brigham Young University in Provo, Utah / USA. Die mormonische Kirche interessierte sich für Übersetzungsmaschinen für ihre Schriften und gründete an diesem Institut ein übersetzungswissenschaftliches Institut. Bald wurde jedoch die Erkenntnis gewonnen, dass eine vollautomatische Textübersetzung für religiöse Texte nicht geeignet war. Man konzentrierte sich dann auf die Entwicklung von dialogorientierten Übersetzungshilfen. Die Ergebnisse wurden ab 1980 als Automatic Language Processing Systems (ALPS) kommerziell verwertet. ALPS bediente immerhin 4 Ebenen; ein mehrsprachiges Textverarbeitungssystem, eine manuelle Wörtersuche, eine automatische Wörtersuche und ein maschinelles Übersetzungssystem. Smart AI brachte 1978 den "Smart Intelligent Translator" auf den Markt, der zum Unterschied zu ALPS Sätze mit einem Plain English Program (PEP) vereinfachte und mit einer Wissensbasis übersetzte. PEP war ein Regelwerk bestehend aus 1500 grammatikalischen Regeln. Außerdem arbeitete PEP mit einem dem Benutzer angepassten Vokabular. Die Ergebnisse waren dadurch besser, humanoide Nachbearbeitung jedoch immer noch notwendig. Durch seine Simplifizierung eignete sich PEP eher für kurze Texte und Mitteilungen ohne besondere stilistische Ausprägungen, ging aber bereits über die reine Vokabelübersetzung bzw. Wortübersetzung hinaus. ErwartungenMaschinelle Übersetzung eignet sich für den Einsatz in der wirtschaftlichen Praxis. Man spricht dabei von MÜ (maschinelle Übersetzung) oder MT (machine translation). Bei Dokumentationen, Gebrauchsanweisungen, Berichten, Internetseiten und persönlichen Schreiben (E-Mails) liefert eine Übersetzungssoftware brauchbare Ergebnisse. Bei Fachübersetzungen wie Verträgen oder Gesetzestexten ist Vorsicht geboten. Bei künstlerischen Arbeiten kann bestenfalls sinngemäß übersetzt werden, nicht jedoch künstlerischem Anspruch Genüge getan werden. Dort wo eine inhaltliche Erfassung ausreicht, kann maschinelle Übersetzung brauchbare Ergebnisse liefern. Anforderungen und LeistungsmerkmaleIn praktisch allen Übersetzungsprogrammen für Einzelplatz-Rechner, also im wesentlichen PCs, ist der Bildschirm geteilt. In einem Fenster wird der Originaltext angezeigt und kann dort bearbeitet werden. Im anderen Fenster erscheint nach der Verarbeitung der übersetzte Text. Dieser kann markiert und in die Zwischenablage kopiert werden. Bei manchen Sprachprogrammen wird in einem weiteren Fenster der Status der Übersetzung, Fehlermeldungen, Fortschritt und Informationen, angezeigt. Weitere Möglichkeiten ist das Verwalten von eigenen Übersetzungen, Phrasen wie Wörter, und das Ausschließen von Wörtern oder Wortkombinationen. So kann das Übersetzungsprogramm um eigene wie etwa fachspezifische Begriffe erweitert werden. Es kann auch gesteuert werden, dass z.B. ein Firmenname ohne Übersetzung und ohne Fehlermeldung übernommen wird und dass "Herr Schwarz" im auf englisch nicht "Mr.Black" heißt, sondern "Mr.Schwarz". Wortlisten, also ein individuelles Wörterbuch, sollten erstellt werden können. So können firmenintern bestimmte Begriffe wie Eigennamen (z.B.Rohstoff AG) und Fachbegriffe (z.B. FIBU) eingepflegt werden, so dass diese dann von der Software richtig übersetzt werden. Voraussetzung ist, dass die Übersetzungssoftware imstande ist "zu lernen". Wenn dieses dann noch zentral am Server geführt wird, steht es allen Firmenmitarbeitern zur Verfügung. Die Pflege der Wortlisten ist allerdings aufwendig, da semantische und grammatikalische Begriffe erfasst werden müssen. Durch den Import von Wortlisten und Fehlerprotokollen kann der Aufwand jedoch gesenkt werden. Eine Überwachung und Nachbearbeitung von Fehlerlisten ist sehr mühsam, rechnet sich jedoch für eine große Anwenderzahl. Im Zeitalter von Firmennetzen haben Intranet-Übersetzungslösungen einen wichtigen Stellenwert. Die Installation ist einfach, die Software-Verteilung und Update-Service ebenfalls, da die Übersetzungssoftware zentral gespeichert ist und mittels Internet-Browser aufgerufen werden kann. Internet-Browser sind hat praktisch jeder auf seinem PC. Die Bedienung ist intuitiv gestaltet, der Anwender kommt meist ohne Schulungsaufwand zurecht. Virtueller ÜbersetzerInteressant ist auch die Übersetzungsmöglichkeit via E-Mail. Ein Textdokument wird als Anhang an eine E-Mail-Adresse geschickt und diese retourniert ein übersetztes Dokument nach einigen Minuten. Natürlich ist auch eine Übersetzung von E-Mail-Inhalten möglich. Als wäre ein virtuelle Übersetzer der E-Mail-Adressat, der auf Aufträge wartet. Solche Intranet-Lösungen eignen sich für Behörden und Firmen, die einen großen Bedarf an inhaltlich korrekter Übersetzung haben für z.B. Zeitungsartikel, Ausschreibungen, Internetseiten sein. Die Schwächen betreffend Grammatik und sprachliche Nuance können zugunsten des Zeitfaktors in Kauf genommen werden. Maschinelle Übersetzung hat Schwächen und so entstehen mitunter durch verbogenen Satzaufbau und sonderbare Wortwahl spaßige Maschinentexte. Heikle Texte wie etwa juristische Texte sollten auf jeden Fall von einem menschlichen Übersetzer (nach)bearbeitet werden. Natürlich ist eine solche Direktübersetzung via E-Mail nicht beschränkt auf Intranet, sondern könnte via Internet genutzt werden. Es gibt ja Übersetzungsservices, die gratis im Internet zur Verfügung stehen. Man kann einen gegebenen Text übersetzen lassen oder - noch komfortabler - eine Internetadresse (URL) eingeben. Via Webbrowser erscheint kurze Zeit später das Ergebnis. Zu bedenken wäre bei einer Internetübersetzung die Sicherheitspoblematik. Unverschlüsselt über Internet (dazu zähle ich auch E-Mail) gesendete Texte können leicht ausspioniert werden (Stichwort HAARP - High-Frequency Active Auroral Research Programm), da auf dem Weg zwischen Anwender-PC und Übersetzungsserver passiert die Nachricht unverschlüsselt einige Server und kann dort gescannt, zwischengespeichert, archiviert oder weitergeleitet werden. Da die Flut von Dokumenten, E-Mails, Internetseiten von weltweit operierenden Unternehmen von Humanübersetzern nicht mehr bewältigt werden kann, benötigen solche Unternehmen weltweit einsetzbare Textübersetzungsprogramme. Diese Interoperabilität von Unternehmenseinheiten an verschiedenen Lokationen aber birgt ein Sicherheitsrisiko: Das Ausspähen von Daten durch illegale Eindringlinge im Netzwerk, die menschlich sein können, Hacker, oder ein Stück Software, ein trojanisches Programm. Diese hochsensible Sicherheitsproblematik sollte keinesfalls außer Acht gelassen werden. Eine gute Unterstützung sind die Zwischenablage-Übersetzer wie er auch von
diversen Internet-Services geboten wird. Dabei wird der in die Zwischenablage
kopierte Text übersetzt und der übersetzte Text kann eingefügt werden.
Einige Übersetzungstools im Internet bieten die Möglichkeit eine URL (Internet-Adresse) einzugeben, das Ergebnis ist eine Sofortübersetzung einer Internetseite. Manche Übersetzungsseiten bieten lediglich ein Vokabelbuch für die Wörterübersetzung oder zum Nachschlagen, eine Art Clicktionary - dictionary4free. Praktisches Übersetzungsservice ohne Übersetzungsbüro und ohne Zeilenpreis! Es gibt auch Sprachübersetzungsprogramme, die im Hintergrund laufen und nachdem man ein Wort markiert hat, dieses mittels rechter Maustaste im Diktionär nachschlagen und gleich Übersetzungsvorschläge bieten. Eine Volltextübersetzung ist das aber nicht. Funktionsweise eines TextübersetzungsprogrammsIm Prinzip hat die Software ein Wörterbuch (general dictionary) verfügbar. Leider reicht diese Wortschatz-Basis meist nicht aus. Das Basis-Wörterbuch kann durch ein Fachwörterbuch (Rechtswörterbuch, Physikwörterbuch, Wirtschaftsenglisch,...) und/oder ein persönliches Wörterbuch (personal dictionary) ergänzt werden. Auf dieser Grundlage können einfache Fachtexte durchaus zufrieden stellend übersetzt werden. Eine Übersetzungssoftware muß grammatikalische Strukturen auf Basis von sprachtheoretischen Grundlagen erfassen. In einem Wörterbuch sind linguistische Informationen zu jedem Wort bzw. Begriff enthalten. Die Software muß die einzelnen Wörter im Konnex zum gesamten Text und den Text strukturell erfassen. Das heißt, jedes Wort als Substantiv, Verb bzw. Adjektiv identifizieren und den Bezug zu anderen Wörtern finden. Letzteres ermöglicht eine sinngemäße Übersetzung, dass also mehrdeutige Begriffe der einen Sprache richtig übersetzt werden. Hier zeigt sich, wie "intelligent" ein Sprachübersetzungsprogramm ist. Eine stilistische Zuordnung kann für die Satzübersetzung ebenfalls hilfreich sein. Ein episches Werk ist wahrscheinlich anders aufgebaut als eine Gebrauchsanweisung. Sprachliche Breite mit Nebensätzen und Bezügen gegen kurze, einfache und sachliche Beschreibungen. Texte strukturell zu erfassen mag ja noch funktionieren, aber eine inhaltliche Erfassung ist sehr schwierig. Das wäre mit künstlicher Intelligenz möglich. Jetzt einmal ganz zu schweigen von stilistischen Prägungen wie sie Literaten eigen sind. Wortwitz und linguistische Spiele kann wohl nur ein Sprachgelehrter so rüberbringen, dass dies auch in einer anderen Sprache verstanden werden kann. Inwieweit dann ein neues Werk auf Basis eines anderen entsteht ist eine knifflige Frage für Juristen. Prinzipiell funktioniert eine maschinelle Übersetzung in mehreren Schritten. Im ersten Schritt wir der Text vereinfacht, Verschachtelte Satzstrukturen werden aufgelöst und mehrdeutige Begriffe durch eindeutige ersetzt. Nach dieser Vorbereitung erfolgt die maschinelle Übersetzung. Nun kann das Benutzerwörterbuch erweitert werden um so die Trefferquote für spätere Übersetzungen zu verbessern. Im letzten Schritt greift der Mensch ein und der vorübersetzte Text wird nachbearbeitet. Hier wird persönlicher Ausdruck und sprachliche Nuance eingebracht. Erst jetzt ist die Übersetzung fertig. KuriosesEine berühmte Übersetzung gelang Champollion: Bei Schanzarbeiten am Fort Julien bei Rosetta (Raschid) östlich von Alexandria entdeckten 1799 die Franzosen den nach dem Fundort benannten Rosetta-Stein. Dieser Stein aus schwarzem Basalt enthielt ein Dekret der ägyptischen Priestersynode in Memphis vom 27. März 196 v.Chr. während der Regierungszeit des Königs Ptolemaios V Epiphanes. Der Text wurde festgehalten in 2 Sprachen und 3 Schriften: Hieroglyphen (oben), Demotisch (in der Mitte) und Griechisch (unten). Jean-François Champollion gelang bis 1822 (Vortrag vor der Académie française) den Grundstein zu legen für die Entzifferung der hieroglyphischen Schrift der Ägypter und veröffentlichte seine Erkenntnisse im "Précis du système hiéroglyphique" (Abriss des hieroglyphischen Schriftsystems). In einem amerikanischen Buch über Astronomie ist zu lesen, dass die erste Fixsternparallaxe durch den Astronomen F. W. Bessel und seinen Assistenten H. G. Rath gemessen wurde. Bessel hatte keinen Assistenten. Der Fehler geschah bei einer Übersetzung, wo aus dem vollen Namen des Autors "Herr Geheimer Rath Friedrich Wilhelm Bessel" in der englischen Übersetzung zwei Namen wurden. Der griechische Philosoph Aristoteles hatte die Theorie, dass im Eiweiß das Herz des werdenden Vogels als ein Blutfleck zu sehen sei und dass dieses Zeichen hüpfe und springe. In der Übersetzung hieß es dann "quod punctum salit", der "springende Punkt". Der Begriff hat sich bis heute für "das Wesentliche" erhalten. Genau genommen ist ein Compiler ein Übersetzungsprogramm, der eine Sprache wie FORTRAN oder COBOL in eine für Computer interpretierbare Maschinensprache übersetzt. Eine Translation von Maschine für Maschine... Ein deutscher Konzern hatte eine Gebrauchsanleitung für den japanischen Markt übersetzt und da wurde aus dem "Kugel-Lager" ein "Rund-Sofa". Und als eine Wirtschaftsdelegation in China über die Errichtung einer Fabrik verhandelte waren die chinesischen Verhandlungspartner sehr beleidigt über die Formulierung, es handle sich um ein zweitklassiges Projekt. Tatsächlich sollte eine wirtschaftliche Klassifizierung vorgenommen werden, es handelte sich um ein Projekt der Klasse 2. Ein übler Übersetzungsfehler. Im ersten Buch der Bibel (Genesis) heißt es "Wohlauf, laßt uns herniederfahren und dort ihre Sprache verwirren, dass keiner des andern Sprache verstehe!" (1. Mose 11,7) - die Geschichte von der "babylonischen Sprachverwirrung" beim Turmbau zu Babel (Babylon) ist bekannt, der Ausdruck zum Begriff geworden. AltaVista übrigens bietet einen Link zu einem Onlineübersetzungsprogramm mit dem Namen "Babelfish". Zufall? Der name ist zwar eine Anleihe aus dem Buch "Per Anhalter durch die Galaxis" ("The hitchhiker´s guide through the galaxy") von Douglas Adams, wo kleine Babelfische in das Ohr springen und fortan das Gehörte perfekt übersetzen und auf diese Weise die Kommunikation der unterschiedlichsten Wesen im Weltraum.ermöglichen. Der ist eine Anspielung auf Babylon. Das meistübersetzte Buch aller Zeiten ist übrigens - wenig überraschend - die Bibel mit 2355 Sprachen (Stand April 2004). Sollte sich Esperanto als Weltsprache durchsetzen, erübrigt zukünftig sich ein Sprachübersetzungsprogramm (und diese Einführung in die Grundlagen ebenso). Links |