Paese:
Cerca:
 
      
Home
Carriera & Formazione
Gestione & Processi
L´utente finale
Comunicati stampa
COM&TEC News
Convegni ed eventi
WebForum
 
      Temi specialistici
Information management
Sviluppo & Gestione di Contenuti
Redazione & Terminologia
Norme & Linee Guida
Usabilità
Documentazione Online
Traduzione
Software & Tools
 
      Attualità
 Accedi al portale del convegno
      Adesione a COM&TEC
      
 

tcworld | 4 / 2008 | Seite 22

Aufräumen mit den Mythen über maschinelle Übersetzungen

von Uwe Muegge

Es ist nicht verwunderlich, dass jede Menge Mythen, Halbwahrheiten und Missverständnisse in Bezug auf die maschinelle Übersetzung („machine translation“) kursieren: Für die Meisten im Übersetzungsbereich Tätigen scheinen die einzigen Erfahrungen mit maschinellen Übersetzungen im Bereich des spielerischen Ausprobierens kostenloser Online-Übersetzungswerkzeuge zu liegen. In der Hoffnung, das Bild zurechtrücken zu können, hier eine nähere Betrachtung einiger der meistverbreiteten Mythen über maschinelle Übersetzung.

Denn fast jede Woche sehe ich einen Artikel, in dem der Leser entweder darüber informiert wird, dass maschinelle Übersetzungen absolute Zeitverschwendung sind und immer sein werden. Oder dass maschinelle Übersetzungen zwar heute noch Zeitverschwendung sind, aber in der fernen Zukunft tatsächlich nützlich sein könnten.

Mythos: maschinelle Übersetzungen funktionieren einfach nicht
Da kostenlose Online-Übersetzungsdienste en masse im Internet vertreten sind, kann jeder einen Text durch eine Übersetzungsmaschine laufen lassen und dann die Ergebnisse mit der Öffentlichkeit teilen, um zu beweisen, dass maschinelle Übersetzungen (MT für „maschine translation“) wenig mehr als rudimentäre Rohübersetzungen (Gisting) sind. Damit tragen sie auch immer wieder zur Erheiterung bei.

Das Hauptproblem bei diesen ‘Tests’ besteht darin, dass diese kostenlosen Online-Übersetzungen uns nur einen Bruchteil dessen zeigen, was ein richtiges, professionell entwickeltes, maschinelles Übersetzungssystem leisten kann. Der typische Online-Übersetzungsdienst erlaubt es uns zum Beispiel nicht, ein Themenfeld zu wählen oder Terminologie zur Verfügung zu stellen, ganz zu schweigen von stilistischen Präferenzen. Tatsächlich unterstützen viele - wenn nicht die meisten - der kostenlosen Übersetzungstools keine anderen Übersetzungsparameter als die Auswahl des Sprachenpaars und des Ausgangstextes. Es ist also kein Wunder, dass die Übersetzungen, die auf diesen Websites maschinell erstellt werden, oft so lächerlich weit vom Ziel entfernt sind.

Fakt: maschinelle Übersetzungen verbessern die Produktivität und Konsistenz der menschlichen Übersetzer
Wann immer ein neuer Ausgangstext für ein Projekt erstellt wird - irgendwann wird er übersetzt werden müssen. Selbst wenn man im sogenannten hochmodernen Globalisierungsumfeld arbeitet, d.h. mit einem integrierten Content-Management/Übersetzungs-System, wird man irgendwann auf eine gewisse Prozentzahl von Sätzen stoßen, für die kein Match oder nur ein Match mit niedriger Übereinstimmungsquote gefunden werden.

In einem gut geplanten und gut organisierten Globalisierungsprojekt, in dem Redakteure und Software-Entwickler ein umfassendes Projektglossar und einen Redaktionsleitfaden für das Erstellen leicht lesbarer und verständlicher Texte nutzen, können diese Sätze mit geringen oder keinen Matches maschinell vorübersetzt werden bevor sie von menschlichen Übersetzern bearbeitet werden.
Vorteile der maschinell erstellten Vorübersetzung:

- Die Übersetzer haben immer einen Vorschlag, mit dem sie arbeiten können und müssen nicht jede Übersetzung neu anfertigen. Eine kürzlich bei Symantec durchgeführte, repräsentative Fallstudie zeigt, dass sich die Produktivität menschlicher Übersetzer verdoppeln lässt, wenn unbekannte Sätze maschinell vorübersetzt werden [1] .
- Viele Übersetzungen müssen bearbeitet und viele sogar neu geschrieben werden. Dagegen kann man bei maschinell erstellten Übersetzungen davon ausgehen, dass ein hoher Prozentsatz perfekt sein wird (das gilt besonders für Kurzanleitungen, Überschriften, Bildunterschriften usw.).
- Zumindest werden Schlüsselbegriffe korrekt und durchgängig gleich übersetzt. Und nicht nur das, in den meisten Fällen werden diese Begriffe auch korrekt gebeugt sein und in der richtigen Singular- oder Pluralform erscheinen (versuchen Sie das einmal mit Ihrem Translation Memory!).

      

Beispiel einer maschinell erstellten Deutsch>Englisch Übersetzung auf der Website des Verfassers dieses Textes www.muegge.cc

Fakt: maschinelle Übersetzungen ermöglichen die Übersetzung von Material, das sonst nicht übersetzt werden würde
Nur ganz wenige Unternehmen, wenn überhaupt, übersetzen derzeit alle Materialien, für die eine Übersetzung gut wäre, in alle Sprachen, die von ihren derzeitigen oder zukünftigen Kunden gesprochen werden. Der Hauptgrund besteht darin, dass für viele Dokumenttypen, besonders im After-Sales-Bereich, das Budget für umfassende durch Übersetzer angefertigte Übersetzungen nicht vorhanden ist.

Einige Unternehmen nutzen maschinelle Übersetzungssysteme, um große Textvolumina für ihre globalen Kunden in deren Sprache zugänglich zu machen, ohne dass menschliche Übersetzer in den Prozess eingebunden werden. Die Microsoft Knowledge Base enthält mehr als 200000 Dokumente auf Englisch und ist ein bekanntes Beispiel für ein Textrepositorium, in dem die Anzahl maschinell übersetzter Dokumente viel größer ist als die der von Übersetzern übersetzten Dokumente.

     

Deutsche Suchseite für die Microsoft Knowledge Base mit der Möglichkeit für maschinelle Übersetzung

Mythos: maschinelle Übersetzungssysteme können nur Wort für Wort übersetzen
Der Glaube, dass sich maschinelle Übersetzungen nur auf das reine Ersetzen von Wörtern in der Ausgangssprache durch Wörter in der Zielsprache beschränken, ist genauso weit verbreitet wie falsch. Alle modernen maschinellen Übersetzungssysteme, inklusive kostenloser Online-Übersetzungsdienste wie systransoft.com, translate.google.com und windowslivetranslator.com nutzen hochkomplizierte Algorithmen, die das Ergebnis jahrelanger Forschung und Entwicklung sind.

Fakt: es gibt nicht nur eine, sondern viele verschiedene Technologien, die für maschinelle Übersetzungen genutzt werden und die alle in der Lage sind, im richtigen Umfeld exzellente Ergebnisse zu liefern
Maschinelle Übersetzungen gibt es seit mehr als 50 Jahren. Im Laufe dieses halben Jahrhunderts wurden viele Technologien für maschinelles Übersetzen entwickelt, z.B. wörterbuchbasiert, regelbasiert, beispielbasiert, statistisch - plus unzählige Mischformen Im Folgenden eine kurze Erklärung zu den drei Technologien für maschinelle Übersetzungen, die für kommerzielle Anwendungen heute die höchste Relevanz haben.

Regelbasierte maschinelle Übersetzung
Die regelbasierte maschinelle Übersetzung, auch als maschinelle Transfer-Übersetzung bekannt, stellt heutzutage das vorherrschende Paradigma für maschinelle Übersetzungen dar. Systran, Babelfish, promt, nur um einige zu nennen, sind alles regelbasierte Systeme. Regelbasierte maschinelle Übersetzungssysteme nutzen einen dreistufigen Übersetzungsprozess:


1. Analyse: Analysiert den Ausgangssatz, um einen Baum der syntaktischen Struktur des Satzes zu erstellen.
2. Transfer: Konvertiert den Syntax-Baum für die Ausgangssprache in den entsprechenden Baum für die Zielsprache.
3. Generierung: Ordnet dem Zielbaum die entsprechenden Wörter zu, um einen Satz in der Zielsprache zu erstellen.

Die Vorteile der regelbasierten maschinellen Übersetzung sind unter anderem:

- Ausgereifte, bewährte Technologie, die schnell und relativ günstig umgesetzt werden kann.
- Es sind viele kommerzielle Systeme für viele verschiedene Sprachenkombinationen erhältlich.
- Sehr gut anpassbar aufgrund der Wörterbuch- und Stileinstellungen (einige Systeme unterstützen auch die Anpassung des Regelwerks).

Regelbasierte maschinelle Übersetzungssysteme werden im kommerziellen Bereich schon seit vielen Jahren eingesetzt, z.B. bei Autodesk, Daimler und dem Übersetzungsservice der Europäischen Kommission. Die zwei Hauptherausforderungen für regelbasierte maschinelle Übersetzungssysteme sind erstens, dass die Regeln jedes Systems notwendigerweise begrenzt sind. Das heißt, dass die Redakteure, um bestmögliche Ergebnisse zu erzielen, ihren Schreibstil anpassen müssen. Zweitens: Obwohl kommerzielle regelbasierte maschinelle Übersetzungssysteme für Dutzende von Sprachkombinationen erhältlich sind, sind viele Sprachen noch nicht abgedeckt.

Statistische maschinelle Übersetzung
Die statistische maschinelle Übersetzung (SMT) steht derzeit im Rampenlicht, ganz besonders, nachdem Microsoft verkündet hat, dass das Unternehmen ein selbstentwickeltes SMT-System für die Übersetzung seiner riesigen Anzahl an Knowledge-Base-Dokumenten zu nutzen [2] und Google mit seiner statistischen Übersetzungsmaschine einen groß angelegten Wettbewerb für maschinelle Übersetzungen gewonnen hat [3]. 

Statistische maschinelle Übersetzungssysteme bestehen typischerweise aus zwei Hauptkomponenten:

- Übersetzungsmodell: Generiert Übersetzungsvorschläge basierend auf entsprechenden Wortsequenzen in den ausgerichteten Ausgangs- und Zieltrainingsdaten.
- Sprachenmodell: Wählt den besten Vorschlag basierend auf Trainingsdaten nur in der Zielsprache aus.

Die gute Nachricht bezüglich der statistischen maschinellen Übersetzung ist, dass sobald ein SMT-System auf kundenspezifische Daten „trainiert“ wurde, diese maschinelle Übersetzungtechnologie die höchste Übersetzungsqualität generiert. Allerdings benötigt man für diesen „Trainingseffekt“ eine große Anzahl bestehender Übersetzungen: Language Weaver, der führende Anbieter statistischer maschineller Übersetzungssysteme, empfiehlt, einen bilingualen Korpus von 2 Millionen Wörtern oder mehr pro Sprachenpaar zu nutzen. Aufgrund dieser Anforderungen für die Anpassung und der Tatsache, dass statistische maschinelle Übersetzungssysteme in der Regel teurer sind als einige der regelbasierten Systeme, wird diese maschinelle Übersetzungstechnologie vor allem von Regierungsbehörden – besonders vom Nachrichtendienst – und großen Kapitalgesellschaften genutzt.

Direkte maschinelle Übersetzung
In seiner einfachsten Form ersetzt das direkte maschinelle Übersetzungssystem nur Wörter der Ausgangssprache durch Wörter der Zielsprache – in der gleichen Reihenfolge und ohne linguistische Analysen oder Verarbeitung. Die einzige Quelle, die für die direkte maschinelle Übersetzung verwendet wird, ist ein Wörterbuch. Daher wird diese maschinelle Übersetzungtechnologie auch als wörterbuchbasierte maschinelle Übersetzung bezeichnet.

Aufgrund der eher einfachen Technik wurde die direkte maschinelle Übersetzung viele Jahre lang als veraltet betrachtet und heute gibt es kaum kommerzielle Produkte, die diese Technologie verwenden

Obwohl die Fähigkeiten dieses Systems begrenzt sind, glaube ich, dass die direkte maschinelle Übersetzung immer noch ihren Platz im heutigen Angebot automatisierter Übersetzungstools hat. Für einige gängige praxisnahe Anwendungen reicht das Wort-für-Wort- oder Phrase-für-Phrase-Ersetzen für eine gute Übersetzung aus. Denken Sie einmal an Domains, wo Vokabular und Syntax standardisiert sind, das ist zum Beispiel so bei Wetterberichten, Finanzprofilen und vielen E-Commerce-Anwendungen.

Medtronic, ein großer Hersteller medizinischer Geräte, hat kürzlich die direkte maschinelle Übersetzung für die Übersetzung einer großen Produktdatenbank in verschiedene Sprachen verwendet [4].  Eine Übersetzung durch menschliche Hand war aufgrund der Kosten und tatsächlich Qualität (eine Analyse vorhergegangener menschlicher Übersetzungsprojekte hat eine inakzeptable hohe Fehlerrate bei numerischen Werten wie Zahlen und Abmessungen aufgezeigt) keine Option.Außerdem hatten erste Tests gezeigt, dass sowohl die Translation-Memory-basierte als auch die regelbasierte Übersetzungstechnologie nur schlechte Ergebnisse brachten für einen Text, der die folgenden Eigenschaften hatte:

- wenige oder keine Wiederholungen auf der Satzebene;
- viele Wiederholungen auf der Wort-/Phrasenebene;
- telegrafischer/elliptischer Stil, z.B. ‘Wind aus südlicher Richtung, Geschwindigkeiten erreichen 55 km/h’, ‘American Technology Associates (AMTA) starke Käufer, Avion (AVIO) übertriff den Markt’, oder ‘Platte 2456dr15 rechtwinklig, geschlitzt, 15 ea’.

Diese Art des Übersetzungsprojekts gehört mit größter Wahrscheinlichkeit zu denen, auf die ein menschlicher Übersetzer mit Selbstachtung wunderbar verzichten kann. Und da direkte maschinelle Übersetzungen im besten Falle nicht von menschlicher Hand bearbeitet werden müssen, kann es in diesem Umfeld sogar einmal vorkommen, dass die maschinelle Übersetzung von menschlichen Übersetzern (die es hassen, solche Übersetzungen anzufertigen) und den Auftraggebern (die diese Vorstellung von fast sofort erhältlichen und fast kostenlosen Übersetzungen lieben) willkommen geheißen werden.

Mythos: maschinelle Übersetzungen sind nur etwas für große Unternehmen
Ja, es stimmt: Schaut man sich Erfolgsgeschichten über maschinelle Übersetzungen an, kommen sie normalerweise von den Caterpillars, Microsofts und Symantecs dieser Welt. Aber das gilt für viele - wenn nicht für die meisten - neu entstehenden Technologien. Es stimmt aber auch, dass einige der besten heute verwendeten maschinellen Übersetzungssysteme das Ergebnis von Forschungs- und Entwicklungsprogrammen sind, die Millionen von Dollar gekostet haben und die sich nur Unternehmensriesen leisten können. Das bedeutet aber nicht, dass man für eine maschinelle Übersetzungslösung enorme Summen ausgeben muss.

Fakt: da sie erschwinglich und nutzerfreundlich sind, sind viele maschinelle Übersetzungssysteme auch für die kleinsten Unternehmen und sogar Freiberufler geeignet
Wenn man ein wenig recherchiert, finden man heraus, dass viele kommerzielle Übersetzungssysteme ungefähr das gleiche kosten wie ihre Gegenstücke im Translation-Memory-Bereich. Dies gilt sowohl für Workstations für einzelne Anwender und Client-Server-Lösungen für viele Anwender. Und es ist kein Geheimnis, dass, obwohl sich die Versionen für große und kleine Unternehmen unterscheiden, die Übersetzungsmaschine an sich in beiden Produkten die gleiche ist. Anders gesagt: in Bezug auf die Übersetzungsqualität aus der Konserve gibt es bei allen maschinellen Übersetzungsprodukten im Allgemeinen nur kleine, wenn nicht gar keine Unterschiede zwischen der 1000 Dollar teuren Version und der 50000 Dollar teuren Version für Großunternehmen.
Außerdem haben die Entwickler von kommerziellen Übersetzungssystemen viel investiert, um die Produkte so intuitiv wie möglich zu machen. Ich würde sogar so weit gehen zu behaupten, dass es leichter – und sicherlich schneller ist – seine erste Übersetzung mit einem typischen MT-Produkt anzufertigen als mit einem typischen Translation-Memory-Tool.


Weitere Fakten, die beachtet werden sollten:
- Viele kostengünstige maschinelle Übersetzungsprodukte beinhalten ein eingebautes Translation-Memory-Modul, um die Effizienz beim Nachbearbeiten zu steigern (‘nie den gleichen Fehler zweimal korrigieren’), und einige MT-Systeme wie promt Expert bieten die nahtlose Integration des Translation-Memory-Systems von SDL an.
- Einige Anbieter von Übersetzungstools, wie Across, die kleine und mittelständische Unternehmen beliefern, bieten TM-MT-Systembündelungen und/oder MT-Integration über API an.
- Die Schulung der Anwender und die Anpassung des MT-Systems (z.B. durch das Anlegen von Wörterbüchern), welche die Hauptfaktoren für die Erreichung der bestmöglichen Ergebnisse darstellen, können oft leichter in kleinen Unternehmen als in großen umgesetzt werden.

Das Fazit
Seitdem sie erstmalig vorgestellt wurde, handelte es sich bei der maschinellen Übersetzung um ein stark kontroverses Thema, und das wird sich wahrscheinlich nicht so schnell ändern. Ein Großteil dieser Diskussion liegt sicher in falschen Annahmen begründet, was maschinelle Übersetzungen leisten können und wer vom Einsatz dieser Technologie profitieren könnte. Lassen sie mich eines laut und deutlich sagen: im Allgemeinen können die heute erhältlichen maschinellen Übersetzungssysteme den menschlichen Übersetzer nicht ersetzen, besonders wenn diese MT-System von Anwendern ohne linguistischen Hintergrund genutzt werden. Wenn das Ziel aber ist, die Effizienz des Übersetzungsprozesses durch menschliche Übersetzer zu steigern. Oder verständliche Übersetzungen in einem Umfeld zu erstellen, in dem die Übersetzung durch menschliche Hand keine Option darstellt, und wenn diese Systeme von geschulten und motivierten Übersetzungsfachkräften bedient werden, dann war und ist die maschinelle Übersetzung eine wirkungsvolle Lösung.

 

Quellen 

[1] Systran Software Inc. 2007. Systran Case Study: Symantec. Systran Software Inc. Web site. [Online] 2007. [Cited: June 6, 2008.] www.systransoft.com/download/case-studies/2007.12.Symantec.pdf.

[2]  Microsoft Corporation. 2008. Machine Translation - Home. Microsoft Corporation Web site. [Online] 2008. [Cited: June 6, 2008.] http://research.microsoft.com/nlp/projects/mtproj.aspx.

[3] Institute of Standards and Technology. 2006. NIST 2006 Machine Translation Evaluation Official Results. National Instititue of Standards and Technology Web site. [Online] November 1, 2006. [Cited: June 6, 2008.] http://www.nist.gov/speech/tests/mt/2006/doc/mt06eval_official_results.html.

[4] Fully Automatic High Quality Machine Translation of Restricted Text: A Case Study. Muegge, Uwe. 2006. London: The Association of Information Management (Aslib), 2006. Proceedings of the Twenty-eighth International Conference on Translating and the Computer. ISBN 978-0-85142-5. 

Website des Autors: www.muegge.cc

 
 

 


This article was published in tcworld, magazine for international
information management. To receive a free subscription click here!

 
 


Uwe Muegge kümmert sich bei Medtronic, einem Hersteller im Bereich der Medizintechnologie, um die Terminologie. Er arbeitet für das ISO Technical Committee 37 SC3 Computer Applications in Terminology und lehrt Terminologiemanagement und computergestütztes Übersetzen am Monterey Institute of International Studies in Monterey, Kalifornien.
Contact: info@muegge.cc

| Nr : 2484 | en | Mehr Artikel aus der Rubrik 'Informations-management' hier. |

 
 
   Aiuto   Contatto   Feedback   Crediti   
 
© tekom