Wenn auch Ihr Unternehmen, wie viele andere im digitalen Zeitalter, immer mehr und immer schneller Content erstellen und verwalten muss, Ihr Budget für Lokalisierungen aber nicht mitwächst, dann könnte maschinelle Übersetzung (MT) eine Lösung für Sie sein.
Um Unternehmen den Einstieg in die MT zu erleichtern, haben wir kürzlich ein
Webinar angeboten, in dem Patrick Beßler, Machine Translation Engineer bei RWS Moravia, die Geschichte von MT sowie Anwendungsfälle für Unternehmen vorgestellt und erste Schritte erläutert hat. Hier eine Zusammenfassung seiner Präsentation.
Ein Blick in die Geschichte
Bei maschineller Übersetzung, einem der ältesten Teilbereiche von künstlicher Intelligenz (der bis in die 1950er Jahre zurückreicht), werden Texte mithilfe von Software aus einer Sprache in eine andere übersetzt. Als die Technologie eingeführt wurde, war sich die Wissenschaft sicher, dass die anfänglichen Probleme binnen weniger Jahre beseitigt sein dürften. 70 Jahre später ist MT jedoch ein noch immer andauerndes Experiment, das in den letzten Jahren zwar einige beachtenswerte Fortschritte und Innovationen hervorgebracht hat, dennoch hat diese Technologie noch einen weiten Weg vor sich.
Eine der signifikantesten Änderungen in der MT war der Wechsel von regelbasierten zu statistischen Modellen. Regelbasierte MT, bei der linguistische Regeln für die Übersetzung aus einer Sprache in eine andere aufgestellt werden, kommt heute noch immer in manchen Anwendungen zum Einsatz. Seit den späten 1980er Jahren jedoch werden meist statistische MT-Modelle eingesetzt. Der größte Vorteil war die Senkung der Kosten. Statistische MT nutzt moderne CPU-Ressourcen besser aus und ermöglicht Skaleneffekte, da derselbe Algorithmus – im Gegensatz zu regelbasierten Modellen – für das Trainieren vieler Sprachpaare verwendet werden kann. Allerdings kommen statistische Modelle hinsichtlich der Qualität, konkret des Sprachflusses, irgendwann an ihre Grenzen.
Eine jüngere Unterkategorie der statistischen Modelle ist die neuronale maschinelle Übersetzung (NMT), die auf denselben Grundkonzepten beruht, jedoch die neuronalen Netze des menschlichen Gehirns nachahmt. NMT nutzt das größere Leistungspotenzial moderner Computer noch besser aus und ermöglicht dadurch eine bessere linguistische Qualität. In NMT-Modelle können auch Deep-Learning-Techniken integriert werden, um bessere und schnellere Übersetzungen im Vergleich zu herkömmlichen statistischen Modellen zu erzielen. Derzeit gelten sie als neuester Stand der Technik in Sachen MT für Unternehmen und werden von Tech-Giganten wie Google und Microsoft eingesetzt. Anzumerken ist hier jedoch, dass NMT höhere Kosten mit sich bringt. Dies ist der höheren Computerleistung geschuldet, die dazu erforderlich ist.
Welchen Unternehmensanwendungen nützt MT?
Im Allgemeinen fällt das Argument für MT in Übersetzungsprojekten mit großen Content-Volumina unter dem Gesichtspunkt des Return on Investment (ROI) am stärksten aus. Das gilt vor allem bei Content, der nützlich ist, aber nicht die Priorität hat, um die Kosten einer vollständigen Human-Übersetzung zu rechtfertigen. Dazu zählt beispielsweise die Übersetzung von Kundenfeedback. Der Einsatz von MT hat auch Vorteile, wenn es auf die Geschwindigkeit ankommt, die Kosten niedrig gehalten werden müssen oder der wachsende Übersetzungsbedarf ein festes Budget übersteigt.
Ein weiterer Einsatzbereich für die maschinelle Übersetzung ist die mehrsprachige Übersetzung interner Kommunikation unter Mitarbeitern und/oder Anwendern eine Self-Service-Lösung. Community-Foren oder die Kommunikation in international tätigen Unternehmen sind typische Beispiele. Zu guter Letzt kann MT auch als Komponente in einen größeren Service-Workflow integriert werden, z. B. in einer mehrsprachigen Sentimentanalyse oder bei der Echtzeitübersetzung von gesprochener Sprache (Speech-to-Speech Translation, kurz S2ST oder SST).
Es gibt also viele Einsatzgebiete für MT, sogar für Marketingtexte, die früher als zu komplex galten, als dass sie automatisch übersetzt werden könnten. Schließlich ist Marketingmaterial stark auf die Marke ausgerichtet und soll eine nuancierte Botschaft vermitteln.
Welche Vorteile bringt MT?
Der größte Vorteil von maschineller Übersetzung für Unternehmen ist eine höhere Produktivität, wodurch sich die Markteinführungszeit verkürzen, das Budget einhalten und steigende Volumina besser bewältigen lassen. Besonders in größeren, international tätigen Unternehmen mit enormen Mengen an Content, den es zu übersetzen gilt, kann ein einziges robustes MT-System mehreren Übersetzungszwecken dienen – von interner Kommunikation über Blogbeiträge bis hin zu Community-Foren. Außerdem kann ein gut eingerichtetes MT-System Tippfehler oder Buchstabendreher vermeiden, die das menschliche Auge schnell übersieht. Zusätzlich werden die Texte allgemein konsistenter.
Welche Faktoren sind bei der Wahl eines MT-Services zu berücksichtigen?
Qualitätsanforderungen
Maschinelle Übersetzung ist offensichtlich für die unterschiedlichsten Szenarien geeignet und die Zieltextqualität kann ebenso stark variieren wie der Kontext. Die Qualität steigt dabei in direkter Proportion zur Qualität und zum Umfang der Trainingsdaten, die in das System einfließen. Darüber hinaus haben Qualität, Einheitlichkeit und Komplexität des Ausgangstextes einen direkten Einfluss auf die Zieltextqualität. So kann das Fehlen von Akronymen oder umgangssprachlichen Wendungen in den Trainingsdaten zu schlechteren Übersetzungsergebnissen führen.
Es ist wichtig, zwischen Budget- und Zeitvorgaben und der gewünschten Qualität und Nuancierung abzuwägen. Wenn es beispielsweise nur darum geht, die Kernaussage eines Textes zu verstehen, dann ist eine Übersetzung mit einer MT-Lösung wahrscheinlich einfacher und das gewünschte Qualitätsniveau leichter zu erreichen. Bei Texten jedoch, die auf eine starke
emotionale Wirkung abzielen, wie bei Vertriebs- oder Marketing-Content, ist eine spezialisiertere Engine nötig, da es hier viel stärker auf Nuancen ankommt, die eine größere Herausforderung darstellen.
Sprachliche Unterschiede
Was auch berücksichtigt werden muss, ist der Umstand, dass nicht alle Sprachen oder Sprachpaare gleich aufgebaut sind. Während bei Übersetzungen zwischen Niederländisch und Englisch im Allgemeinen – dank der Ähnlichkeit beider Sprachen – gute Ergebnisse erzielt werden, sind Übersetzungen zwischen Chinesisch und Englisch viel komplexer aufgrund der erheblichen Unterschiede in der Syntax, Morphologie und Logik.
Generische oder maßgeschneiderte MT?
MT kann auf verschiedene Weise bereitgestellt werden, je nach Anforderungen und Einschränkungen. So lassen sich generische Engines recht einfach und kostengünstig bereitstellen und nutzen. Dies hat aber natürlich Auswirkungen auf die erreichbare linguistische Qualität. Die Anpassung einer Engine an einen spezifischen Einsatzbereich führt zwar zu besseren Ergebnissen, ist je nach Sprache und Content jedoch mit entsprechenden Kosten verbunden. Oft fallen die Kosten für das Customizing nur anfangs an und nicht fortlaufend. Wie bereits erwähnt, eignet sich eine maßgeschneiderte MT unter dem Gesichtspunkt des ROI am ehesten bei großen Content-Volumina.
MT-Post-Editing
Die MT-Ausgabe kann mit Post-Editing nachbearbeitet werden. Hier prüfen Post-Editoren, beispielsweise entsprechend geschulte Übersetzer oder Lektoren, die maschinellen Übersetzungen. Je nach den Anforderungen an das Ergebnis kann Post-Editing in verschiedenen Qualitätsstufen durchgeführt werden. Post-Editing ist besonders hilfreich, um Terminologie zu finden, die die MT-Engine möglicherweise nicht erkannt oder falsch ausgegeben hat. Dies kann der Post-Editor dann korrigieren. Die Engine kann zudem neu trainiert werden, um in Zukunft die richtigen Benennungen auszugeben und so den Post-Editing-Aufwand zu reduzieren. Je nach Qualitätsanforderungen und dem entsprechenden Maß an Post-Editing im Workflow kann diese Phase natürlich unterschiedlich viel Zeit und Geld in Anspruch nehmen.
Informationssicherheit
Schließlich ist noch zu erwähnen, dass nicht alle MT-Anbieter dasselbe Maß an Informationssicherheit für die in den MT-Engines verarbeiteten Daten bieten. Kostenlose MT-Services wie Google Translate beispielsweise speichern und nutzen die hochgeladenen Daten, um ihre Engines zu trainieren. Einer der Vorteile von bezahlten MT-Services ist deshalb, dass Sicherheitsanforderungen bereits während der Eingangsanalyse geklärt und mit dem Anbieter von maschinellen Übersetzungen direkt vereinbart werden können.
Wie erfolgt die MT-Bereitstellung?
Zwar kommt es immer auf die individuellen Anforderungen an, doch im Allgemeinen umfasst die MT-Bereitstellung folgende Phasen:
1. Eingangsanalyse
Dieser erste Schritt dient der Analyse der bereits bestehenden Prozesse, der Festlegung von Zielen, (z. B. welche Sprachen oder Content-Typen übersetzt werden sollen) und dem Aufstellen von Qualitätsanforderungen.
2. Pilotprojekt
In dieser Phase wird eine geeignete Engine auf Basis der Analyseergebnisse ausgewählt und, im Falle einer maßgeschneiderten Engine, beginnt das Engine-Training.
3. Test
Die gewählte Engine wird entweder mittels automatischer oder manueller Überprüfungen getestet und evaluiert, gegebenenfalls auch durch beides. Während der Testphase soll ermittelt werden, ob die Qualitätsziele erfüllt werden oder ob die Ergebnisse weiter optimiert werden müssen.
4. Engine-Optimierung
Falls die Testphase ergibt, dass die Ausgabe verbessert werden muss, kann die MT-Engine mit zusätzlichen Daten gefüllt und weiter trainiert werden.
5. MT-Bereitstellung
In dieser Phase wird die MT-Engine in den Workflow integriert, entweder durch Verknüpfung mit CAT-Tools (computerunterstützte Übersetzung) oder Translation-Management-Systemen (TMS) oder aber als eigenständige Anwendung.
6. Wartung
Die MT-Engine wird überwacht und im Laufe der Zeit durch immer neuen Content weiter trainiert. Dies ist besonders wichtig, wenn neue Produkte oder Services eingeführt werden, ein Rebranding erfolgen soll oder ein Unternehmen seinen Kommunikationsstil ändern möchte.
Fazit: Eine erfolgreiche MT-Bereitstellung erfordert sorgfältiges Vorgehen
Wie Sie sehen, sind bei der Konzeptionierung und Bereitstellung eines MT-Systems viele Faktoren zu berücksichtigen. Welche Sprachen und welcher Content sollen übersetzt werden? Welche Qualitätsanforderungen werden gestellt? Wie groß ist das Budget und der vorgegebene Zeitrahmen? All diese Faktoren sind bei der Wahl der am besten geeigneten Lösung zu berücksichtigen. Deshalb empfiehlt es sich immer, einen professionellen Lokalisierungsanbieter einzubeziehen, der mit MT-Lösungen bestens vertraut ist. Dort werden Ihre Anforderungen analysiert und Ihre Kosten-, Zeit- und Qualitätsvorgaben berücksichtigt, damit die bereitgestellte MT-Lösung die von Ihnen gewünschten Ergebnisse erzielt.
Wir bei RWS Moravia sind führend in diesem Bereich. Wir arbeiten eng mit Unternehmen zusammen, um ihre individuellen Ziele zu ermitteln und die dazu passende MT-Technologie zu implementieren.
Sind Sie neugierig geworden? Wenn Sie mehr über dieses Thema erfahren möchten, können Sie sich das
gesamte Webinar anhören.