Maschinelle Übersetzungen brauchen starke IT-Infrastrukturen

Übersetzungs-Profi Systran setzt auf IT-Infrastruktur von OVH

| Redakteur: Florian Karlstetter

Das Unternehmen Systran setzt für sein neuestes Übersetzungssystem, das mit neuronalen Netzwerken funktioniert, auf eine IT-Infrastruktur von OVH (zwei Frontends auf einem Dedicated Server und mehrere Computing-Nodes aus CPU- und GPU-Servern.
Das Unternehmen Systran setzt für sein neuestes Übersetzungssystem, das mit neuronalen Netzwerken funktioniert, auf eine IT-Infrastruktur von OVH (zwei Frontends auf einem Dedicated Server und mehrere Computing-Nodes aus CPU- und GPU-Servern. (© zapp2photo - stock.adobe.com)

Systran, spezialisiert auf maschinelle Übersetzungen, setzt beim Hosting in der Cloud auf OVH. Dort kommen u.a. hochperformante GPU-Server zum Einsatz, die nicht nur eine deutlich schnellere Übersetzung ermöglichen, sondern auch mit komplexen Algorithmen, die Systran für das auf Deep Learning und neuronalen Netzwerken basierende System „Pure Neural Machine Translation“ (PNMT) benötigt, gut zurecht kommen.

Der Bedarf an Übersetzungen ist – nicht aufgrund der zunehmenden Globalisierung – enorm: Etwa 33,5 Milliarden Euro setzt diese globale Branche um, Nachfrage steigend. Schätzungen gehen von bis zu 38 Milliarden Euro Umsatz bis zum Jahr 2020 aus. Auf diese Zahlen kommt das „Centre for Next Generation Localisation“, ein Zentrum für Wissenschaft, Technik und Technologie aus Irland. Bereits 1995 wurden weltweit 150 bis 300 Millionen Seiten pro Jahr übersetzt – das ist lange her und der Bedarf nach Übersetzungen ist seitdem massiv angestiegen. Vor allem in der Pharmabranche sind Übersetzungen heißbegehrt. Die Branche verzeichnet in Lateinamerika, Kanada und Europa ein rasantes Wachstum, in der Asien-Pazifik-Region beträgt die Wachstumsrate beeindruckende 14 Prozent. Insbesondere Packungsbeilagen und Co. müssen in die jeweilige Landessprache übersetzt werden.

Qualität von maschinell übersetzten Texten hat sich stark verbessert

Um diesen riesigen Bedarf möglichst schnell zu decken, wird zunehmend auf maschinelle Übersetzungen (MÜ) gesetzt. Vorbei sind die Zeiten, in denen die IT-gestützten Systeme nur holprige und kaum verständliche Texte lieferten. Dank Deep Learning, einem neuronalen, automatischen Lernverfahren, haben sich die maschinellen Übersetzungstechnologien deutlich verbessert. Ein Unternehmen, das sich bereits seit 1968 mit der MÜ beschäftigt, ist Systran.

Kunden von Systran nutzen die automatischen Übersetzungslösungen am häufigsten zur internen Zusammenarbeit sowie für Verwaltung und Auswertung von Big Data, Content Management, Support und E-Commerce. Die Übersetzungsplattform selbst kann sowohl in der Cloud gehostet als auch direkt in der IT-Umgebung des Kunden eingerichtet werden.

Starke IT-Infrastruktur für starke Performance

Für das Hosting in der Cloud setzt Systran auf eine IT-Infrastruktur von OVH. Sie besteht aus zwei Frontends und mehreren Computing-Nodes, die die notwendige Rechenleistung für die Übersetzungen sichern. Die Frontends werden auf dem Dedicated Server EG-64-S aus der Infrastructure Reihe gehostet: 64GB RAM, E5-1650v2 CPU, Soft Raid 2x4 TB. Die Computing-Nodes bestehen aus verschiedenen CPU-Servern mit HG Infrastruktur (Intel 2x Xeon E5-2640v3, 16c/32t – 2,6 GHz/3,4 GHz, 256 GB RAM, 2×4 TB HD) und GPU-Servern: GPU-4X-1080, 128G 2xE5-2630v3, 240 GB SSD und 4xGTX 1080.

Durch den Einsatz von GPU-Servern ist eine wesentlich schnellere Übersetzung möglich. Im Vergleich zu CPU Cores bringen sie eine dreifach höhere Rechenleistung. Außerdem können dank der GPU-Server Übersetzungsmodelle eingerichtet werden. Diese Modelle verbrauchen nicht nur weniger Speicher, sondern sorgen zusätzlich für eine Verbesserung der Übersetzungsqualität. Ein weiteres wichtiges Argument für die Zusammenarbeit waren die hochgesicherten Rechenzentren von OVH. Systran misst der Datensicherheit eine sehr hohe Bedeutung bei und hat anspruchsvolle Sicherheitsstandards, die der Provider ideal erfüllt.

Maschinen lernen Sprache wie Menschen

Ein besonderes Produkt von Systran, bei dem eine neuronale maschinelle Übersetzung bereits integriert ist, ist die Pure Neural Machine Translation (PNMT). Es basiert auf Deep Neural Networks und funktioniert im Gegensatz zu anderen Verfahrensweisen ohne spezielle sprachliche Wissensrepräsentation. Im Vergleich zur regelbasierten maschinellen Übersetzung, die auf eine Regeldatenbank (beispielsweise mit Wörterbucheinträgen) zugreift, sowie zur statistischen maschinellen Übersetzung, die auf einer Datenbank mit Satzfragmenten beruht, ist das ein großer Unterschied.

Bei PNMT wird genau wie in einem menschlichen Gehirn das Sprachwissen in den Verbindungen zwischen künstlichen Neuronen gespeichert. Diese Verbindungen entstehen durch Lernen und Anpassung während der Trainingsphase, also genau wie bei einem Menschen in der Sprachlernphase. Das PNMT-System erhält einen großen Teil seines Wissens von verschiedenen Datenquellen, die bisherige Übersetzungstechnologien nicht automatisch nutzen konnten – wie zum Beispiel semantische und stilistische Regeln, Genusangaben, positive oder negative Wertung von Begriffen u.v.m.

Die Zukunft der maschinellen Übersetzung

Systran arbeitet daran, spezialisierte Lösungen auf den Markt zu bringen, die komplett auf Fachwissen im Bereich Linguistik und Language Processing aufbauen. In Zukunft soll ein Language Tool zum Beispiel in sämtlichen Prozessen eines internationalen Betriebs integriert sein. Französisch-, englisch- und chinesischsprachige Gesprächsteilnehmer können auf diese Weise problemlos miteinander kommunizieren – und zwar jeder in seiner eigenen Sprache. Mit einem Partner wie OVH ist Systran gut gerüstet für kommende Herausforderungen.

Kommentare werden geladen....

Kommentar zu diesem Artikel abgeben

Der Kommentar wird durch einen Redakteur geprüft und in Kürze freigeschaltet.

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 44892546 / Hosting und Outsourcing)