Kölner Startup schlägt Silicon Valley-Giganten
10. Dezember 2018Übersetzungsriesen wie Google und Microsoft stehen einem kleinen, aber starken Konkurrenten gegenüber. Das Kölner Startup DeepL produziert im Gegensatz zu anderen Übersetzungs-Giganten wie Google Translate natürlicher klingende Texte. Damit hat das Unternehmen, das von einem ehemaligen Google-Mitarbeiter gegründet wurde, einen klaren Vorteil gegenüber allen anderen großen Wettbewerbern.
Der Dienst verwendet die so genannte Deep Learning-Technologie, die auf einem künstlichen neuronalen Netzen basiert. Um das zu entwickeln, haben die Macher von DeepL einen ihrer bereits bestehenden Dienste genutzt.
Vom Wörterbuch zum Übersetzer
Im Jahr 2009 brachte das Startup das Wörterbuch Linguee.com auf den Markt. Das Besondere daran: Neben verschiedenen Übersetzungsmöglichkeiten wurden zahlreiche Muster von bereits übersetzten Texten in ausgewählten Sprachpaaren angeboten.
Diese wurden mit Hilfe von speziellen Internet-Bots, sogenannten Web-Crawlern, aus dem Internet gesammelt. Viele Textproben stammten aus Dokumenten von multilateralen Institutionen wie der Europäischen Union (EU).
Ein von Menschen geschulter maschineller Lernalgorithmus berechnete dann die Struktur und die Bedeutung des gesammelten Textes und erlernte dadurch, wie bestimmte Konzepte in einer anderen Sprache ausgedrückt werden. Darüber hinaus können die Benutzer bei Linguee.com Feedback hinterlassen und die Übersetzungen manuell bewerten. In den letzten neun Jahren hat sich Linguee.com durch eine ständig wachsende Anzahl von qualitativ hochwertigen Übersetzungen verbessert. Damit wurde es nach und nach die Grundlage für das neue Übersetzungstool DeepL.
DeepL steht für "deep learning"
Deep Learning ist ein Aspekt von künstlicher Intelligenz (KI), der das menschliche Lernen nachahmt. Früher schrieben Programmierer individuelle Befehle für jede Aufgabe, die ein Computer zu erledigen hatte. Jetzt bauen sie ein künstliches neuronales Netzwerk, das trainiert werden kann, indem sie bereits vorhandene Beispiele einspeisen. Je mehr Beispiele, desto besser kann der Computer lernen. Die technische Möglichkeit, große Datenmengen zu verarbeiten, haben das Potential dieses maschinellen Lernens weiter ausgebaut.
Technologisch betrachtet ist Deep Learning ein Algorithmus, der mehrere Ebenen der Informationsverarbeitung verwendet. "Deep", also "tief" bezieht sich auf die Anzahl der Ebenen, die die Daten durchlaufen. Heute findet sich diese Technologie in selbstfahrenden Autos, Virtual-Reality-Headsets und in der Gesichtserkennungssoftware. Und jetzt hilft es uns dabei, Texte zu übersetzen.
Es geht um mehr als Lernen
Die DeepL-Schöpfer sind nicht das einzige Unternehmen, das in den letzten zwei Jahren die Deep Learning-Technologie einsetzt. Internet-Giganten wie Google, Microsoft und Yandex nutzen sie ebenfalls. Allerdings unterscheidet sich DeepL von ihnen.
Zunächst einmal basiert die Leistung des neuronalen Netzwerks von DeepL auf der Qualität des für das Training verwendeten Inputmaterials. Und hier kommt der "große Bruder" Linguee ins Spiel, der Milliarden von hochwertigen Übersetzungsmustern zur Verfügung stellte.
"Die Linguee-Daten sind sehr hochwertiges Trainingsmaterial", sagt Firmensprecher Lee Turner Kodak. Aber es ist mehr als die Qualität der Daten, die DeepL so erfolgreich macht. erklärt Kodak. "Unsere Forscher sind mit den neuesten Entwicklungen auf diesem Gebiet bestens vertraut und haben eine einzigartige neuronale Netzwerkarchitektur entwickelt", betont er.
Wie die Technologie genau zusammengesetzt wird, bleibt jedoch ein Geheimnis. Schließlich will DeepL seinen Marktvorsprung nicht verlieren.
Dreimal mächtiger als Google Translate
Um die Übersetzungsqualität zu kontrollieren, führt DeepL regelmäßig zufällige Blindtestes durch, um sicherzustellen, dass das Programm seinen hohen Standard einhält. Mit den Ergebnissen eines solchen Testes von August 2017, der auf der Website des Unternehmens veröffentlicht wurde, stützt das Unternehmen seinen Anspruch, "die beste Übersetzungsmaschine der Welt" zu sein. Der Blindtest verglich die Ergebnisse von DeepL mit denen der Konkurrenz: Google, Microsoft und Facebook.
Die Maschinen erhielten 100 Sätze für die Übersetzung aus dem Englischen ins Deutsche, Französische und Spanische. Ebenso sollten Sätze aus den Sprachen ins Englische übersetzt werden. Danach beurteilen professionelle Übersetzer die Qualität des Textes. Das Ergebnis: DeepL wurde dreimal häufiger als Google als beste Übersetzung ausgezeichnet, weil die Übersetzung natürlicher klang.
Investition aus dem Silicon Valley
Am 2. Dezember 2018 gab DeepL bekannt, dass das Kölner Startup einen neuen Investor gewonnen hat - die Risikokapitalgesellschaft Benchmark ebenfalls aus dem Silicon Valley. Mit einem Team von 25 Mitarbeitern plant DeepL nun, seine Forschung und Entwicklung innerhalb eines Jahres zu verdoppeln, sagt Kodak.
"Diese Partnerschaft bedeutet nicht nur Geld, sondern auch Verbindungen. Wir werden aus der Business Intelligence des Investors und anderer Start-ups lernen können, die im Entwicklungsprozess weiter fortgeschritten sind", sagte er.
100 Sprachen gegen neun
Am 5. Dezember startete DeepL neue Übersetzungsdienste in Russisch und Portugiesisch. Mit diesen beiden Sprachen bietet DeepL nun neun europäische Sprachen und insgesamt 72 Sprachkombinationen an. Google Translate bietet mehr als 100 Sprachen an. Aber das Startup setzt auf einen hohen Standard bei den Übersetzungen: Qualität ist wichtiger als Quantität, glauben die Gründer.
"Wir wollen das beste maschinelle Übersetzungssystem werden. Und wir wollen in jeder Sprache verfügbar sein. Aber anstatt auf einmal ein paar hundert Sprachen herauszubringen, nur um sie zu haben, trainieren wir unsere Netzwerke, um immer die gleich hohe Qualität zu liefern, für die wir bekannt geworden sind", sagte Kodak.
Mehr dazu: Wo gibt es KI schon?
ah