Schöne einfache Welt
10. Juli 2003Die Technik soll lernen, den Menschen zu verstehen. Das haben sich die Mitarbeiter des deutschen Forschungszentrums für Künstliche Intelligenz (DFKI) in Saarbrücken vorgenommen. Der Schlüssel dazu heißt Sprachtechnologie. Keine Tastatur, keine Maus – es zählt das gesprochene Wort.
"Die Sprache spielt eine ganz zentrale Rolle, weil sie für unsere Kommunikation unabdingbar ist", sagt Stephan Busemann, der stellvertretende Leiter des Bereichs Sprachtechnologie am DFKI. Die Computer zerhacken beim Zuhören gewöhnlich das Gesprochene in so genannte Phoneme, die akustischen Grundbausteine von Wörtern. Aus der Analyse der Schallwellen rekonstruieren die Rechner dann mit Hilfe eines eingebauten Wortschatzes Silben, Wörter und Sätze.
Ein langer Weg zur Verständigung
Viele Anekdoten ranken sich um die Fehlerhaftigkeit der Technologie der Spracherkennung. Da ist zum Beispiel die Geschichte des Sachsen, der bei der Deutschen Bahn über das System der Spracherkennung eine Fahrkarte am Telefon bestellen will. Darauf ist der virtuelle Schalterbeamte nicht eingestellt, kann mit dem Akzent nichts anfangen und bucht ständig falsche Verbindungen.
Die Begebenheit zeigt aber auch, wie sehr sich diese Technologie mittlerweile in unseren Alltag eingeschlichen hat. Maschinelle Übersetzungen sind ein weiteres Einsatzfeld der Systeme, bei denen einfach strukturierte Dialoge zwischen Mensch und Automat geführt werden. Busemann ist überzeugt: "Durch das Zusammenwachsen der Europäischen Union entsteht hier Bedarf."
Die Erfahrung des Sachsen mit der Bahn lässt weniger Gutes erahnen. Realistischer scheint, dass die Akzent- und Dialektproblematik bei der Ausweitung der Sprachtechnologie auf ganz Europa komplexer wird. Man stelle sich etwa einen Oberbayern vor, der mittels eines Übersetzungscomputers versucht, mit einem Neapoletaner zu kommunizieren. Oder einen Andalusier, der mit einem Schwaben "schwätze" will ...
Die Realität von Science Fiction
Vielleicht kann hier das ebenfalls vom DFKI koordinierte Projekt "SmartKom" helfen. Es beschäftigt sich mit der Bedienung technischer Geräte durch Gesten und Mimik. Ein Zukunftsszenario: Nach einem Einkaufsbummel entscheidet man sich zu einem spontanen Theaterbesuch. Man spricht in ein kleines, an der Kleidung befestigtes Mikrofon. Auf einem Gerät in der Größe eines Mobiltelefons erscheint das aktuelle Programm. Der Nutzer hat die Möglichkeit, für die einzelnen Stücke per Fingerzeig Karten zu ordern, oder mit einem missbilligenden Stirnrunzeln abzulehnen. Eine Stimme aus einem "Knopf im Ohr" beschreibt dann den Weg zum ausgewählten Schauspielhaus.
"Technologisch ist vieles davon schon möglich", berichtet Busemann. Ob und wann sich die Technik durchsetzt - darauf will der Wissenschaftler sich nicht fest legen: "Da wage ich keine Vorhersage. Das wird auch vom Preis abhängen."
Investitionsfeld Zukunftstechnologien
Die Politik hat den Wunsch der Menschen nach einer einfachen neuen Welt erkannt. In den vergangenen vier Jahren förderte die Bundesregierung "SmartKom" sowie fünf weitere Leitprojekte zur Mensch-Technik-Interaktion (MTI) mit insgesamt 82,6 Millionen Euro. Aus Unternehmen flossen 152,2 Millionen Euro an Investitionen. Die Deutschen MTI-Projekte gelten nach Angaben des Bundesforschungsministeriums inzwischen als führend in der Welt.
Ob die Maschinen sich eines Tages wirklich in die Höhen und Tiefen der menschlichen Existenz werden hinein versetzen können, ist fraglich. Wenn sie die eindeutige Interpretation der Mimik und Gestik unserer Mitmenschen gefunden haben, würden wir uns aber gerne nochmal mit ihnen unterhalten ... (bm)