6D Vision
14. Dezember 2011Ob ein Fußgänger vors Auto läuft oder ein Autofahrer einen Radfahrer beim Rechtsabbiegen übersieht - meistens reagieren Menschen zu spät. Wenn zum Beispiel ein Kind vor einem Auto auf die Straße läuft, braucht der Fahrer eine Sekunde, um überhaupt auf die Gefahr zu reagieren.
Ist er im Stadtverkehr mit 50 Stundenkilometern unterwegs, legt er in dieser Schrecksekunde schon fünfzehn Meter zurück. "Wenn es in diesem Fall gelingt, nur eine halbe Sekunde früher zu reagieren, kann das Fahrzeug sieben Meter früher zum Stehen kommen," sagt Uwe Franke, Leiter eines Forscherteams bei Daimler in Stuttgart.
Stereoskopie mit Bewegungserkennung
Franke, der schon seit 1996 an der Entwicklung intelligenter Fahrassistenz-Systeme arbeitet, hat deshalb den Autos das dreidimensionale Sehen beigebracht. "Wichtig ist, dass wir dem Auto zwei Augen geben, damit es wie der Mensch auch stereoskopisch sieht, also Tiefe empfinden und Entfernungen wahrnehmen kann," so der Erfinder.
Das reicht aber noch nicht, um Gefahren zu erkennen und zu bewerten. Denn zusätzlich zum dreidimensionalen Sehen muss das Autos auch Bewegungen registrieren. Dann muss ein Computer die Bilder auswerten und Befehle an Fahr- und Bremsassistenten geben: gegensteuern, wenn ein Fahrer von der Spur abweicht, oder abbremsen, wenn Gefahr droht. Dazu verfolgt ein Computer die Bewegung jedes einzelnen Bildpunktes, den die Kameras erfassen. Mit den automatischen Augen kann ein Computer dann Gefahren innerhalb von 200 Millisekunden erkennen.
Die Forscher haben ihrem Projekt den Namen "6D-Vision" für sechsdimensionales Sehen gegeben, "weil wir nicht nur den Ort einzelner Bildpunkte messen können, sondern auch ihre Bewegung, was weitere drei Dimensionen sind, so dass wir in der Summe auf sechs Dimensionen kommen," erklärt Franke.
Menschen können nicht alles sehen
Während der Mensch sich mit seiner selektiven Wahrnehmung immer nur auf ein Objekt konzentrieren kann, betrachtet der Computer gleichzeitig jeden Bildpunkt. Der Rechner muß nicht das Auto oder den Fußgänger als Ganzes erkennen, es reicht ihm bereits, einzelne Bildpunkte wahrzunehmen, um zu sehen, ob eine Kollision droht.
Anhand der Anzahl sich bewegender Bildpunkte weiß der Computer, ob sich ein Auto nähert, ein Mensch auf die Fahrbahn läuft oder nur ein Fußball angeflogen kommt. Dann gibt er einen Befehl an einen Fahrassistenten: ausweichen oder bremsen. Die Stuttgarter Entwickler haben sich deshalb besonders mit der Erkennung von Fußbällen beschäftigt, so Frank, "weil hinter dem Ball oft das Kind kommt."
Nach 15 Jahren intensiver Forschung sind die intelligenten Fahrassistenten fast serienreif. Die größte Herausforderung für die Mathematiker und Programmierer war es, einen sehr aufwendigen mathematischen Algorithmus auf einer Hardware so schnell zu machen, dass er in Sekundenbruchteilen Gefahren erkennen und darauf reagieren kann. Denn am Anfang waren die Rechner noch sehr langsam. Mittlerweile ist es den Forschern gelungen, alles auf einem kleinen Chip unterzubringen, der die Rechenleistung mehrerer handelsüblicher Computer bei weitem übersteigt.
Schnelle Chips und schlaue Algorithmen
"Als wir damals angefangen haben, hatten wir gerade mal 200 bis 500 Punkte, die wir in Echtzeit, das heißt in Intervallen von 40 Millisekunden, verfolgen konnten", erinnert sich Clemens Rabe, der mit Franke an der stereografischen Echtzeitmessung forscht. Neben schnelleren Prozessoren hat dann vor allem die Optimierung der Algorithmen die Rechner in die Lage versetzt, sogar 20.000 Bildpunkte in 10 Millisekunden verfolgen zu können.
Entscheidend für den Durchbruch war eine Idee des Forschers Heiko Hirschmüller vom Deutschen Zentrum für Luft und Raumfahrt (DLR).
Hirschmüller hatte einen Algorithmus entwickelt, der die Prozessorleistung wesentlich effizienter nutzt. Und jetzt profitiert das DLR wiederum von der Weiterentwicklung bei Daimler, denn nun arbeiten die Weltraumforscher daran, Robotern das dreidimensionale Sehen beizubringen, darunter sogar fliegenden Robotern.
In der Serienproduktion sollen Prozessoren und Kameras einmal in einem kompakten Gehäuse verbaut sein – und für jedermann erschwinglich, weil die Bauteile schon jetzt für die Unterhaltungselektronik in großen Zahlen gefertigt werden. In der Erprobungsphase füllt die Elektronik jedoch den ganzen Kofferaum einer Luxus-Limousine in den Forschungslabors von Daimler.
Die Welt aus Sicht des Rechners
Wenn ein solches Testauto durch die Straßen von Stuttgart fährt, sehen die Nachbarschaft, die Straße, andere Autos, Fußgänger und Fahrradfahrer aus Sicht des Computers aus wie kleine Punkte. "Rote Punkte sind sehr nah, grüne Punkte sind 30 bis 50 Meter weit weg und dunkelgrüne Punkte sind soweit weg, dass sie uns gar nicht mehr interessieren," erklärt Rabe.
Der Hochleistungsprozessor berechnet jeden Bildpunkt 25 Mal pro Sekunde – insgesamt zwanzig Millionen Bildpunkte pro Sekunde. Das sei weltweit einzigartig, und nur durch den Algorithmus des Kollegen vom DLR überhaupt möglich geworden, sagt er. Aus diesen Daten erzeugt der Computer Vektoren, also Pfeile, die zeigen, in welche Richtung sich etwas bewegt.
Jeder Vektor zeigt von einem markanten Bildpunkt im vorigen Bild zu einem Bildpunkt im aktuellen Bild. "Sie sehen farbcodiert die Länge dieser Vektoren. Die Pfeile zeigen an, wo der analysierte Bildpunkt in einer halben Sekunde sein wird," beschreibt der Forscher die Computerperspektive.
Indem der Computer die Bildpunkte unabhängig voneinander auswertet, kann er sehr viel schneller reagieren, als wenn er zuerst versuchen würde, aus ihnen ein Objekt zu errechnen - ein Fahrzeug oder einen Fußgänger.
Vom Warnsystem zum Chauffeur-Roboter
Da die Kameras bei Nebel, Regen oder vereisten Scheiben dieselben Sichtprobleme haben wie Menschen, geben die Forscher ihnen sicherheitshalber noch zusätzliche Sensoren mit, wie zum Beispiel einen Radar. Für Franke ist die Entwicklung intelligenter Fahrassistenten aber damit noch lange nicht abgeschlossen. Der jetzige Prototyp kann nämlich nur einen Blickwinkel von 50 Grad abdecken. Als nächstes ginge des deshalb darum, Kreuzungen zu erkennen, auf denen ein Blickwinkel von 180 Grad oder sogar 360 Grad zu überblicken wäre.
Doch die Vision geht noch weiter: "Wir wollen auch wesentlich mehr über die Verkehrsteilnehmer verstehen: Was ein Radfahrer als nächstes tun wird, wenn er den linken Arm herausstreckt, ob ein Fußgänger gehen oder stehenbleiben wird. Das ist die große Herausforderung für die Zukunft," betont Franke.
Die Fahrzeuge könnten bald auch untereinander kommunizieren und sich mitteilen, was sie vorhaben. Genauere digitale Karten und Navigationssysteme tun ihr übriges. "Eines Tages dem Fahrzeug den Schlüssel zu geben, wenn wir selbst mal nicht fahren wollen" - das wäre der Traum des Erfinders.
Der "Deutsche Zukunftspreis" des Bundespräsidenten wird am Mittwoch (14.12.2011) in Berlin zum 15. Mal verliehen. Er ist mit 250.000 Euro dotiert.
Autor: Fabian Schmidt
Redaktion: Brigitte Osterath