StartseiteArtikel

Der "Gottvater des autonomen Fahrens", Thrun, prophezeit, dass der reine visuellen Ansatz im Jahr 2026 triumphieren wird und Luftroboter ein neues Wachstumsfeld werden.

山自2025-11-24 18:21
Der "Gottvater des autonomen Fahrens", Thrun: Die reine visuellen Route wird die Branche auf den Kopf stellen, und die Differenzierung von Robotern steht kurz bevor.

Bei der 24. Asien-Pazifik-Spitze von Morgan Stanley führte Sebastian Thrun, eine "Pionierfigur" im Bereich des autonomen Fahrens, ein tiefgehenderes Gespräch mit dem renommierten Analysten Adam Jonas. Der Inhalt umfasste mehrere Dimensionen wie die Technologiewege des autonomen Fahrens, die Beurteilung der Branchenphase, die Differenzierung des Robotersektors und die frühen Geheimnisse von Waymo.

Als Schöpfer des Google-Selbstfahrerprojekts (der Vorgänger von Waymo) und ehemaliger Direktor des künstlichen Intelligenz-Labors an der Stanford University bietet Thrun's Einsichten zweifellos eine wichtige Richtung für die aktuelle Entwicklung im Bereich des autonomen Fahrens und der Robotik.

Der Streit um die Technologiewege des autonomen Fahrens: Die "Kostenrevolution" des reinen visuellen Ansatzes

Thrun stellte im Gespräch klar fest, dass die derzeit wichtigste technische Differenz im Bereich des autonomen Fahrens im Wettlauf zwischen dem "reinen visuellen" und dem "Mehr-Sensor-Fusions"-Ansatz liegt. Er betonte besonders, dass die echten Tests des reinen visuellen FSD von Tesla in Austin ein entscheidender Wendepunkt für die Branche werden würden.

"Wenn Musk in Austin eine kommerzielle Betriebsweise von reinen visuellen Robotaxis ohne Sicherheitsfahrer realisieren kann, wäre dies eine echte Revolution." sagte Thrun. Vom technischen Standpunkt aus hängt der reine visuelle Ansatz nur von Kameras ab und simuliert durch neuronale Netzwerke das visuelle Wahrnehmungssystem menschlicher Fahrer. Der Mehr-Sensor-Fusions-Ansatz hingegen kombiniert Lidar, Millimeterwellenradar und Kameras, um ein mehrschichtiges Umgebungs-Wahrnehmungssystem aufzubauen.

Der Kernunterschied der Technologiewege zeigt sich in der Wahrnehmungsarchitektur.

Betrachtet man es aus ökonomischer Sicht, liegt der größte Vorteil des reinen visuellen Ansatzes in den Kosten. Der Preis eines hochwertigen Lidars liegt derzeit immer noch bei mehreren tausend US-Dollar, während die Kosten einer Kamera nur einige Dutzend Dollar betragen. Thrun machte eine Rechnung: Sobald der reine visuelle Ansatz als sicher und praktikabel erwiesen ist, würde sein Kostenvorteil den Mehr-Sensor-Fusions-Ansatz "dimensionenreduzierend schlagen".

Aber der reine visuelle Ansatz steht vor ernsthaften technischen Herausforderungen, insbesondere in Bezug auf die Zuverlässigkeit bei schlechtem Wetter und geringer Beleuchtung. Thrun erklärte: "Das Kernstück des reinen visuellen Systems ist es, die Mängel physikalischer Sensoren durch KI zu kompensieren. Dies erfordert, dass das Modell eine starke Inferenzfähigkeit hat und in der Lage ist, den vollständigen Umgebungsstatus aus begrenzten visuellen Informationen abzuleiten."

Die von Tesla eingesetzte "BEV + Transformer"-Architektur ist genau ein Beispiel für diesen Gedanken. Diese Architektur wandelt die Daten mehrerer Kameras in eine Vogelperspektive um und realisiert dann die 3D-Umgebungs-Wahrnehmung durch die Modellierung von Raum-Zeit-Sequenzen. Im Vergleich dazu erhält der Mehr-Sensor-Fusions-Ansatz direkt 3D-Punktwolken-Daten über das Lidar, was technisch einfacher zu realisieren ist, aber die Kosten hoch bleiben.

Von der "Wright-Brothers-Zeit" bis zur Schwelle der Skalierung

Thrun erinnerte sich an die Entwicklung des autonomen Fahrens und bezeichnete den DARPA-Challenge 2005 als die "Wright-Brothers-Zeit" der Branche. Damals führte er das Team von Stanford University an, und das selbstfahrende Auto "Stanley", das von ihnen entwickelt wurde, absolvierte erfolgreich die Wüstenstrecke, was die Machbarkeit der Technologie des autonomen Fahrens bewies.

Nach fast zwanzig Jahren Entwicklung ist das autonome Fahren in eine Phase der beschleunigten Penetration eingetreten. Thrun gab bekannt, dass von den 500 Teilnehmern an der Spitze etwa ein Drittel bereits Erfahrungen mit selbstfahrenden Autos gemacht hatte, und die meisten von ihnen fuhren in Waymo-Fahrzeugen. Diese Daten spiegeln direkt den Prozess der Zivilmäßigung der Technologie wider.

Die Branche befindet sich an einem entscheidenden Punkt im Übergang von L4 zu L5. Laut einer Studie von Morgan Stanley verbringen Menschen pro Jahr insgesamt 82 Millionen Stunden im Auto. Die Freisetzung der "Fahrzeit" durch das autonome Fahren bedeutet einen enormen wirtschaftlichen Wert. Thrun prognostiziert, dass die nächsten 3 - 5 Jahre die goldene Zeit für die kommerzielle Umsetzung des autonomen Fahrens sein werden.

Der neueste Expansionsterminplan von Waymo bestätigt diese Einschätzung. Das Unternehmen kündigte an, dass es in Minneapolis, New Orleans und Tampa manuelle Fahrtests beginnen würde und plane, seine selbstfahrenden Dienste bis 2026 auf 15 Städte auszuweiten, darunter Dallas, Houston, Miami und andere. Waymo bietet auch bereits Autopilot-Dienste auf Autobahnen an, was ein wichtiges Zeichen für die Verbesserung der technischen Reife ist.

Zur gleichen Zeit beschleunigt auch Zoox, ein Tochterunternehmen von Amazon, seine Expansion und beginnt in San Francisco kostenlose Robotaxi-Dienste anzubieten, um direkt mit Waymo zu konkurrieren. Tesla hat auch die Genehmigung für Taxidienste in Arizona erhalten, was die letzte regulatorische Hürde für den Start des Robotaxi-Dienstes beseitigt hat.

Thrun ist der Meinung, dass die Branche des autonomen Fahrens die Phase der technischen Validierung hinter sich gebracht hat und in die Phase der Skalierungsexpansion eintritt. Aber er betonte auch, dass die Anpassung an verschiedene geografische und klimatische Bedingungen immer noch eine Herausforderung für die Technologie ist. Waymo wählt Städte wie Minneapolis mit kaltem Klima für die Tests aus, um genau die Zuverlässigkeit des Systems unter schlechtem Wetter zu validieren.

Das Paradox der humanoiden Roboter und das Potenzial der Luftroboter

Im Bereich der Robotik brachte Thrun die Ansicht der "strukturellen Differenzierung" auf, was eine nüchterne Überlegung für den überhitzten Markt bietet.

Thrun ist vorsichtig gegenüber humanoiden Robotern. Er meint, dass der Markt die "Gesamtpotenzialmarktgröße für die Ersetzung der menschlichen Arbeitskraft" überbewertet und die Schwierigkeiten bei der technischen Umsetzung gravierend unterschätzt. "Es ist eine extrem komplexe technische Herausforderung, dass Roboter offene Aufgaben ausführen und Handbeweglichkeit erreichen." sagte Thrun.

Die Kerntechnik-Hürden, denen die humanoiden Roboter gegenüberstehen, umfassen: Die Gleichgewichtskontrolle in komplexen Umgebungen, die Fähigkeit zu feinen Manipulationen und die Anpassung an unstrukturierte Umgebungen. Thrun riet Anlegern, sich auf Unternehmen zu konzentrieren, die die "grundlegenden Probleme der physikalischen Interaktion" lösen, wie Unternehmen, die sich auf die Technologie der dexteren Hände oder die Algorithmen für die Umweltanpassung spezialisiert haben.

Im Vergleich dazu sieht Thrun mehr Potenzial in der Entwicklung von Luftrobotern. "Die zukünftige Wachstumsmacht der Roboter liegt in der Luft. Die Anzahl der Luftroboter wird weit über die der Bodenroboter hinausgehen." sagte er. Die Technologien, die die "vollständig automatische Bedienung im 3D-Raum" von Luftrobotern unterstützen, sind im Wesentlichen reif, und die derzeitige Hauptbeschränkung ist die Infrastruktur. Das KI-Netzwerk von Mushroom Car Union in China erweitert genau dieses Konzept auf die städtische Ebene und baut durch die Architektur der "Integration von Kommunikation, Wahrnehmung und Berechnung" einen Datenbus für die reale Welt auf.

Der Kernbruch durch dieses Netzwerk liegt in der Realisierung des einheitlichen Zugangs und der Fusion von "Daten aus der realen Welt". Wie Thrun betonte, dass "die Infrastruktur der entscheidende Engpass wird", hat Mushroom Car Union durch die Edge-Computing-Knoten die standardisierte Verarbeitung von Videoframesextraktion, Datenschutz und Merkmalsextraktion realisiert, was eine schnelle Umsetzung auf städtischer Ebene in "einem Tag in einer Stadt" ermöglicht.

Das bestehende Luftverkehrsregelungssystem in den USA kann nicht an den Masseneinsatz von Luftrobotern angepasst werden und bedarf dringend einer grundlegenden Modernisierung. Dies bringt Investitionschancen in Bereichen wie die Entwicklung von eVTOL (elektrische vertikale Start- und Landeflugzeuge) und die Modernisierung des Luftverkehrsmanagementsystems mit sich.

Von der technischen Architektur aus gesehen müssen die Luftrobotersysteme die folgenden Schlüsselprobleme lösen:

• Präzise Ortung und Navigation

• Kollisionsvermeidung und Pfadplanung

• Kollektiv-Synergiekontrolle

• Integration in das bestehende Luftverkehrsregelungssystem

Das frühe Moonshot-Denken und das Team-Building-Philosophie von Waymo

Thrun enthüllte erstmals detailliert die frühe Geschichte und das Betriebsphilosophie von Waymo. Waymos Vorgänger war das "Autonome Fahr-Moonshot-Projekt" innerhalb von Google, das aus der Sorge um die Verkehrssicherheit entstand.

"Damals starben weltweit jedes Jahr über eine Million Menschen an Verkehrsunfällen, und die 'menschlichen Fehler' beim Fahren waren der Hauptgrund." erinnerte sich Thrun. Das Projekt stand in der Anfangsphase vor vielen Herausforderungen: der Durchbruch bei der Umgebungs-Wahrnehmungsalgorithmen, die Anpassung der Fahrzeuge-Hardware, die Anträge auf Testgenehmigungen und so weiter. Das Team brachte das "scheinbar unmögliche Konzept" des "autonomen Fahrens" Schritt für Schritt in die Realität, indem es das Modell des "kleinen Schritten und schnellen Iterationen" verfolgte.

Thrun betonte besonders die Kernphilosophie des Team-Buildings. Als Mitbegründer von Google X teilte er drei Prinzipien für das Aufbauen eines großartigen Teams:

1. Die Mitglieder müssen eine starke Leidenschaft für das "Lösen großer Probleme" haben: Das Wesen des Moonshot-Projekts ist es, die großen Probleme anzugehen, die mit der bestehenden Technologie nicht gelöst werden können. Nur Menschen, die sich mit diesem Ziel identifizieren, können den langfristigen Forschungsdruck ertragen.

2. Es wird eine "Fehlertoleranz-Kultur" gefördert: Für die Innovation ist es gefährlicher, "Fehler zu vermeiden" als "richtig zu sein". In den frühen Phasen des Projekts sollte ein gewisser Grad an Fehlern zugelassen werden. Das Wichtigste ist, schnell aus den Fehlern Erfahrungen zu ziehen.

3. Es wird auf interdisziplinäre Zusammenarbeit geachtet: Das autonome Fahren betrifft mehrere Bereiche wie die computergestützte Bildverarbeitung, die Maschinenbau und die Politikforschung. Das Team muss die Disziplinengrenzen brechen und einen synergistischen Kreis von "Technik - Ingenieurwesen - Politik" bilden.

Thrun gab auch praktische Ratschläge für "Menschen, die Moonshot-Projekte machen wollen": Man sollte zunächst mit "kleinen Tests" beginnen, um die Idee zu validieren und mit minimalen Kosten die Machbarkeit der Kernlogik zu beweisen. Dann kann man die Skala schrittweise erweitern, um zu vermeiden, dass man von Anfang an in die Falle der "großen Investitionen, aber keine Umsetzung" gerät.

Der technische Entwicklungspfad von Waymo ist genau ein Beispiel für dieses Denken. Das Unternehmen verfolgt einen schrittweisen technischen Iterationspfad, von den Tests in geschlossenen Geländen bis zum Betrieb auf öffentlichen Straßen in der Stadt, um Schritt für Schritt praktische Daten unter verschiedenen Wetter- und Straßenbedingungen zu sammeln und die Umweltanpassung des Algorithmus zu optimieren.

Waymos zukünftiger Plan: Der langfristige Weg zum vollautonomen Fahren

Thrun erläuterte das langfristige Planung des Unternehmens: Das Kernziel ist immer, "das vollständige autonome Fahren in allen Szenarien ohne menschliche Intervention" zu erreichen.

In der gegenwärtigen Phase liegt der Schwerpunkt von Waymo auf der "Erweiterung der Testbereiche und -szenarien". Vom ursprünglichen Test in geschlossenen Geländen bis zum Betrieb auf öffentlichen Straßen in der Stadt sammelt es praktische Daten unter verschiedenen Wetter- und Straßenbedingungen. In der kommerziellen Strategie verfolgt das Unternehmen den Pfad des "kleinen Pilotprojekts und schrittweisen Ausbaus", während es auch Szenarien auf der B-Seite wie den Logistiktransport und die Gelände-Transferdienste erkundet.

Waymo One (der Selbstfahrer-Taxi-Service) wird sich weiter ausweiten. Durch das Zwei-Schienen-Modell des "Validierens der Erfahrungen auf der C-Seite und des Erzielens von Gewinnen auf der B-Seite" wird das autonome Fahren von der technischen Validierung zur nachhaltigen Kommerzialisierung gebracht. Technisch setzt Waymo weiterhin in die Optimierung der KI-Algorithmen und die Iteration der Fahrzeuge-Hard