StartseiteArtikel

Ist VLA der Konkurrent von Teslas V13?

晓曦2025-04-08 19:18
Der Durchbruch bei der Lokalisierung von VLA.

Ende Februar ist Teslas FSD in China eingeführt worden, und alle chinesischen Unternehmen im Bereich intelligenter Fahrerassistenzsysteme haben ihre Nerven gefasst.

Im März sind sowohl "Fehlschläge" als auch "reibungslose Fahrten" von Teslas FSD aufgetreten. Die Gesichter der Chefs strahlten zwar wieder, aber wie sehr sie sich Sorgen machten, ist nicht bekannt.

Wenn man die Leistung von Teslas FSD seit der Einführung in China betrachtet, hat man das Gefühl, als würden die "Köstlichkeiten der verrückten Fahrmanöver im Bereich intelligenter Fahrerassistenz" und die "Präsentation des ausgezeichneten Schülers im Bereich intelligenter Fahrerassistenz" nebeneinander stehen. Auf der einen Seite hat das FSD in Shanghai Lujiazui die Fahrspur für Busse als Überholspur missbraucht und rasant dahingefahren; unter dem Canton Tower zeigte die Navigation ein Grünlicht an, aber das Auto hat plötzlich wegen eines "Baustelle" - Schildes, das es fälschlicherweise für eine Werbeanzeige gehalten hat, stark abgebremst. Auf der anderen Seite hat es im normalen Fahrbetrieb das Können eines erfahrener Fahrers gezeigt, konnte genauso gut vor nicht - motorisierten Fahrzeugen ausweichen und Wendemanöver, Kurvenfahrten usw. ohne Zögern ausführen, was den Nutzern ein reibungsloses Fahrerlebnis bescherte.

Das FSD zeigt im normalen Fahrbetrieb ein reibungsloses Verhalten.

Der Grund für diese Situation ist einfach. Tesla hat eine solide Grundlage in der zugrunde liegenden KI - Technologie, die ein reibungsloses Fahrerlebnis im normalen Fahrbetrieb ermöglicht. Da es jedoch ein End - to - End - Modell verwendet (im Vergleich zu traditionellen modularen Modellen für intelligente Fahrerassistenzsysteme verursacht das End - to - End - Modell zwar keine Informationsverluste bei der Wahrnehmung, Entscheidung und Steuerung, es führt aber im Wesentlichen nur die entsprechenden Operationen gemäß den Anweisungen aus und kann die Fahrregeln für besondere Straßenverhältnisse wie Gezeitenfahrspuren nicht verstehen) und kein chinesisches Datentrainingssystem hat, versteht das FSD die komplexen Szenarien des Interaktionsspiels zwischen Autos und Menschen in China nicht und kann die Fahrregeln für besondere Straßen nicht interpretieren. Dies hat zu den "verrückten Fahrmanövern von Teslas intelligenter Fahrerassistenz" geführt.

Und genau hier liegt auch das Problem der Sorgen der Chefs. Aufgrund seiner starken zugrunde liegenden logischen Fähigkeiten wird Tesla, sobald es die Schwächen im chinesischen Markt ausbessert, sicherlich eine "Dunkelwolke" über die chinesischen Automobilhersteller werfen.

Zu diesem Zeitpunkt tauchte das VLA auf.

Eine gute Nachricht und eine schlechte Nachricht

Die gute Nachricht ist, dass das VLA - Modell die "Schwächen" des End - to - End - Ansatzes beheben kann. Es kombiniert die drei Aktionen "sehen", "denken" und "handeln". Mit Kameras und Lidar - Sensoren sammelt es Informationen über die Straßenverhältnisse, was dem Auto sozusagen 24 - karat - große Augen verleiht. Das Large Language Model analysiert die kommenden Straßenverhältnisse, indem es Verkehrsschilder, die Absichten von Fußgängern usw. interpretiert. Man kann nicht übertrieben sagen, dass es sogar versteht, wenn ein Fußgänger die Straße bei Rot überqueren will, und es kann auch mit Gezeitenfahrspuren und Fahrspuren für Busse umgehen. Basierend auf dem, was es sieht und denkt, kann das VLA die beste Route für das Auto berechnen und das Fahrzeug steuern. Es kann auch die Entscheidungslogik liebevoll erklären, wie z. B. "Das Bremsen erfolgt, weil ein Kind plötzlich vor dem Auto auftauchte".

Einfach ausgedrückt, kombiniert das VLA Vision, Sprache und Bewegung und verleiht dem Auto eine "menschenähnliche Denksequenz". Es hat sich vom End - to - End - "Beschreiben eines Bildes" zum "Textverstehen" entwickelt.

Wenn das VLA die technischen Schwächen des End - to - End - Ansatzes beheben kann, warum sind die chinesischen Automobilhersteller dennoch besorgt, dass Teslas FSD in China eingeführt wird? Das ist eigentlich leicht zu verstehen. Die Grundfähigkeiten und die Lernfähigkeit von Teslas FSD sind sehr stark. Mit nur wenigen Videoclips von chinesischen Straßen aus dem Internet für das Training kann das System bereits das Können eines erfahrener Fahrers zeigen. Sobald Tesla die Daten in China auffüllt und die "Anpassungsschwierigkeiten" in China überwindet, könnte es zu einem der besten Systeme für intelligente Fahrerassistenz auf dem chinesischen Markt werden. Auf der Konferenz der 100 Personen in den letzten Tagen haben Zhou Guang, CEO von DeepRoute.ai, und Wu Yongqiao, Präsident von Bosch China, offen gesagt, dass das FSD V13 in der End - to - End - Technologie für intelligente Fahrerassistenz um eine Generation vor den chinesischen hochwertigen Systemen für intelligente Fahrerassistenz liegt.

Kann das VLA die Unterschiede in der zugrunde liegenden Technologie überwinden? Sowohl das FSD V13 als auch das VLA werden in der Branche als Produkte der Phase der großen Modelle für intelligente Fahrerassistenz angesehen. Nach Ansicht von Zhou Guang macht die Fähigkeit des VLA es zu einem "Universal - System", das in vertikalen Bereichen eine breite Anpassungsfähigkeit an verschiedene Szenarien hat.

"Das VLA kann die Schwächen des End - to - End - Modells ausgleichen und ist ein Universal - Fahrer. Es versteht semantische Informationen und kann die Fahrregeln für besondere Fahrspuren interpretieren. Nur wenn man zuerst ein Universal - Fahrer wird, kann man ein Experte im Fahrbereich werden, d. h. die vollständige Autonomie erreichen." Zhou Guang sieht die VLA - Architektur als Wendepunkt auf dem Weg zur Stufe L5. Er glaubt, dass das Wesen des VLA die Schaffung eines raumzeitlich einheitlichen Erkenntnisrahmens ist, der die zugrunde liegende Grundlage für die Realisierung der L5 - Autonomie bietet.

Kurz gesagt, meint Zhou Guang, dass das von DeepRoute.ai vorgeschlagene VLA ein besseres Konzept für den Weg zur Stufe L5 ist, das die Kern - KI - Fähigkeiten beibehält und sowohl den technologischen Anspruch als auch die Kommerzialisierung erfüllt.

Die gute Nachricht ist aufregend, aber die schlechte Nachricht macht einen ein wenig unruhig - nämlich gibt es bisher noch keine Fahrzeuge mit vollständigem VLA - System. Aber keine Sorge, die Entwicklung ist bereits im Gange.

Der "Aufstieg" auf vier Wegen

Aktuell gibt es auf dem chinesischen Markt vier Unternehmen, die sich klar auf das VLA fokussieren: das datenhungrige Li Auto, das "Joint - Venture - Spezialist" Chery, das "Kauf - Spezialist" Geely und der radikale Akteur DeepRoute.ai.

Li Auto nutzt das "MindVLA", das Technologien wie 3D - Gauß - Codierung und MoE - Mixed - Expert - Architektur integriert. Die Genauigkeit der Entscheidungen in komplexen Straßenverhältnissen liegt tatsächlich vor den Konkurrenten. Das Problem ist jedoch, dass sie gleichzeitig zwei Systeme, das End - to - End - System und das VLM, unterhalten müssen. Obwohl sie über ausreichende Daten verfügen - der Deckungsgrad des dynamischen Datensees ist der höchste in der Branche und sie haben es sich vorgenommen, 2025 "Datenfreiheit" zu erreichen - steigen die Forschungs - und Entwicklungs - Kosten rapide an und nähern sich bald den Kosten eines neuen Automobilherstellers.

Das Geheimnis von Chery, dem Joint - Venture - Spezialisten, ist, dass es viele Freunde hat. Zusammen mit Huawei und NVIDIA hat es das Falcon Intelligent Driving System entwickelt und plant, das VLA - Modell im Falcon 900 zu realisieren. Die Vorhersagefähigkeit seines Weltmodells (WM) ist jedoch noch nicht ausreichend, und das System soll erst 2027 auf den Markt kommen.

Geely, das "Kauf - Spezialist", setzt auf das "Thousand - Li Vast Intelligent Driving System" und wendet die Kombination von "Globaler KI + Weltraum - Erd - Integration" an, um mit seiner Ökosystem - Stärke einzelne Technologien zu überwältigen.

DeepRoute.ai, der radikale Akteur, unterscheidet sich von den anderen drei grundlegend. Es ist nicht nur einer der wenigen Anbieter von Lösungen für intelligente Fahrerassistenz, die an der Entwicklung des VLA arbeiten, sondern hat die anderen bereits hinter sich gelassen und ist in die Serienproduktion eingestiegen. Wenn alles glatt geht, werden im Mitteljahr Fahrzeuge mit DeepRoutes VLA auf den Straßen unterwegs sein.

Während andere erst mit der Forschung beginnen, ist DeepRoute bereits in der Serienproduktion? Wenn man sich die Entwicklungspfade von DeepRoute.ai genauer ansieht, wird klar, dass es eigentlich immer an der Spitze war. 2020 hat DeepRoute.ai das "Kartierungsfreie" intelligente Fahrerassistenzsystem vorgeschlagen, und erst 2024 hat diese Idee an Popularität gewonnen. 2024, als die Automobilhersteller viel über das End - to - End - System sprachen, war DeepRoutes End - to - End - System bereits in Serienproduktion. 2025, als alle um die Marktanteile im End - to - End - Bereich kämpfen, ist DeepRoutes nächste Generation VLA bereits in der Serienproduktion.

Zhou Guang hat einmal offen gesagt, dass er der "Enkelmann" der chinesischen Technologie für intelligente Fahrerassistenz sei. Wenn man das jetzt betrachtet, ist das auch nicht verwunderlich.

In jeder Branche ist es ein Konsens, dass der Nachzügler den Kürzeren zieht, und die Branche der intelligenten Fahrerassistenz ist da keine Ausnahme. Alle Automobilhersteller wollen an der Spitze sein. In einer solchen Situation zeigt sich der Vorteil der Wahl eines "reifen und zuverlässigen" Drittanbieters.

Unternehmen, die bereits in die Serienproduktion eingestiegen sind, haben bereits eine technologische Schutzmauer errichtet. Dank der Fähigkeit des VLA - Systems zur langfristigen Inferenz und globalen Entscheidungsfindung wird die tatsächliche Nutzungsfrequenz des urbanen NOA deutlich erhöht, was wiederum dazu führt, dass das Unternehmen größere Mengen an hochwertigen Daten aus realen Szenarien sammeln kann. Basierend auf dem Scaling Law wird die Verbesserung der Datenmenge die Iteration der Algorithmusleistung fördern und das Benutzererlebnis weiter verbessern.

DeepRoute.ai ist nicht nur bereits in die Serienproduktion eingestiegen, sondern hat auch eine Partnerschaft mit Qualcomm eingegangen. Durch die intensive Forschung auf der Ebene der Operator - Entwicklung besteht in Zukunft die Möglichkeit, das VLA - Modell auf mehr Chip - Plattformen zu portieren und sowohl die reine Kameravision als auch die Lidar - Version zu unterstützen. Dies bedeutet, dass DeepRoute als Drittanbieter eindrucksvoll gezeigt hat, was "gute Arbeit, wenig Probleme und Kompatibilität mit allen" bedeutet.

Naturgemäß ist es nicht unmöglich, dass die Nachzügler aufholen können. Dies würde jedoch nicht nur enorme finanzielle Mittel erfordern, sondern man befürchtet vor allem, dass, wenn man nach viel Mühe etwas erreicht hat, die anderen bereits in die dritte oder vierte Generation der Technologie gewechselt sind, und man so die beste "Goldene Periode" für die Entwicklung verpasst.

Zusammengefasst bringt es keinen Nutzen. Wie der Schriftsteller Zhang Dai sagte: "Man sollte nicht einen Stier halten, nur um eine Tasse Milch zu bekommen." Da es bereits reife Betriebe gibt, bei denen die Zucht (die zugrunde liegende Logik), die Pflege (die Erweiterungsfähigkeit der KI - Technologie) und die Produktion (die Serienproduktionsfähigkeit) alle reif sind, ist es wirklich nicht notwendig.

Als 2023 die Ankündigung kam, dass das FSD BetaV12 (Testversion der vollständigen Autonomie) vollständig auf die End - to - End - Architektur umgestellt würde, hat dies in gewisser Weise das Verständnis der Branche umgeworfen. Als Tesla die noch nicht voll ausgereifte Version V13 nach China brachte, hat es erneut Wellen in der chinesischen Branche der intelligenten Fahrerassistenz geschlagen. Die Geschäftsführer der Automobilhersteller sind ständig besorgt, ob ihr Herz die Auswirkungen auf ihre eigenen Produkte standhalten kann, wenn Tesla die Daten in China auffüllt.

Derzeit haben die führenden Unternehmen im Bereich der chinesischen intelligenten Fahrerassistenz bereits die Serienproduktion erreicht, und die Ingenieurleistungsfähigkeit aller Unternehmen liegt auf