StartseiteArtikel

Während der acht-tägigen langen Ferienzeit ist das intelligente Fahrassistenzsystem in einen "chaotischen Kampf" geraten.

财经无忌2025-10-16 08:59
Jeder bringt seine Stärken ein, um das Ziel zu erreichen.

In den vergangenen Nationalfeiertagsferien war der Verkehr so chaotisch wie die Künstliche-Intelligenz-Fahrmarken still.

Eine Meldung von CCTV-Net zeigt, dass während der Nationalfeiertage im Durchschnitt 12,5 Millionen Elektromobile pro Tag auf den Straßen unterwegs waren. Diese Zahl ist im Vergleich zum Vorjahr um 30 % gestiegen und um 70 % höher als an normalen Tagen.

Der enorme Reisebedarf hat komplexe Verkehrsszenarien geschaffen und bietet eine ausgezeichnete Gelegenheit, die Effektivität von Künstliche-Intelligenz-Fahrprodukten zu testen.

Aus diesem Grund war der Nationalfeiertag in den letzten Jahren oft der Höhepunkt, an dem Automobilhersteller ihre Erfolge in der Künstliche-Intelligenz-Fahrt prahlten:

Im Jahr 2023 waren in der ersten Woche nach den Nationalfeiertagen die Reiseberichte von Marken wie NIO, XPeng, Li Auto, ZEEKR und Avatr bereits veröffentlicht.

Im Jahr 2024, das von der Branche als das „Jahr der Künstliche-Intelligenz-Fahrt“ bezeichnet wird, wurden die Erfolgsmeldungen von Huawei und Li Auto bereits innerhalb von 48 Stunden nach Ende der Ferien veröffentlicht.

Im Vergleich dazu waren die Automobilhersteller nach diesem Nationalfeiertag mit einem starken Anstieg der Reisenden recht stillschweigend.

Bis jetzt ist in den Informationskanälen der meisten führenden Elektromobilhersteller, mit Ausnahme von Huawei und Xiaomi, keine Meldung über die Künstliche-Intelligenz-Fahrt zu finden.

Dagegen hat die Elektromobilbranche mit einer anderen großen Nachricht die Richtung der Entwicklung in der Künstliche-Intelligenz-Fahrt markiert.

Öffentliche Informationen zeigen, dass in der ersten Woche nach den Nationalfeiertagen 2025 sowohl das Künstliche-Intelligenz-Fahrteam von XPeng als auch das von NIO erhebliche Personal- und Organisationsstrukturänderungen erfahren haben, darunter auch die Veränderung mehrerer Führungskräfte. Insbesondere bei XPeng wurde der Leiter des Autonom-Fahrzentrums gewechselt. Li Liyun tritt von seiner Position zurück und wird von Liu Xianming, dem Leiter des Weltmodells, ersetzt.

Das Stillschweigen bei den Erfolgsmeldungen und die Personalwechsel zeigen, dass sich hinter der Veränderung von „Jahr der Künstliche-Intelligenz-Fahrt“ im Jahr 2024 zu „Jahr der breiten Künstliche-Intelligenz-Fahrt“ im Jahr 2025 die Spielregeln in diesem Bereich bereits verändert haben.

1. Im Jahr der breiten Künstliche-Intelligenz-Fahrt hat die Branche eine neue Spielweise

Von der Abnahme der Lautstärke der Erfolgsmeldungen bis hin zu den Anpassungen der Geschäftsteams zeigt sich ein offensichtlicher Trend:

Von „Jahr der Künstliche-Intelligenz-Fahrt“ zu „Jahr der breiten Künstliche-Intelligenz-Fahrt“ geht es in der Branche nicht mehr um die Zahlen des Marktdurchstiegs, sondern um die „harten Kämpfe“ auf technischer Ebene.

Dies lässt sich bereits in den Künstliche-Intelligenz-Fahrdaten der Automobilhersteller erkennen.

Nehmen wir das Huawei-Konzern als Beispiel. Öffentliche Informationen zeigen, dass die Fahrzeuge in Kooperation mit Huawei Kunpeng während der Nationalfeiertage 2025 eine Gesamtfahrstrecke von 294 Millionen Kilometern mit Assistentenfahrfunktion zurückgelegt haben, darunter 243 Millionen Kilometer auf der Autobahn und 51 Millionen Kilometer in der Stadt.

Was hat sich im Vergleich zu den Daten des Vorjahrs geändert? Zwei Punkte sind hierbei besonders bemerkenswert:

Erstens die Gesamtfahrstrecke der Künstliche-Intelligenz-Fahrt. Während der Nationalfeiertage 2025 war die Gesamtfahrstrecke der Künstliche-Intelligenz-Fahrt der Fahrzeuge des Huawei-Konzerns das 3,4-fache des Vorjahrs, und der Anteil der aktiven Nutzer der Assistentenfahrfunktion lag bei 90,8 %.

Zweitens der Anteil der Assistentenfahrfunktion in der Stadt. Während der Nationalfeiertage 2025 betrug der Anteil der Assistentenfahrstrecke in der Stadt 17,3 %, was nur eine geringe Steigerung gegenüber dem Vorjahr darstellt. Entsprechend ist die durchschnittliche Geschwindigkeit der Assistentenfahrfunktion in der Stadt im Vergleich zu den Nationalfeiertagen des Vorjahrs um 1,5 km/h gesunken.

Aus diesen beiden Punkten lässt sich leicht schließen, dass es für Elektromobilhersteller kein Problem mehr ist, die Nutzer zu überzeugen, die Künstliche-Intelligenz-Fahrt auf der Autobahn zu testen.

Umgekehrt bedeutet dies, dass der Schlüssel zur breiten Einführung der Künstliche-Intelligenz-Fahrt nicht auf Autobahnen mit wenig Verkehr, sondern in engen und unvorhersehbaren Stadtstraßen liegt.

Für die Automobilhersteller, die in einem harten Wettbewerb stehen, ist es entscheidend, nach dem Wettlauf um Kühlschränke, Fernseher, Batterielaufzeit und Ladeeffizienz die ersten L3- und L4-Künstliche-Intelligenz-Fahrfunktionen in der Stadt anzubieten, um in den Kapital- und Verbrauchsmärkten einen Vorsprung zu erlangen.

Technisch gesehen ist die Künstliche-Intelligenz-Fahrt in der Stadt der „Lange Schwanz“ der bisherigen Technologieentwicklung.

Seit Tesla 2019 die End-to-End-Technologie eingeführt hat, wird diese Methode, die Künstliche-Intelligenz-Fahrmodelle durch die Erfassung von echten Fahrdaten zu trainieren, von Automobilherstellern weltweit weitgehend übernommen. Diese Technologie hat zwar in kurzer Zeit die schnelle Entwicklung und Iteration der Künstliche-Intelligenz-Fahrmodelle gefördert, aber auch Schwächen in der praktischen Anwendung aufgedeckt:

Insbesondere in der Stadt treten plötzlich auftauchende Elektromobile, Fußgänger, temporär gesperrte Straßen und Fahrer, die gegen die Regeln fahren, auf. Diese Faktoren, die die Verkehrssicherheit gefährden, treten in traditionellen Fahrdaten nur selten auf, und die Künstliche-Intelligenz-Fahrmodelle können aus diesen fragmentierten und zufälligen Daten nur schwer lernen und reagieren.

Die Einschränkungen des End-to-End-Modells machen die Notwendigkeit einer „Technologieinnovation“ in der Künstliche-Intelligenz-Fahrt immer dringender.

Deshalb hat in den letzten zwei Monaten, seit Li Auto, XPeng und DeepRoute.ai nacheinander die Einführung des VLA-Großmodells in die Fahrzeuge angekündigt haben und Huawei und NIO auf das WA-Modell fokussiert haben, eine „Epoche der großen Entdeckungen“ in der Künstliche-Intelligenz-Fahrt begonnen.

Wie werden die Teilnehmer in dieser neuen Ära entscheiden?

2. Wie bestehen die „Klassenbester“ die Prüfung in der Künstliche-Intelligenz-Fahrt?

Bis jetzt haben die führenden Marken in Bezug auf das traditionelle End-to-End-Modell drei verschiedene Entwicklungspfade eingeschlagen.

Wenn wir es mit dem Lernen vergleichen:

Die „Reformisten“ unter Führung von Momenta glauben, dass das Problem in der „Lernphase“ der Künstliche-Intelligenz-Fahrt liegt. Im traditionellen End-to-End-Modell ist die Qualität der Daten, die an das Großmodell gegeben werden, nicht gut genug, und die „Fehlversuche“ und „Belohnungen“ im Lernprozess sind nicht ausreichend.

Deshalb befürwortet Momenta die Einführung eines einstufigen End-to-End-Modells auf der Grundlage von verstärktem Lernen, um das traditionelle Modell zu ersetzen. Im Vergleich zu den traditionellen Großmodellen hat das Momenta R6-Flywheel-Großmodell, das anspruchsvollere Aufgaben bearbeitet (wie Umfahrungen von Baustellen und die Vermeidung von Hindernissen in der Nacht), tatsächlich eine bessere Leistung gezeigt.

Im Gegensatz dazu konzentrieren sich die „Praktiker“ unter Führung von Li Auto, XPeng und DeepRoute.ai auf die Optimierung der „Prüfungsdetails“. Wie beim Lernen und Prüfen kann man auch bei der Künstliche-Intelligenz-Fahrt nicht einfach die Lösungen von ähnlichen Aufgaben übernehmen, sondern muss immer auf die versteckten Fallstricke achten.

Selbst die besten Großmodelle in der Künstliche-Intelligenz-Fahrt müssen die Probleme individuell analysieren und die Fähigkeit zur Beobachtung, zum Schlussfolgern und zur Entscheidungsfindung entwickeln.

Das ist auch der Ursprung des VLA-Technologiekonzepts. Im Gegensatz zum „Datenmapping“ des traditionellen End-to-End-Modells kann das VLA-System durch die Integration von visuellen, sprachlichen und aktionsorientierten Modalitäten die visuell wahrgenommenen Informationen in sprachliche Beschreibungen umwandeln, dann durch das Sprachmodell logische Schlussfolgerungen ziehen und schließlich konkrete Handlungsanweisungen ausgeben. Es kann sogar die Verkehrssituation in einem Zeitraum von mehreren zehn Sekunden vorhersagen.

Die Kosten für diese Methode sind offensichtlich. Da es einen zusätzlichen Schritt gibt, ist der Bedarf an Rechenleistung und Daten des VLA-Systems viel höher als bei allen traditionellen Künstliche-Intelligenz-Fahrmodellen. Einige Medien haben geschätzt, dass die Kosten für einen einzelnen Trainingseinsatz des VLA-Systems das 1,5-fache von DeepSeek-V3 betragen.

Deshalb müssen Marken wie XPeng und Li Auto mehr in die Rechenleistung investieren und riesige Cloud-Trainingscluster aufbauen, um die täglichen Trainings des VLA-Modells zu unterstützen.

Öffentliche Daten zeigen, dass bis August 2025 in der Rangliste der Cloud-Rechenleistung der Weltautomobilhersteller Tesla mit einer Cloud-Rechenleistung von etwa 100 EFLOPS weit vorne liegt. Die Rechenleistung der anderen führenden Künstliche-Intelligenz-Fahrmarken wie Li Auto (8,1 EFLOPS), XPeng (10 EFLOPS) und Xiaomi (11,4 EFLOPS) ist im Allgemeinen um eine Größenordnung niedriger. Bei Marken wie Nezha, deren Rechenleistung noch um zwei Größenordnungen niedriger ist, reicht die Cloud-Rechenleistung fast nicht aus, um das VLA-System effizient zu trainieren.

Trotzdem ist die aktuelle Leistung des VLA-Systems für einige Marken noch nicht ausreichend. In der Ansicht der „Idealisten“ unter Führung von Huawei und NIO ist sowohl das traditionelle End-to-End-Modell als auch das VLA-System im Wesentlichen eine „Aufgabenflut-Strategie“, die auf die Bereitstellung einer großen Menge an Fahrdaten basiert. Im Vergleich dazu ist es für die Künstliche-Intelligenz-Fahrt wesentlich, die Lehrbücher und Prüfungsvorlagen zu verstehen, um bei jeder Situation zurechtzukommen.

Daraus ist die radikalste Technologie in der Künstliche-Intelligenz-Fahrt – das WA (World Model, Weltmodell) – entstanden.

Im Gegensatz zur Logik des VLA-Systems („Visuell-Text-Entscheidung“) besteht der Kern des WA-Modells darin, die reale Welt in der Cloud zu simulieren und für die Künstliche-Intelligenz-Fahrt eine „virtuelle digitale Welt“ zu schaffen. Dadurch kann das Künstliche-Intelligenz-Fahrmodell in der virtuellen Welt die Logik der realen Welt lernen und verstehen und so in realen Fahrgelegenheiten problemlos agieren.

Wang Jun, der Leiter der ADS-Forschung und -Entwicklung bei Huawei, hat einmal einen anschaulichen Vergleich gemacht: „Wenn man das Künstliche-Intelligenz-Fahrssystem als einen Schüler ansieht, versucht das VLA-System, die Prüfung durch das Lösen von unzähligen Aufgaben zu bestehen und ist hilflos, wenn es auf eine unbekannte Aufgabe stößt. Das WA-System versteht jedoch zuerst die Lehrinhalte und kann die Lösung für jede neue Aufgabe ableiten.“

Ähnlich hat Li Bin von NIO in einer internen E-Mail gesagt: „Das WA-System gibt dem Auto ‚Phantasie‘ statt ‚Gedächtnis‘.“

Interessanterweise war Liu Xianming, der in der Personaländerung der neue Leiter des Künstliche-Intelligenz-Fahrteams von XPeng wird, zuvor der Leiter des Weltmodells. Dies wird von außen als ein Schritt von XPeng in Richtung des WA-Modells interpretiert.

Natürlich muss die radikalste Technologie auch die härtesten Prüfungen bestehen.

Abgesehen von den noch höheren Kosten für die Forschung und Entwicklung als beim VLA-System ist das WA-System derzeit noch weit davon entfernt, in der Praxis effektiv und zuverlässig eingesetzt zu werden.

Im Gegensatz dazu ist das VLA-System bereits in die Produkte integriert und ist ein wichtiger Verkaufspunkt für die Verbraucher. Bis jetzt hat das erste reine Elektro-SUV i8 von Li Auto, das im Juli 2025 vorgestellt wurde, das VLA-Großmodell integriert. Gleichzeitig hat das G7 Ultra von XPeng nach einer OTA-Aktualisierung im September 2025 das neueste VLA-Modell erhalten.

Im Vergleich dazu befinden sich Huawei und NIO, die sich auf das WA-Modell konzentrieren, noch in der „Vormacht“ einer technologischen Explosion.

Für die meisten Marken ist das Spiel