Wenn er verliert, muss er nackt herumlaufen. He Xiaopeng macht eine Wette, dass er bis August nächsten Jahres die FSD von Tesla einholen will.
Er ist wirklich am Ende seiner Geduld! He Xiaopeng hat Druck auf das Team für autonome Fahrfunktionen ausgeübt.
He Xiaopeng setzt einen Wetteinsatz: Bis nächstes Jahr soll die Technologie von XPeng die FSD von Tesla einholen, andernfalls muss der Leiter des Autonomie-Teams nackt rennen
Am 11. Dezember veröffentlichte He Xiaopeng in seinem Freundeskreis eine Nachricht und sagte, dass er gestern in Silicon Valley das neueste FSD V14.2 von Tesla und ein Robotaxi getestet und verglichen habe. Er sei der Meinung, dass Tesla jetzt in die Phase des quasi-L4-Fahrens eingetreten sei. Obwohl es noch Mängel gebe, habe die Technologie gegenüber dem vergangenen Jahr einen großen Sprung gemacht.
Er erwähnte auch, dass aus Zeitgründen die erste Version der zweiten Generation von XPengs VLA noch nicht alle Fähigkeiten der aktuellen FSD V14.2 von Tesla erreichen könne.
Aber er hat mit seinem Team für autonome Fahrfunktionen gewettet: Wenn bis zum 30. August 2026 die VLA von XPeng in China die gleichen Ergebnisse wie die FSD V14.2 von Tesla in Silicon Valley erzielen kann, wird er in Silicon Valley ein chinesisches Restaurant eröffnen;
Wenn dies nicht gelingt, hat sich Liu Xianming, Leiter des Autonomie-Zentrums von XPeng, verpflichtet, nackt über die Golden Gate Bridge zu rennen.
Die Hauptbrücke der Golden Gate Bridge ist 1967 Meter lang, da wird es sicherlich nicht wenige Zuschauer geben.
XPeng Motors hat bereits angekündigt, dass die zweite Generation von VLA im ersten Quartal 2026 offiziell veröffentlicht und an alle Ultra-Modelle ausgerollt werden soll.
Der Zeitraum, auf den der Wetteinsatz bezogen ist, fällt etwa fünf Monate nach der Veröffentlichung der zweiten Generation von VLA, was der kritischen Optimierungszeit von der ersten Version zur reifen Version entspricht und He Xiaopengs Prinzip von "langfristige und stabile Entwicklung" entspricht.
Aber dieser Wetteinsatz scheint ein bisschen unfair zu sein. Wenn das Team verliert, muss der Mitarbeiter nackt rennen. Liu Xianming: Es hat sich eine Welt geschaffen, in der nur ich leide.
Liu Xianming trat im März letzten Jahres bei XPeng ein und übernahm im Oktober dieses Jahres die Leitung der Autonomieabteilung. Er ist also bei XPeng noch weniger als zwei Jahre tätig. Wenn es gut geht, hat er vielleicht schon im nächsten Jahr die Firma verlassen (nur als Scherz).
Wir sind schließlich Erwachsene. Warum sollten wir uns nicht beides wünschen? Was ist, wenn man beides sehen möchte?
He Xiaopeng: Die zweite Generation von VLA kann die L4-Stufe erreichen
Am 11. Dezember, an demselben Tag, an dem er den Wetteinsatz abgab, gab He Xiaopeng in Guangzhou ein Interview für die Zeitschrift "China Entrepreneur" und sagte, dass er in den letzten Monaten bei den Tests der zweiten Generation von VLA das erste Mal das Gefühl bekommen habe:
"Früher dachten wir, dass wir einen guten L2-Fahrassistenten oder einen L2-Fahrassistenten, der fast an L3 herankommt, entwickeln konnten. Aber jetzt sehe ich die Möglichkeit, dass die Obergrenze bei L4 liegen kann. Wenn man uns noch 3 - 5 Jahre Zeit gibt, könnte es sogar L5 werden."
Warum ist He Xiaopeng so zuversichtlich in Bezug auf die zweite Generation von VLA?
VLA ist ein Konzept, das erstmals 2023 von Google DeepMind vorgeschlagen wurde. Es bezieht sich auf die Integration von drei Fähigkeiten - visueller Wahrnehmung, Sprachverarbeitung und Handlungsausführung - in eine Architektur. Es muss keine Aufgabe in mehrere Schritte aufteilen, sondern kann den gesamten Prozess von der Wahrnehmung eines Befehls bis zur Ausführung der Handlung in einem Zug durchführen.
Darüber hinaus kann es nicht nur die Umgebung verstehen, sondern auch wie ein Mensch denken und seine Entscheidungen begründen.
Aktuell setzen neben XPeng Motors auch andere Automobilhersteller wie Li Auto und Great Wall Motors auf VLA.
Es ist wichtig zu beachten, dass das aktuelle VLA-System immer noch einen zweistufigen Prozess erfordert: zunächst die Umwandlung von visuellen Informationen in Sprache und dann die Umwandlung von Sprache in Handlungen.
Deshalb fragt sich XPeng, ob es möglich ist, den Sprachumwandlungsschritt zu eliminieren und direkt von visuellen Signalen zu Handlungsbefehlen zu gelangen.
Bei der XPeng Tech Day im November dieses Jahres hat XPeng offiziell die zweite Generation von VLA vorgestellt. Dabei wurde der Sprachumwandlungsschritt entfernt, und es wurde erstmals eine direkte Generierung von Handlungsbefehlen aus visuellen Signalen realisiert.
Das Modell wurde mit fast einer Milliarde Videosequenzen trainiert, ohne dass manuelle Annotationen erforderlich waren. Dies entspricht der Summe aller extremen Fahrbedingungen, die ein menschlicher Fahrer in 65.000 Jahren fahren würde, also seit der Zeit der Urmenschen bis heute.
Um dieses Modell zu entwickeln, hat XPeng eine Cloud-Rechenleistung von 30.000 GPU-Karten von Alibaba Cloud eingesetzt und ein Basismodell mit 72 Milliarden Parametern implementiert. Eine vollständige Iteration des gesamten Systems wird alle fünf Tage durchgeführt.
Laut He Xiaopeng wird es nächstes Jahr 50.000 GPU-Karten oder sogar mehr geben, sodass die Cloud-Rechenleistung kein Problem darstellen wird.
Vor kurzem besuchte auch Wu Yongming, CEO von Alibaba, persönlich das Hauptquartier von XPeng in Guangzhou und traf sich mit He Xiaopeng.
Darüber hinaus hat das von XPeng selbst entwickelte Turing-AI-Chip eine Rechenleistung von 750 TOPS pro Chip. Ein Fahrzeug ist mit drei Turing-Chips ausgestattet, was eine Gesamtleistung von 2250 TOPS ergibt. Dies ist 4,4 Mal so viel wie das Standard-System mit zwei Orin-X-Chips (508 TOPS) in der Branche.
XPeng sucht immer noch nach Lösungen für das Generalisierungsproblem
Welche Fähigkeiten fehlen der zweiten Generation von XPengs VLA noch, um die neueste FSD V14.2 von Tesla einzuholen?
Eines der Probleme ist die Generalisierung. He Xiaopeng erwähnte, dass in China ein gelbes Ampelsignal bedeutet, dass man bremsen muss. In einigen Ländern jedoch bedeutet ein gelbes Licht nicht, dass man beschleunigen oder bremsen muss, sondern einfach gleichmäßig weiterfahren kann.
Wie man diesen Konflikt löst und eine gute Generalisierung erreicht, ist laut ihm ein Problem, das XPeng noch untersucht.
Da Tesla seine FSD-Technologie schon früh global entwickelt hat, werden über 6 Millionen Testfahrzeuge weltweit eingesetzt. Täglich werden 1,6 Milliarden Bilddaten generiert, und die Gesamtfahrstrecke hat inzwischen die 9,6 Milliarden Kilometer markiert.
Sein "Shadow Mode" (ein System zur Datenerfassung und Lernprozess für autonome Fahrfunktionen) kann Daten in vielfältigen Verkehrsumgebungen weltweit sammeln, einschließlich in Ländern und Regionen mit unterschiedlichen Verkehrsregeln in Europa, Nordamerika und Asien.
Bei einem Test auf einer 20-kilometer langen komplizierten Nebenstraße musste die FSD V13.2.9 von Tesla fünf Mal manuell übernommen werden, während die zweite Generation von XPengs VLA nur einmal übernommen werden musste.
Fahrzeuge mit der zweiten Generation von XPengs VLA können auch Verkehrsleitungen von Polizisten erkennen, Ampelsignale verstehen und frühzeitig auf diese reagieren. Sie können sogar in stürmischen Regennächten sicher fahren.
Aber die neueste FSD V14.2 hat nicht nur die Systemleistung stark verbessert, sondern auch über 95 % der Probleme mit zögerlichen Fahrspurwechseln und ungewöhnlichen Bremsvorgängen aus der Version V13.2.9 behoben. Gleichzeitig wurden mehrere innovative Funktionen eingeführt, die das Fahrerlebnis der autonomen Fahrfunktion noch menschlicher machen.
Natürlich ist die zweite Generation von XPengs VLA noch nicht auf den Markt gekommen, also ist es noch unklar, wie sich das System tatsächlich verhalten wird.
Der Autor hat den Wetteinsatz in sein Notizbuch geschrieben. Nächstes Jahr wird man sehen, wer gewinnt.
Dieser Artikel stammt aus dem WeChat-Account "Tech Daily Push" (ID: apptoday), Autor: Zhao Zhishan. Veröffentlicht von 36Kr mit Genehmigung.