He Xiaopeng: Wir werden sicherlich mehr Roboter als Autos verkaufen, wenn es zehn Jahre später ist.
Text | Xiao Man
Redaktion | Li Qin
Am 5. November konnte He Xiaopeng nach der Veröffentlichung der Physical AI-Strategie die ganze Nacht nicht schlafen. Im Internet war es wegen des IRON-Roboters von XPeng in Aufruhr, und einige behaupteten, der von XPeng gezeigte Roboter sei ein Mensch in einer Kostüm.
Dafür hat He Xiaopeng heute Morgen noch ein Video aufgenommen, um die Dinge zu klären. Er las lächelnd eine Kommentare vor: „Das Gehen ist noch geschmeidiger als das des Roboters von Tesla. Das ist unmöglich, es muss ein Mensch sein.“ Dann ging er hinter den Roboter, zog die Reißverschluß auf und zeigte den Kühler am Rücken des Roboters. Anschließend ließ er den Roboter noch einmal umhergehen.
Diese Technologie-Demo war bereits besser als He Xiaopeng es sich am besten vorgestellt hatte. Viele chinesische Automobilhersteller behaupten, sie wollten eine AI-Firma werden, aber XPeng war das erste, das etwas Zeigte und es den Leuten in den Sinn brachte.
Nach He Xiaopengs Meinung wird das Large Model in Zukunft das „Betriebssystem der Physical AI-Welt“ und die Grundlage für alle Physical AI-Anwendungen.
XPeng hat auch auf diesem Tech Day das erste serienmäßige Large Model für die physische Welt, das „zweite Generation VLA“, vorgestellt, bei dem der Zwischenschritt der Sprachübersetzung entfällt. Laut He Xiaopeng ist das zweite Generation VLA sowohl ein Bewegungsgenerierungsmodell als auch ein physisches Weltmodell für das Verständnis und die Vorhersage.
XPeng versucht, den Maschinen schrittweise die Fähigkeit zu verleihen, die Welt zu verstehen, mit ihr zu interagieren und sie zu verändern. Die Erforschung dieser grundlegenden Technologien wird sich auf intelligente Autos, Roboter und Flugautos auswirken.
Das sind alle die trendigsten Erzählungen im heutigen Technologiebereich. Musk hat in den letzten Jahren immer wieder betont, dass Tesla die weltweit stärkste Physical AI-Firma (Künstliche Intelligenztechnologie, die die reale Welt verstehen und mit ihr interagieren kann) sei. Tesla hat bereits massive Investitionen in Robotaxi und humanoide Roboter getätigt und kürzlich auch bekannt gegeben, dass es einen Prototyp eines Flugautos vorstellen werde.
Das Erzählungsgerüst von XPeng ist ähnlich wie das von Tesla, aber nicht völlig identisch.
He Xiaopeng erwähnte in einem Gespräch nach der Veranstaltung, dass das Ökosystem von XPeng offener sei, was es von Tesla unterscheide. Es wird mit Alibaba Amap zusammenarbeiten, um ein Robotaxi-Fahrtennetz aufzubauen. Der Vorteil davon ist, dass jede Filiale von XPeng die Geschäftstauglichkeit unabhängig überprüfen kann und die Ressourcen jederzeit neu anordnen kann, um die finanziellen Belastungen zu reduzieren.
Nach einer Anpassungsphase von zwei Jahren ist die Liefermenge von XPeng wieder auf dem Wachstumskurs – zwei Monate lang hintereinander überstieg sie 40.000 Einheiten. Die vorübergehende finanzielle Sicherheit hat He Xiaopeng wieder die Zuversicht gegeben, „weitere Geschichten zu erzählen“.
„Warum glaubt XPeng immer weniger, dass man nur durch Herstellen eines größeren, schöneren, billigeren und höherwertigen Autos gewinnen kann? Dies ist zwar eine notwendige Bedingung für den Erfolg, aber keine hinreichende. Es ist wichtig, die Hardware gut zu machen, das ist die Grundlage, aber man muss auch die Software gut machen.“
Die Geschichte der Physical AI ist zwar spannend, aber die aufeinanderfolgenden Qualitätseinzugsaktionen von XPeng, Xiaomi bis hin zu Li Auto in diesem Jahr warnen die Geschäftsführer dieser Unternehmen, dass die industrielle Logik und die inhärenten Eigenschaften von Autos sich nicht geändert haben. Bei der Herstellung eines zuverlässigen Automobilprodukts muss man immer noch vorsichtig vorgehen.
Selbst das von der Branche gefeierte Robotaxi steht vor einer Reihe von gesetzlichen und technischen Problemen bei seiner Realisierung, und niemand hat bewiesen, dass dieses Geschäftsmodell profitabel und skalierbar ist. Der Roboter ist eine noch weiter entfernte Geschichte.
XPeng hat eine ähnliche Technologie-Strategie wie Tesla, was XPeng Raum für Vorstellungskraft und Möglichkeiten lässt. Doch muss es weiterhin beweisen, dass es über genügend Eigenkapital verfügt, um wie Tesla dauerhaft in Physical AI zu investieren.
Im Folgenden ist ein Gespräch zwischen 36Kr Auto und anderen Medien mit He Xiaopeng, dem Vorsitzenden von XPeng Auto. Der Inhalt wurde bearbeitet:
Frage: Warum beharrt XPeng darauf, beim Bau von Robotern eine hohe Anthropomorphie zu erreichen? Die hohe Anthropomorphie entspricht einem sehr hohen Investitionskostenaufwand. Wie trifft XPeng Auto die Abwägungen und Entscheidungen?
He Xiaopeng: Ich denke, dass es in Zukunft verschiedene Formen von hochgradigen Robotern geben wird, aber der anthropomorphe Roboter hat drei Vorteile:
Erstens, um einen intelligenten Roboter zu bauen, kann man keine Regeln verwenden, sondern muss ihn mit AI ansteuern. Und nur aus der menschlichen Welt kann man die meisten Daten lernen.
Zweitens, die meisten Szenarien in dieser Welt, wie z.B. Haushalte und Fabriken, sind für Menschen entworfen, gebaut und betrieben. Je anthropomorpher der Roboter ist, desto leichter kann er sich an diese Welt anpassen.
Drittens, aus Kaufsicht ist ein anthropomorpher Roboter für Menschen eher sympathisch, was möglicherweise zu einer höheren Verkaufszahl führt. Je mehr verkauft werden, desto leichter kann die Skalierung erreicht werden, und mit der Skalierung sinken die Kosten. Somit entsteht ein positiver Zyklus.
Frage: Wie hoch ist der Wiederverwendungsanteil der Komponenten zwischen den neuen Robotern und den Autos von XPeng?
He Xiaopeng: Ich habe keine genauen Zahlen, aber viele Prozesse sind gleich, wie z.B. die Wahrnehmung und die Domänencontroller. 70% der AI-Software ist identisch, aber die Gelenke und die Haut des Roboters gibt es nicht bei den Auto-Komponenten.
Frage: Welchen Anteil soll der Physical AI-Business am Umsatz von XPeng Auto erreichen?
He Xiaopeng: Der globale Automarkt hat einen Umsatz von Billionen von US-Dollar pro Jahr, und es werden 90 Millionen Autos produziert. Ich persönlich denke, dass der Markt für Roboter 20 Billionen US-Dollar wert sein wird, aber das wird wahrscheinlich 10 bis 20 Jahre dauern und wird nicht so schnell geschehen.
Die Entwicklung des Automarktes verläuft oft auf einer eher flachen Kurve, da das Auto eng mit strengen Sicherheitsvorschriften und Politik verbunden ist. Aber wenn der Roboter den technologischen und produktspezifischen Wendepunkt erreicht, wird es ein sehr schneller Wachstum geben.
Ich habe mir nicht ausgemalt, wie viele Roboter wir in zehn Jahren pro Jahr verkaufen werden, aber ich denke, es sollte definitiv mehr sein als Autos.
Frage: Viele Robotaxi-Firmen sind noch nicht profitabel. Wie stellt XPeng Auto sicher, dass es beim Robotaxi-Projekt profitabel wird? Wie unterscheidet sich das Geschäftsmodell von dem anderer Robotaxi-Firmen? Und wie bewerten Sie die Konkurrenz?
He Xiaopeng: XPeng ist möglicherweise eine andere Art von Robotaxi-Firma. Wir haben serienmäßige Fahrzeuge mit vorkonfigurierten Technologien gebaut. Unsere Denkweise ist nicht, dass die Technologie vorangeht, sondern dass wir überprüfen, ob das, was wir tun, einen wirtschaftlichen und Nutzerwert hat, ob es einen technologischen Wendepunkt bilden kann und ob die Regierung und die Gesellschaft es akzeptieren.
XPeng wird auch Fahrzeuge mit Robo-Selbstfahrfunktion einführen, die an Endverbraucher verkauft werden können. Dadurch können die BOM-Kosten (ein wesentlicher Bestandteil der Kosten in der Produktentwicklung, Beschaffung, Herstellung und Montage von Automobilherstellern) und die Forschungs- und Entwicklungsausgaben erheblich reduziert werden. Darüber hinaus können die Kosten für das Robotaxi von XPeng und die Autos von XPeng aufgeteilt werden. Diese beiden Kosten haben im Vergleich zu anderen Firmen von Natur aus einen Vorteil von einigen Prozent oder sogar mehreren Faktoren.
Außerdem benötigen wir keine hochauflösenden Karten, keine Straßenaufnahmen und keine Lidar-Sensoren. Wir denken eher wie ein Mensch in der physischen Welt, daher haben wir eine größere Reichweite und Generalisierbarkeit und benötigen keine Implementierungskosten.
Ich bin fest davon überzeugt, dass zukünftige vierrädrige Verkehrsmittel eine Kombination aus geteiltem und privatem Besitz sein werden. Ich glaube nicht, dass alle Autos zu Robotaxis werden. In diesem Fall bietet XPeng im Robotaxi-Bereich ein „Toolkit“ an, das Fahrzeuge, Software und SDK-Schnittstellen enthält. Wir öffnen uns unseren Partnern in verschiedenen Ländern und Regionen und geben ihnen die Möglichkeit, unsere Robotaxis zu betreiben.
Frage: Warum hat XPeng zuerst eine globale Ökosystem-Zusammenarbeit mit Amap eingegangen?
He Xiaopeng: Weil ich früher in Amap gearbeitet habe, ist es wie meine ehemalige Firma. Zweitens ist Amap eine sehr große Mobilitätsplattform in China. Wenn sie die Betreuung übernimmt und wir das Toolkit zur Verfügung stellen, denke ich, dass dies beider Strategien entspricht.
Frage: XPeng hat auf der Pressekonferenz erwähnt, dass es nächstes Jahr drei Robotaxi-Modelle einführen wird. Was sind die Unterschiede zwischen diesen drei Modellen?
He Xiaopeng: Die Preise sind unterschiedlich. Wir haben verschiedene Robotaxi-Modelle in verschiedenen Preisklassen, um die Bedürfnisse verschiedener Kunden zu erfüllen. Außerdem gibt es 7-Sitzer-, 6-Sitzer- und 5-Sitzer-Versionen. Vorerst werden nur diese Informationen preisgegeben. Diese drei Modelle erfüllen verschiedene Robotaxi-Anforderungen.
Frage: Warum wurde auf der Pressekonferenz nicht über L3 gesprochen, sondern direkt auf L4 zugegangen? Hängt der Fortschritt der L3-Produkte an den Gesetzen und Vorschriften?
He Xiaopeng: Ich denke, dass es in Zukunft nur L2 und L4 geben wird, keine L3, denn L3 ist weder L2 noch L4.
Frage: Hat das zweite Generation VLA (Vision-Language-Action) von XPeng wirklich das „L“ vollständig entfernt oder in andere Formen von Token umgewandelt?
He Xiaopeng: Wir haben V+L. Wir haben es nicht in menschliche Sprache und Format umgewandelt, sondern in eine neue Sprache der physischen Welt. Es ist keine von Menschen sichtbare und erkennbare Sprache, ist sehr effizient und reichhaltiger. Zweitens kann es im Decoding (Entschlüsselung) eingesetzt werden, und wir können den gesamten Prozess ableiten. Zum Beispiel können wir erklären, warum es links gehen sollte, aber es nicht tut. All dies haben wir bereits in der Bewertung des physischen Weltmodells erreicht.
Frage: Auf der XPeng Auto Tech Day wurde Physical AI auf verschiedenen Plattformen angewendet. Welche Vorstellungen haben Sie für zukünftige Anwendungsfälle und Plattformen von Physical AI? Darüber hinaus nimmt der technologische Wettlauf zwischen China und den USA zu. Welche Seite hat in der Physical AI-Branche einen größeren Entwicklungspotenzial?
He Xiaopeng: Firmen, die früher starten, haben einen größeren Vorteil. Ein sehr wichtiger Aspekt der heutigen Physical AI ist der First-mover-Vorteil, der in der vergangenen physischen Welt und auf der Erde nicht zu sehen war. In Zukunft werden Daten der wichtigste Faktor sein. Wir haben in den letzten Monaten beobachtet, dass der Fortschritt vieler Large Model-Firmen in der digitalen Welt verlangsamt hat. Ich denke, dass die Ursache nicht in der Algorithmen, dem Modell, der Rechenleistung oder der Stromversorgung liegt, sondern in den Daten.
Im Bereich der Physical AI denke ich, dass jeder eine Chance hat. Der Kern ist, wer zuerst etwas richtig macht und gute Ingenieurskenntnisse hat. Es ist wichtig, dass die Technologie gut umgesetzt werden kann und eine gute Benutzererfahrung und Service bieten kann. Dadurch entsteht ein großer Zyklus.
Deshalb glaubt XPeng auch nicht, dass man nur durch Herstellen eines größeren, schöneren, billigeren und höherwertigen Autos gewinnen kann. Dies ist zwar eine notwendige Bedingung für den Erfolg, aber keine hinreichende. Es ist wichtig, die Hardware gut zu machen, das ist die Grundlage, aber man muss auch die Software gut machen. Deshalb habe ich auf der Tech Day fast zwei Stunden über Physical AI gesprochen. Ich denke, dass die Entwicklung der Physical AI erst beginnt, wenn die physische Welt und die digitale Welt organisch kombiniert werden und die Kundenerwartungen erfüllt werden.
Frage: Tesla erforscht derzeit auch Flugautos. Tesla und XPeng sind möglicherweise die beiden Firmen mit der höchsten Geschäftsüberschneidung weltweit. Wo liegt der größte Unterschied zwischen XPeng und Tesla?
He Xiaopeng: Wir und Tesla haben beide einen Ansatz gefunden, um in verschiedenen Bereichen zu kombinieren und die Dimensionen zu wechseln. Zum Beispiel haben wir das VLA in den Roboter integriert. Früher wurden die Fußgelenke des Roboters mit verstärktem Lernen gesteuert, daher konnten die Füße, die Hüfte, die Hände, der Kopf, der Hals und die Schultern des Roboters nicht kooperieren. Man musste die gesamte Logik aufgeben. Dies war die beste Lösung für die damalige Technologie, aber es ist nicht mehr optimal für die neue Technologie.
Ich weiß nicht genau, wie Tesla Flugautos entwickelt, aber ich denke, dass beide Firmen in eine andere Dimension wechseln, um Schnittstellen zu erschaffen. Tesla entwickelt die Technologie selbst, aber kombiniert und innoviert in verschiedenen Bereichen.
Ich möchte Ihnen etwas über das VLT (Vision-Language-Task/Thought) des Roboters erzählen. Sobald das Gehirn des Roboters reif ist, werden wir es in das nächste Generation von Autos integrieren. Sie werden sehen, dass unzählige neue Logiken an einem bestimmten Punkt zusammenkommen. Das wird interessant.
Gu Hongdi: Ich denke, es gibt zwei Punkte, die bei einem Vergleich zwischen Tesla und uns beachtenswert sind. Ein ähnlicher Punkt ist, dass wir beide nicht auf kleine Nischenmärkte fokussieren, sondern das Ziel haben, eine Massenproduktion zu erreichen. Der Unterschied ist, dass das Ökosystem von XPeng sehr offen ist, was es von Tesla unterscheidet.