StartseiteArtikel

Steht der Embodied AI im "ChatGPT-Moment" oder naht der Winter? So sehen es die Gründer.

36氪的朋友们2025-11-28 17:00
Embodied Intelligence wächst rasant, ist aber noch weit von einem ChatGPT-Moment entfernt und steht vor einem Kapitalwinter und der Auswahl von Geschäftsmodellen.

Embodied Intelligence ist derzeit in rascher Expansion, doch es besteht noch eine beträchtliche Distanz bis zu einem echten "ChatGPT-Moment". Mehrere Anleger aus dem Bereich der Embodied Intelligence haben der Wirtschaftsbeobachtung erklärt, dass es im nächsten Schritt möglicherweise einen "Kältewinter" geben könnte, bei dem die Finanzierung verschärft wird. Nach der gegenwärtigen Begeisterung wird es eine umfassende Prüfung von Geschäftsmodellen und technologischen Ansätzen geben. Das Überleben könnte zu einem gemeinsamen Problem für Unternehmen in der Embodied-Intelligence-Branche werden.

Ende 2025 wird die Branche der Embodied Intelligence von zwei Kräften vorangetrieben.

Einerseits erlebt sie eine längst nicht mehr gekannte Kapitalwelle. Humanoidroboter gelten als das "nächste Billionen-Dollar-Endgerät", und die Kapitalinteresse steigt stetig. Daten der unabhängigen Datenagentur IT Juzi zeigen, dass das Finanzierungsvolumen für Roboter in China in den ersten drei Quartalen dieses Jahres bereits 38,624 Milliarden Yuan betrug, was das 1,8-fache des gesamten Jahres 2024 ist. Seit November haben Unternehmen wie Yuanli Lingji, Xingchen Intelligence und Jiasu Jinhua eine neue Runde von Finanzierungen abgeschlossen. Die Anleger wenden sich von der reinen Konzeptfinanzierung hin zu einer stärkeren Beachtung der Kommerzialisierungsgeschwindigkeit und des nachweisbaren Werts. Diese Begeisterung erstreckt sich auch auf die Unternehmensseite. Neue Produkte folgen aufeinander, und führende Hersteller kündigen wiederholt "kommerzielle Großaufträge" für Tausende von Einheiten an. Die Rede von einem "Jahr der Serienproduktion" hört man immer wieder.

Andererseits gibt es jedoch Risiken, die nicht ignoriert werden können. Das Silicon Valley-Starunternehmen K-Scale Labs hat eine Insolvenz erlitten, und über hundert vorgemerkte Bestellungen mussten erstattet werden. Das chinesische Startup Yixing Robot hat sich aufgelöst. Beide Unternehmen waren weniger als ein Jahr alt und hatten mehrere Finanzierungsrunden absolvierte. Diese Fälle haben die Branche darauf aufmerksam gemacht, dass das "Jahr der Serienproduktion" nicht unbedingt einen Wendepunkt für die Branche darstellt, sondern eher wie eine kollektive Überlebensprüfung wirkt.

Diese beiden Kräfte weisen gemeinsam auf eine zentrale Tatsache hin: Embodied Intelligence ist derzeit in rascher Expansion, doch es besteht noch eine beträchtliche Distanz bis zu einem echten "ChatGPT-Moment". Mehrere Anleger aus dem Bereich der Embodied Intelligence haben der Wirtschaftsbeobachtung erklärt, dass es im nächsten Schritt möglicherweise einen "Kältewinter" geben könnte, bei dem die Finanzierung verschärft wird. Nach der gegenwärtigen Begeisterung wird es eine umfassende Prüfung von Geschäftsmodellen und technologischen Ansätzen geben. Das Überleben könnte zu einem gemeinsamen Problem für Unternehmen in der Embodied-Intelligence-Branche werden.

Bei der Serienproduktion muss zuerst unterschieden werden, ob es sich um echte oder unechte Nachfragen handelt

In den letzten 12 Monaten hat sich die Leistungsfähigkeit von Humanoidrobotern fast "augenscheinlich" verbessert. Roboter, die 2024 noch nur stabil stehen konnten, können jetzt kontinuierliche Salto's ausführen, mehrere Stunden lang Marathonläufe absolvieren und sogar Fahrzeuge ziehen.

Aber all diese beeindruckenden Bewegungen bedeuten nicht automatisch, dass die Roboter einsatzfähig sind. Fast alle Befragten haben eine ähnliche Einschätzung geäußert: Embodied Intelligence ist noch weit davon entfernt, in reale Szenarien mit hoher Intensität, langer Dauer und wiederholbarer Nachfrage einzudringen.

Anlässlich des Open Days der ZhiYuan Embodied Intelligence 2025 hat Wang Zhongyuan, der Direktor des ZhiYuan Instituts, ein typisches Beispiel gegeben. Sie haben zehn Roboter eines bestimmten Modells gekauft, und binnen ein oder zwei Monaten waren bereits fünf defekt. "Die Hardware-Stabilität befindet sich immer noch in der Forschungsstufe", fügte er hinzu. Im Labor stoppen die Roboterarme häufig aufgrund von Überhitzungsschutzmechanismen, und manche Roboter benötigen sogar einen Ventilator neben sich, "so als hätten sie einen Putzmädchen". In seiner Ansicht wird es in den nächsten ein bis zwei Jahren unmöglich sein, dass "Roboter auf den Straßen herumlaufen". Dies ist die Realität auf der Hardware-Seite und der direkteste Hindernis für eine massenhafte Implementierung.

Die Engpässe auf der Modelseite sind ebenfalls offensichtlich. Große Embodied-Modelle befinden sich immer noch in der Anfangsphase in Bezug auf Steuerungsgenauigkeit, Generalisierung in verschiedenen Umgebungen und Handlungs-Konsistenz. Die Werkzeugketten sind unvollständig, und die Implementierungsstandards sind nicht einheitlich. Es ist viel schwieriger, einem Roboter in einer realen Situation zwei Stunden lang einen Ablauf ausführen zu lassen, als ihm auf einer Messe einmalige Bewegungen ausführen zu lassen.

Daher warnt Wang Zhongyuan, dass die Branche unterscheiden muss, ob die gegenwärtige Serienproduktion aus echter Nachfrage oder aus unechter Nachfrage resultiert, die durch staatliche Subventionen und Kapitalbegeisterung angetrieben wird. Wenn die Anwender feststellen, dass die Roboter nicht den Erwartungen entsprechen, wird die Begeisterung schnell nachlassen, und es könnte sogar zu einer vorübergehenden Blase und einem Tiefstand kommen. "Ich sage den Gründern immer: 'Überlebe zuerst den möglichen Kältewinter, dann kannst du die echte Zukunft der Embodied Intelligence erleben'."

Im Jahr 2025, in dem Kapital, Technologie und Unternehmen gemeinsam beschleunigen, hat die Branche einen Ausbruch erlebt. Viele Unternehmen haben Modelle, Hardware und ganze Geräte vorgestellt und hohe Gehälter angeboten, um Talente zu rekrutieren.

Tang Wenbin, Mitbegründer von Yuanli Lingji, bezeichnete dieses Jahr als ein "Jahr des Aufkommens" - Unternehmen, Technologien und Kapital tauchen in großer Zahl zur gleichen Zeit auf, und die Fortschritte übertreffen die Erwartungen bei weitem. Aber er beobachtete auch die andere Seite der Branche: Es gibt viele "magische Aufträge". Einige Projekte haben einen hohen Betrag, und sie scheinen kommerzielle Großaufträge zu sein. Aber wenn man sie genauer betrachtet, ist es schwierig, zu erklären, welche Probleme sie tatsächlich lösen, ob sie wiederholt bestellt werden können und ob sie tatsächlich helfen können, die Kosten zu senken oder die Effizienz zu steigern. Er warnt davor, dass die Serienproduktion nicht nur durch die Anhäufung von Geräten erreicht werden kann, sondern durch die Lösung von Problemen.

Bei der Beurteilung, ob ein Szenario für die Einstieg wert ist, hat er drei Kriterien vorgeschlagen: Erstens darf die Technologie nicht zu früh fixiert werden. Um die ersten Bestellungen zu erlangen, versuchen einige Unternehmen, die Roboter an hoch spezialisierte vertikale Szenarien anzupassen. Aber dieser Ansatz opfert oft die Generalisierungsfähigkeit des Modells, was es schwierig macht, andere Anwendungen zu entwickeln.

Zweitens sollte man mit Szenarien beginnen, die eine hohe Fehlertoleranz haben und nicht zeitkritisch sind. In der Anfangsphase können die Roboter nicht "fehlerfrei" arbeiten. Die Optimierung der Roboter in verschiedenen Umgebungen erfordert Zeit. Daher sollte die Branche Szenarien mit hoher Toleranz wählen, um die Anwendbarkeit von 90 % auf 95 % oder sogar 100 % zu verbessern.

Drittens muss die Nachfrage groß und stark genug sein, um den Wert zu bestätigen, die Kosten zu verteilen und einen echten kommerziellen Zyklus zu bilden. Andernfalls kann selbst eine große Bestellmenge nur eine vorübergehende Anhäufung sein und schwerlich aufrechterhalten werden.

Auf der Nachfrageseite ist die Beurteilung der Käufer direkter. Ein Leiter eines Embodied-Intelligence-Projekts eines großen Unternehmens sagte, dass sie nur drei Kriterien betrachten: Ob das Problem hoch komplex, hoch gefährlich und kostspielig ist. Darüber hinaus muss der Roboter 7 Tage die Woche, 24 Stunden am Tag stabil laufen können und grundlegende Fähigkeiten wie kontinuierliche Arbeit, Wasserdichtigkeit, Staubdichtigkeit und Umweltanpassung haben. "Ich habe viele Hersteller gefragt, und viele haben diese Kriterien noch nicht wirklich berücksichtigt", sagte er. In seiner Ansicht sind diese scheinbar grundlegenden technischen Kriterien der Schlüssel dafür, ob ein Roboter in die Phase der wiederholten Bestellungen eintreten kann.

Hohe Qualität von Daten ist äußerst rar

Der Übergang von der Demo (Präsentationsvideo) zur Massenanwendung führt letztendlich immer auf dasselbe Problem: Hohe Qualität von Daten ist immer noch äußerst rar.

Im Gegensatz zu der Zeit vor der Entstehung von großen Sprachmodellen, als es eine riesige Menge an Text- und Bilddaten gab, geht die Embodied Intelligence einen anderen Weg: Jede wichtige Datenmenge stammt aus der Interaktion des Roboters mit der realen Welt, und diese Daten sind viel seltener und teurer als Textdaten.

Anfangs dieses Jahres haben viele Leute beurteilt, dass die Branche der Embodied Intelligence ungefähr in einer Phase ähnlich dem Übergang von GPT-1 zu GPT-2 stand. Bis heute, kurz bevor wir dem "GPT-3-Moment" für Roboter nähern, hat die Modellleistung deutlich zugenommen, aber es ist noch ein langer Weg bis zur echten Weltverständnis.

Wang He, Gründer von Yinhe Tongyong, hat eine wichtige Tatsache genannt: Weltweit laufen möglicherweise noch weniger als 1.000 Roboter in menschlichen Arbeitsumgebungen. Diese Anzahl reicht bei weitem nicht aus, um ein handlungsorientiertes Modellsystem zu unterstützen. Die Strategie von Yinhe Tongyong ist, dass Kurzfristig werden Simulationsmodelle und synthetische Daten weiterhin die meisten Explorationsaufgaben übernehmen müssen. Langfristig muss die Anzahl der tatsächlich eingesetzten Roboter um Hunderte oder Tausende von Malen gesteigert werden.

Luo Jianlan, Partner und Chefwissenschaftler von Zhiyuan Robot, hat erwähnt, dass die zukünftige Datenökosystem von den Robotern selbst produziert werden sollte. Seine Vorstellung ist, dass man massenhaft Roboter in die reale Welt setzt, damit sie ständig mit der Welt interagieren. Dadurch werden reale physikalische Daten erzeugt, die breit abgedeckt, zeitlich lang andauernd und strukturell komplex sind. Diese Daten werden dann für das Modelltraining verwendet, um einen sich selbst optimierenden Zyklus zu bilden.

Wang Qian, Gründer von Zibianliang, hat hingegen gewarnt, dass sich das Verständnis der Branche über Daten ändert. Es ist nicht so, dass je mehr Daten desto besser, sondern "je effektiver desto besser". Die Zeit der Sprachmodelle hat bewiesen, dass hochwertige und strukturell konsistente Daten oft wirksamer sind als eine reine Anhäufung von Daten. Und in der realen Welt gilt dies umso mehr, wo es voller Details wie Kontakt, Reibung und Kollision ist, die schwerlich mit Worten oder Bildern beschrieben werden können. Wenn das Modell diese grundlegenden physikalischen Prozesse nicht verstehen kann, kann es keine zuverlässige Vorhersage über die Welt treffen. Daher ist seine Einschätzung, dass in Zukunft möglicherweise ein neues physikalisches Basis-Modell, das von der Embodied Intelligence angetrieben wird, die multimodale Richtung dominieren wird. Dies wird ein anderer Entwicklungspfad als der der großen Sprachmodelle sein.

Wenn man die Entwicklung der großen Sprachmodelle betrachtet, kann man sehen, dass drei Bedingungen unbedingt erforderlich sind - Algorithmus, Rechenleistung und Daten müssen gleichzeitig einen kritischen Punkt erreichen. Im Bereich der Embodied Intelligence sind diese drei Bedingungen noch nicht gleichzeitig reif. Der Algorithmus befindet sich noch in der Phase der Erprobung der Anwendbarkeit. Das Rechenleistungssystem für das Training von Embodied-Intelligence-Modellen ist noch schwach. Die Datenmenge und die Datenqualität haben noch lange nicht den kritischen Punkt erreicht.

Mit anderen Worten, die Zukunft der Embodied Intelligence rückt beschleunigt näher, aber sie befindet sich immer noch in der Phase vor dem Tagesanbruch. Die Begeisterung ist groß, die Fähigkeiten sind stark, aber es ist noch ein langer Weg bis zur eigentlichen Goldenen Zeit der Industrialisierung.

Dieser Artikel stammt aus dem WeChat-Account "Wirtschaftsbeobachtung", Autor: Zhou Yue, veröffentlicht von 36Kr mit Genehmigung.