Zwei hundert Milliarden Yuan an heissen Geldern strömen ein, und die Embodied AI bleibt beim "Handschuh" hängen.
Zu Beginn des Jahres 2026 ging das Tempo der Finanzierungen im Bereich der Embodied Intelligence so rasch voran, dass es einem fast unwirklich vorkam.
Am 10. März legte Lingchu Intelligence erstmals seine Finanzierungsstruktur öffentlich dar: Innerhalb von anderthalb Jahren seit Gründung wurden insgesamt über 2 Milliarden Yuan an Kapital beschafft. Die Liste der Investoren reicht von der China Development Financial Corporation und dem CCTV Industrial Investment Fund bis hin zu Yangtze Optical Fibre and Cable Joint Stock Limited Company und den Industriekapitalen des SAIC-Konzerns. Der zuvor eher zurückhaltende Konzern hat seinen Unternehmenswert innerhalb eines Jahres um das Sechs- bis Siebenfache gesteigert.
Dies ist kein Einzelfall. Laut unvollständigen Statistiken belief sich die insgesamt bekanntgegebene Finanzierung im Bereich der Embodied Intelligence und Robotik in China seit Anfang 2026 auf rund 20 Milliarden Yuan. Die neue Finanzierung von 2,5 Milliarden Yuan von Galaxy Universal hat einen neuen Branchenrekord aufgestellt. Qianxun Intelligence hat in zwei aufeinanderfolgenden Runden fast 2 Milliarden Yuan beschafft. Unternehmen wie Zibianliang Robotics, Zhipingfang und Xingdong Jiyuan haben nacheinander die Marke von einem Milliarden-Yuan-Unternehmenswert überschritten. Innerhalb von nur zwei Monaten sind in der Branche sieben neue Unicorns entstanden.
Aber viel Kapital bedeutet nicht automatisch, dass die Geschichten klar sind. Ein Partner eines Investmentunternehmens, der kürzlich an mehreren Investitionen beteiligt war, gestand offen, dass alle sehr eilig seien: "Der Sekundärmarkt wird sich sicherlich für das Konzept der Embodied Intelligence begeistern, aber auf dem Primärmarkt muss man sich zuerst darüber im Klaren sein, worauf man eigentlich wetten will, wenn man dieses Geld investiert."
Die Antworten beginnen sich zu differenzieren. Einige setzen auf die Stückzahl der ausgelieferten Roboter, andere auf die Generalisierungsfähigkeit der künstlichen Intelligenz ("Gehirn"), und wieder andere auf einen noch grundlegenderen Faktor – die Daten. Die beiden Gründer von Lingchu Intelligence stellten der Medien ihre Überlegungen direkt dar: Der Kern des Problems, dass die Embodied Intelligence bisher noch nicht umgesetzt werden konnte, liegt in den Daten, und die Lösung für das Datenproblem liegt in den Händen der Menschen.
Die Strömung von 2 Milliarden Yuan: Sieben neue Unicorns und zwei Strategien
Wenn man die Finanzierungssituation zu Beginn des Jahres 2026 betrachtet, wird die Präferenz der Kapitalströme deutlich.
Unitree Robotics und Zhipu Robotics setzen weiterhin nach ihrem eigenen Plan voran. Das erste Unternehmen hat dank einer extremen Kostensenkung den Preis auf die 30.000-Yuan-Marke gedrückt und hat 2025 über 6.500 Geräte in Serie produziert. Aber viele der neuen Milliarden-Yuan-Unternehmen setzen ihr Augenmerk auf das "Gehirn".
Zibianliang Robotics hat die native multimodale Architektur WALL-A entwickelt und betont die Integration von VLA und Weltmodell. Das selbst entwickelte Spirit v1.5-Modell von Qianxun Intelligence ist das erste chinesische Open-Source-Modell, das in Bezug auf die Leistung das Pi0.5-Modell übertrifft. Zhipingfang hat das globale Ganzkörper-VLA-Großmodell GOVLA geschaffen und betont die Generalisierungsfähigkeit ohne Vorbeispiele.
Die Gründerteams dieser Unternehmen haben in der Regel einen Hintergrund in der Künstlichen Intelligenz oder im autonomen Fahren. Ihre Einigkeit besteht darin, dass der endgültige Wettbewerb bei humanoiden Robotern der Wettbewerb um das beste "Gehirn" ist.
Die Kapitalgeber akzeptieren diese Sichtweise zunehmend. Zhang Zhikuan, Direktor der Investmentabteilung von Cornerstone Capital, beobachtete eine Veränderung: Mit der zunehmenden Reife von Technologien wie VLA hat sich die Generalisierungsfähigkeit von Robotern bei aufgabenübergreifenden Szenarien deutlich verbessert. "Unternehmen, die auf das 'Gehirn' setzen, zeigen nun eine stärkere technologische Sicherheit."
Aber die unangenehme Realität ist, dass die neuen Milliarden-Yuan-Unternehmen, die auf das "Gehirn" setzen, bei den kommerziellen Daten nicht besonders beeindrucken. Laut IDC-Statistiken lag die Stückzahl ihrer ausgelieferten Produkte im vergangenen Jahr in allen Fällen unter 1.000. Im Vergleich dazu haben Unitree und Zhipu bereits ein Jahresumsatzniveau von 1 Milliarde Yuan erreicht.
Der Kapitalmarkt setzt nicht auf die momentane Stückzahl der ausgelieferten Produkte. Das amerikanische Unternehmen Figure AI, das 2022 gegründet wurde, befindet sich noch immer in der Pilotphase seiner Produktionsauslieferungen, hat aber bereits einen Unternehmenswert von 39 Milliarden US-Dollar erreicht. Der entscheidende Faktor war die Einführung seines selbst entwickelten End-to-End-VLA-Modells "Helix", das die Funktionen der Roboter von einfachen Aufgaben wie Kisten tragen bis hin zu komplexeren Aufgaben wie das Falten von Kleidung erweitert hat. In China kann das Modell von Zibianliang Robotics bereits den gesamten Prozess der Lieferung von Lieferdiensten ohne menschliche Intervention durchführen. Dies ist der Grund, warum Meituan mehrfach investiert hat.
Andere setzen auf eine andere Richtung. Die beiden Gründer von Lingchu Intelligence haben klar gemacht, dass sie keine eigenständige Entwicklung von gesamten Hardware-Systemen vornehmen werden – das Angebot an Radfahrwerken ist bereits übersättigt. Aber die Entwicklung von Greifhänden und Datenerfassungsgeräten ist für sie unverzichtbar. Der Kernansatz dieses Unternehmens besteht darin, Embodied-Modelle mit "datenerfassenden Verfahren ohne physisches Gerät" zu trainieren: Menschen tragen Datengloves, um Betriebsdaten zu sammeln, und diese Daten werden dann verwendet, um das Basis-Modell zu trainieren.
Ob dieses Konzept funktionieren wird, ist derzeit noch nicht entschieden. Aber seine Entstehung hat genau eine kollektive Sorge in der Branche getroffen: Woher kommen die Daten?
Der Datenkrieg: Der Rückgang der Simulation, der Einstieg menschlicher Daten
"Es besteht in der Branche Einigkeit darüber, dass es ein Datenproblem gibt. Aber das noch grundlegendere Problem ist, dass es bisher keine Mechanismen gibt, die Technologiepfade und Geschäftsmodelle kombinieren, um eine groß angelegte und kostengünstige Rückführung von Daten zu ermöglichen." Wang Qibin, CEO von Lingchu Intelligence, hat einmal so analysiert. Im Bereich der Embodied Intelligence gibt es bisher kein "Tesla-Modell".
Das Tesla-Modell konnte erst starten, weil ab 2013 die Grundlagen gelegt wurden. Nach der Veröffentlichung des Model 3 im Jahr 2017 stieg die Jahresverkaufszahl schnell auf über eine Million Einheiten. Dank der massiven Verbreitung konnten die Daten schnell zurückfließen und so die Weiterentwicklung des FSD-Systems antreiben. Aber die humanoiden Roboter stehen heute vor dem typischen "Huhn-Ei-Problem": Ohne ausreichende Daten kann es keine massenhafte Verbreitung geben, und ohne Verbreitung gibt es keine kostengünstige Rückführung von Daten.
Simulationsdaten waren einst hoch angesehen, aber die Lücke zwischen ihnen und realen Daten ist zu groß. Chen Yuanpei, Mitbegründer von Lingchu Intelligence, hat die Veränderung der Teamsichtweise auf Simulationen nachvollzogen: In den frühen Tagen wurden bei einigen Demo-Projekten, wie beim Mahjong-Spiel, viele Daten aus Simulationen gesammelt, da die parallele Effizienz hoch war und die Datenmenge schnell erhöht werden konnte. Aber mit der Entwicklung der Branche und der Machbarkeit der Verwendung von menschlichen Daten hat das Gewicht der Simulationen bei der Modellbildung allmählich abgenommen.
Diese Einschätzung verbreitet sich in der Branche. Ein Unternehmer sagte der Medien, dass es tatsächlich die realen und wiederverwendbaren Daten sind, die die weitere Entwicklung der Embodied Intelligence einschränken. "Seit 2026 ist das Datenproblem ein Kernproblem geworden, das man bei der Erweiterung der Fähigkeiten der Embodied Intelligence nicht umgehen kann. Das Jahr 2026 wird das Jahr der massenhaften Akkumulation von Embodied-Daten und des Marktexplosions sein."
Lingchu Intelligence hat sich entschieden, menschliche Daten zu nutzen. Das Team setzt derzeit in Peking ein multimodales Datenerfassungssystem in Form von Gloves ein, um taktile, mehrperspektivische visuelle und Gelenkwinkelinformationen zu sammeln. Das Ziel ist die Erfassung von Daten für langfristige Aufgaben in Logistik- und Supermarktszenarien. Laut Angaben des Unternehmens kann die Kosten dieses Systems ab März auf ein Zehntel des Kosten eines ferngesteuerten Ganztagsroboters reduziert werden.
Aber einige Investoren halten sich zurück. Personen, die in mehrere Embodied-Intelligence-Unternehmen investiert haben, sagten der Medien, dass die derzeitigen Aufträge für die Datenerfassung in der Embodied-Intelligence hauptsächlich von lokalen Regierungen stammen.
Der Datenkrieg hat gerade erst begonnen. Wer die hochwertigen Daten sammeln kann, wer diese Daten in das Modell einarbeiten kann und wer die Daten nutzen kann, um den geschlossenen Geschäftszyklus zu verbessern – diese drei Fragen ersetzen nun die Frage, "Kann der Roboter einen Salto machen?" und werden die neuen Wettbewerbsfaktoren in der Branche.
Umsetzung und Übertreibungen: Der reale Kampf hinter 800 UPH
Neben den aufsehenerregenden Finanzierungszahlen gibt es noch eine andere Zahl, die beachtenswert ist.
Laut unvollständigen Statistiken der Allianz für die Anwendungsforschung von humanoiden Robotern in Szenarien wurden im chinesischen Markt im Jahr 2025 über 292 öffentlich bekanntgegebene Projekte für humane Roboter vergeben, und die Gesamtvertragssumme belief sich auf über 1,81 Milliarden Yuan. Aber 235 dieser Projekte hatten einen Betrag von weniger als 5 Millionen Yuan, und nur vier Projekte hatten einen Einzelbetrag von über 100 Millionen Yuan.
Mehrere Investoren und Branchenvertreter haben der Medien mitgeteilt, dass die Aufträge von Embodied-Intelligence-Unternehmen "mit Wasser verdünnt" sind. Viele Aufträge in der Branche werden oft nur mit einer Anzahlung bezahlt und dann nicht weiter verfolgt. Aber die Unternehmen präsentieren diese Absichtsurteile oder Rahmenvereinbarungen weiterhin als tatsächliche Liefermengen. Dies ist auch ein sehr unangenehmer Punkt in der Branche: Viele sogenannte "kommerzielle Aufträge" sind im Wesentlichen PR-Showkäufe und Datenerfassungsabkommen, keine echten Produktivitätsersetzungen.
Lingchu Intelligence ist bei der Auswahl der Umsetzungsszenarien sehr vorsichtig. Das Team hat fast ein halbes Jahr gebraucht, um eine Vielzahl von Szenarien zu analysieren, und hat schließlich drei Teilbereiche ausgewählt: die Kleidungsversorgung, die Kistenprüfung und die Sortierwand. Wang Qibin erklärte, dass die Logik hinter der Auswahl dieser Szenarien nicht nur darin besteht, ob das Geschäft funktionieren kann, sondern auch in einem noch wichtigeren Aspekt: Ob die Daten in realen Szenarien einen Mehrwert generieren können und ob die Rückführung der Daten das Modell verbessern kann.
Er gab bekannt, dass das Team im Bereich der Kleidungsversorgung bereits eine Generalisierung von über tausend Kleidungsstücken erreichen kann und die maximale Taktung bis zu 800 UPH betragen kann. Dies wird durch einen Trainingsablauf erreicht, der hauptsächlich auf verstärkendem Lernen basiert. Chen Yuanpei erklärte, dass beim verstärkenden Lernen während des Trainings eine Phase des "Selbstexploration + Beschleunigung" gibt, in der die Bewegungsgeschwindigkeit die Obergrenze der menschlichen Fernsteuerung übertreffen kann. "Die Bewegungen, die durch verstärkendes Lernen trainiert werden, sind oft sauberer, schlanker und geschickter."
Aber die objektive Tatsache ist, dass selbst wenn man 800 UPH erreicht, es noch einen großen Abstand bis zur echten Substitution der menschlichen Arbeitskraft gibt. In der Branche ist es noch weit verbreitet, dass Roboter keine millimetergenaue Präzision erreichen können, sondern nur Zentimetergenauigkeit, und es schwierig ist, relativ feine Arbeiten wie das Eindrehen von Schrauben auszuführen.
Miao Rentao, stellvertretender Dekan der Fakultät für Arbeitsökonomie der Capital University of Economics and Business, hat einmal darauf hingewiesen, dass chinesische intelligente Roboter bei Kerntechnologien wie Bewegungssteuerungsalgorithmen, Präzisionsgetrieben und hochpräzisen Sensoren immer noch hinter internationalen Marktführern zurückbleiben. Der Anteil der importierten Kernkomponenten von humanoiden Robotern liegt immer noch über 40%.
Der Eliminationskampf: Wessen 2026?
Was bedeutet das Jahr 2026 in dieser Realität?
Die Einschätzung eines Unternehmers hat in der Branche Anklang gefunden: "Das Jahr 2026 ist nicht das 'Jahr des kommerziellen Aufbruchs', sondern eine Kombination aus dem 'Jahr der kommerziellen Validierung' und dem 'Jahr des Eliminationskampfs'."
Es gibt derzeit in China über 200 Unternehmen im Bereich der Embodied Intelligence, darunter über 100 Unternehmen, die sich mit humanoiden Robotern befassen. Nachdem die Spitzenunternehmen schnell Kapital beschafft haben, wird der Existenzraum der zweiten Liga zunehmend eingeschränkt. Forschungsinstitute haben beobachtet, dass "einige Unternehmen tatsächlich schon am Ende sind, aber noch mit geringer Leistung weiterlaufen".
Was ist nach dem Rummel wirklich wichtig? Es gibt die Meinung: "Die Embodied Intelligence legt ihre technologische Prachtkleidung ab und zieht sich in die 'Kriegsfrost' für den Kampf. Die Faszination der Frühlingsfeier wird vergehen, und die Begeisterung des Kapitals wird sich beruhigen. Diejenigen, die am Ende am Tisch bleiben, werden die Roboter sein, die wirklich in Werkshallen, Lagerhäusern und in allen Branchen arbeiten."
Für Lingchu Intelligence und alle Start-up-Unternehmen, die eine riesige Finanzierung erhalten haben, steht die Prüfung von 2026 bereits vor der Tür: Können die Daten einen geschlossenen Zyklus bilden? Kann das Modell generalisiert werden? Können die Szenarien funktionieren? Die Antworten liegen nicht auf den Finanzierungs-Pressemitteilungen, sondern in den Werkshallen der Kunden.
Dieser Artikel stammt aus dem WeChat-Account "Cai Neng Quan". Autorin: Sijiali. Veröffentlicht von 36Kr mit Genehmigung.