Aktueller Überblick über den Bereich Embodied AI: Intelligente Konzepte, starke Modelle – entweder ein Marktvolumen von 100 Milliarden oder ein Unicorn
Das Kapital im Bereich der Embodied Intelligence fließt in die „Gehirne“ von Robotern.
Laut unvollständigen Statistiken von QbitAI wurden im ersten Halbjahr 2026 (bis zum 12. Juni) in China rund 43,8 Milliarden Yuan in den Bereich der Embodied Intelligence investiert. Im gesamten Jahr 2025 belief sich das Investitionsvolumen auf etwa 55,4 Milliarden Yuan, und 2024 lag es bei etwa 13,7 Milliarden Yuan. Wenn dieser Trend anhält, wird das Investitionsvolumen 2026 einen neuen Höchststand erreichen.
Davon flossen mehr als die Hälfte der Gelder in die sogenannten „Brain-Firmen“. Im Vergleich zu den früheren Hardware-kernigen oder Full-Stack-Platformunternehmen betonen die „Brain-Firmen“ eher, dass sie „Hardware durch Software definieren und das Gerät durch Modelle definieren“.
Die sogenannten „Device-Firmen“, deren Geschäft auf der Herstellung von Robotergeräten basiert, machten in der gleichen Periode nur 12,8 % des Investitionsvolumens aus, sogar weniger als die Unternehmen, die Kernkomponenten (wie Greifer, Sensoren, Gelenkmodule usw.) herstellen (14,4 %).
Viele der „Brain-Firmen“ haben eine Investitionsgeschwindigkeit, die einem Raketenstart gleicht. „Im Durchschnitt eine Investition pro Monat“ ist sogar zur Branchennorm geworden. Bei der extremersten Firma lagen zwei aufeinanderfolgende Investitionen nur zwei Wochen auseinander.
Dies ist ein junger Markt. Laut unvollständigen Statistiken von QbitAI befinden sich die meisten der 35 untersuchten „Brain-Firmen“ (20 Stück) in der frühen Investitionsstufe (Seed/Angel/Pre-A-Runde). Keine Firma hat die späte Investitionsstufe (C/D/Pre-IPO-Runde) erreicht.
Dies ist auch ein heißer Markt. Laut QbitAI-Statistiken belief sich der durchschnittliche Investitionsbetrag in die Pre-A-Runde von Embodied Brain-Firmen auf 700 Millionen Yuan, und in die B-Runde auf 2,25 Milliarden Yuan – in den meisten anderen Bereichen wären dies die Investitionen in die C/D-Runde.
Wir haben einige wichtige Trends im Bereich der Embodied Brain-Venture Capital-Investitionen zusammengefasst.
Beschleunigung der Investitionen in Embodied Brain
Der erste Trend ist: Die Investitionsgeschwindigkeit im Bereich der Embodied Brain hat die traditionelle Logik überwunden, wonach die nächste Investitionsrunde erst nach Erreichen bestimmter Meilensteine möglich ist.
Seit dem zweiten Halbjahr 2025 fließt viel Kapital in den Bereich der Embodied Brain. Im Jahr 2026 hat sich die Investitionsgeschwindigkeit weiter beschleunigt.
Beispielsweise hat Delta Intelligence, das im Januar 2026 gegründet wurde, binnen drei Monaten drei Investitionen von jeweils über einer Milliarde Yuan abgeschlossen. Octopus Power, das in der gleichen Zeit gegründet wurde, hat in weniger als zwei Monaten eine Seed-Runde von mehreren Hundert Millionen Yuan und eine Angel-Runde von fast 50 Millionen US-Dollar abgeschlossen. Moushen Intelligence hat ebenfalls in einem halben Jahr fünf Investitionen abgeschlossen. Es gibt noch viele ähnliche Fälle.
Außerdem liegen die Investitionsbeträge vieler Firmen weit über dem Standard für diese Runde.
Tashihang hat bei der Pre-A-Runde im April 455 Millionen US-Dollar (etwa 3,3 Milliarden Yuan) investiert. Dies ist nicht nur der höchste Einzelsumme-Investitionsrekord in der chinesischen Embodied Intelligence, sondern auch höher als die Investitionen der meisten Firmen in die A/B-Runde.
Bei einigen Projekten wurden die Angel-Runden von Kapitalanlegern wiederholt aufgestockt.
Shenqiong Xinghe hat in weniger als 70 Tagen die „Angel-Runde – Angel+-Runde – Angel++-Runde“ geschafft. Zhiyue Space Intelligence hat sogar die „Angel++++“-Runde erreicht und hat im April 2026 zwei aufeinanderfolgende Investitionen abgeschlossen.
Normalerweise wird bei der Angel-Runde vor allem auf die „Ideen und das Team“ geachtet, während bei der A-Runde auf das „Geschäftsmodell und die Daten“ geachtet wird. Wenn ein Start-up immer noch in der Angel-Runde investiert wird, bedeutet dies normalerweise, dass das Geschäft noch nicht die Kriterien für die nächste Runde erfüllt.
Zur gleichen Zeit konzentrieren sich die Ressourcen auf die führenden Firmen. Die fünf Firmen mit den höchsten Investitionsbeträgen haben zusammen 15,4 Milliarden Yuan investiert, was etwa 70 % des gesamten Investitionsvolumens im Markt ausmacht.
Unter ihnen ist Qianxun Intelligence derzeit die am heißesten umworbenen „Brain-Firma“. Sie hat von Februar bis Juni vier aufeinanderfolgende Investitionen abgeschlossen, mit einem Gesamtbetrag von fast 5 Milliarden Yuan und einem Schätzwert von 20 Milliarden Yuan.
Rückblickend hat die Gründungswelle der „Brain-Firmen“ von 2025 bis heute andauert. Laut unvollständigen Statistiken von QbitAI sind von den 35 „Brain-Firmen“, die 2026 bis heute über Investitionsaktivitäten berichtet haben, mehr als die Hälfte nach 2025 gegründet worden. Darunter wurden sechs neue Firmen in diesem Jahr gegründet.
Die sogenannten „Full-Stack-Firmen“, die sowohl Robotergeräte als auch Brain-Technologien betreiben, wurden meist vor 2025 gegründet.
In letzter Zeit haben einige „Full-Stack-Firmen“ aufgrund der Verbesserung ihrer „Brain“-Fähigkeiten ebenfalls Kapital erhalten, ihre Unternehmenswerte haben stark gestiegen, und einige sind sogar in den Club der Firmen mit einem Schätzwert von über einer Milliarde Yuan aufgestiegen.
Beispielsweise hat Xingdong Jiyuan im März 2026 eine strategische Investition von 1 Milliarde Yuan abgeschlossen, und der Unternehmenswert hat die Marke von 10 Milliarden Yuan überschritten. Der Schwerpunkt der Investitionsnachricht lag auf den Durchbrüchen und Führungsstellungen der Firma in der Weltmodell- und VLA-Technologie sowie auf ihrer Fähigkeit zur Full-Stack-Selbstentwicklung.
Eine andere „Full-Stack-Firma“ mit einem Schätzwert von über 20 Milliarden Yuan ist Xinghaitu. Ihr Partner und CFO Luo Tianqi hat öffentlich erklärt, dass die Kernvariable in der Entwicklung der Robotikbranche die Iteration des Embodied Brain ist.
Warum wird das Embodied Brain derzeit so stark von Kapitalanlegern gesucht?
In der Investmentbranche geht ein Sprichwort: „Das Gerät sichert die Untergrenze, das Brain bestimmt die Obergrenze.“
Yu Wenxiang, der Investmentdirektor von 37 Interactive Entertainment, hat QbitAI mitgeteilt, dass die Hardware der Roboter zwar noch nicht perfekt ist, aber die Lieferkette, die Kostenkontrolle und die Massenproduktionsfähigkeit stärker herausgefordert werden. Dank der Vorteile der chinesischen Fertigungsindustrie wird die Roboterhardware schnell weiterentwickelt.
Der Konsens auf dem Kapitalmarkt ist: Das Brain ist die größte Herausforderung in der Embodied Intelligence und hat von Natur aus eine höhere Bewertungslogik – niedrige Grenzkosten, Wiederverwendbarkeit und Portabilität.
Han Fengtao, Gründer und CEO von Qianxun Intelligence, hat auf der 2026 Zhiyuan-Konferenz gesagt, dass, wenn man Jarvis aus Iron Man als einen 100-Punkte-Roboter ansieht, die Technologiematurität des Roboterarms derzeit 50 Punkte, des Radfahrwerks 40 Punkte, des Vierbeiners 30 Punkte und die Künstliche Intelligenz nur 3 Punkte hat. „Aber die Verbesserung von 3 auf 50 Punkte wird schnell gehen.“
Fast 80 % der Firmen forschen an Weltmodellen
Der zweite offensichtliche Trend ist: Das Weltmodell ist die am beliebtesten Technologie-Route bei neuen Investitionen geworden.
Laut QbitAI-Statistiken forschen 27 der 35 „Brain-Firmen“, die in diesem Jahr über Investitionsaktivitäten berichtet haben, an Weltmodellen, was fast 80 % ausmacht.
Das Embodied Brain gliedert sich in mehrere Technologie-Routen wie VLA, Weltmodell, Schichtmodell usw.
2024 sprachen fast alle führenden Robotikfirmen über VLA, und reale Daten wurden als Priorität angesehen. Heute sagt ein Investor zu QbitAI: „Es scheint, dass man aus der Konkurrenz fällt, wenn man kein Weltmodell entwickelt.“
Allerdings gibt es noch keinen Konsens über die Bedeutung des Weltmodells. „Das Weltmodell ist das am meisten missbrauchte und am meisten überladenen Wort im Bereich der Künstlichen Intelligenz.“ hat Li Feifei in einem neuesten Artikel direkt gesagt.
Jiang Ziyuan, ein Investor von Guoke Investment, hat QbitAI mitgeteilt, dass der größte Unterschied zwischen den meisten Weltmodellen und VLA bei der Umsetzung darin besteht, dass das erstere ein Videogenerierungsmodell als Backbone verwendet, während das letztere ein Sprachmodell als Backbone verwendet.
Er hat beobachtet, dass neben akademischen Teams und Unternehmern aus der AI 1.0-Zeit auch eine Reihe von Firmen, die ursprünglich 3D-Grafik, Videogenerierungsmodelle und Simulations-Engines entwickelt haben, in den Bereich des Weltmodells einsteigen.
Trotzdem sind die meisten Firmen bereit, sich das Label „Weltmodell“ zu geben, um den Investoren zu signalisieren: „Ich bin anders als die letzte Generation von VLA.“
Aber für die Roboter selbst ist die strenge Unterscheidung zwischen der VLA- und der Weltmodell-Route vielleicht nicht so wichtig.
Egal ob schwarze oder weiße Katze, eine Katze, die Mäuse fangen kann, ist eine gute Katze. Heutzutage kombinieren viele Firmen Weltmodelle und VLA, anstatt sich für eine der beiden zu entscheiden.
Nach Jiang Ziyuan ist es für Embodied Brain-Firmen, die ursprünglich in der VLA-Entwicklung stark waren, auch nicht so schwierig, sich auf das Weltmodell zu konzentrieren. So wie die Videogenerierungsmodelle ursprünglich allgemein die U-Net-Architektur verwendeten, hat die Branche sich nach der Popularität von Sora auf die DiT (Diffusion Transformer)-Architektur umgestellt.
„Man verwendet die beste Technologie. Wenige Unternehmer gehen bis zum Ende auf einer einzigen Route.“ sagte er. „Vor zwei Jahren dachten die Leute, dass VLA die Zukunft sei, heute denken sie, dass das Weltmodell die Zukunft ist. Vielleicht wird es nächstes Jahr eine neue Technologie geben, die die neue Zukunft wird.“
Gan Ruyi, Partner und Algorithmus-Experte von Independent Variable Robotics, hat QbitAI mitgeteilt, dass die zugrunde liegende Dateninfrastruktur die wichtigere Wettbewerbsfähigkeit ist als der Streit um die Technologie-Route zwischen Weltmodell und VLA.
Diese Infrastruktur deckt den gesamten Prozess von Datenerfassung, Training und Bewertung ab und bildet ein stabiles und skalierbares industrielles System.
„Mit dieser Dateninfrastruktur können wir auch schnell auf neue Technologie-Architekturen reagieren.“ sagte er.
Hochschul-Forschungsteams werden die Hauptakteure bei der Gründung von Start-ups
Der dritte Trend ist: In der Phase, in der die Technologie-Route des Embodied Brain noch nicht klar ist, wird das Personal zu einem der wichtigsten Faktoren für die Beurteilung von Teams durch viele Investoren.
„Die Beurteilung der Technologie-Route kann grob sein, aber die Beurteilung des Teams muss fein sein.“ sagte ein Investor.
Unternehmer mit akademischem Hintergrund sind die Hauptakteure bei den „Brain-Firmen“. Laut QbitAI-Statistiken gibt es 17 Start-up-Unternehmen, deren „Erster“ aus einer Hochschule oder einem Forschungsinstitut kommt, was etwa die Hälfte ausmacht.
Viele Unternehmen ohne akademischen Hintergrund sind auch gerne bereit, einen Partner aus einer Hochschule oder einem Forschungsinstitut für die Position des Mitgründers oder des Chefwissenschaftlers auszuwählen, um ein Start-up-Team zu bilden.
Die Tsinghua-Universität ist die wichtigste Personquelle. Unter diesen „Brain-Firmen“ stammen neun Gründer/Mitgründer/Chefwissenschaftler von der Tsinghua-Universität. Die Yao-Class, das Forschungszentrum für