Mit einem Satz von Jensen Huang ist wieder eine neue Welle entfacht worden.
Unmittelbar nach dem Neujahr hat Jensen Huang, der CEO von NVIDIA, große Pläne umgesetzt. In letzter Zeit hat Huang Jensen auf der CES-Messe seine markante These vorgebracht: "Der ChatGPT-Moment für Roboter naht", und er meint, "Ohne Daten aus der realen Welt bleibt körperliche KI eine Illusion."
Diese Äußerung hat die Branche sofort in Aufruhr versetzt. Ein eindeutiges Signal beginnt sich abzuzeichnen: Die Robotikbranche wird die ineffiziente Phase des "Einzelaufgabenprogrammierens und der Abhängigkeit von realen Daten" hinter sich lassen und in die Periode der Generalisierungsexplosion mit physikalischer KI eintreten.
Bereits zuvor haben die chinesischen Kapitalgeber diesen Wandel in der Luft riechen können. Betrachtet man die Entwicklung der körperlichen KI in China, war das Stichwort 2024 noch "Körper", während es im zweiten Halbjahr 2025 bereits zu einem Paradigmenwechsel hin zu "Körper + Daten" oder "Daten × Modell × Körper" geworden ist.
Zusätzlich zu Huang Jensens Eintritt in das Feld hat ein Wettlauf um die Infrastruktur für die "kontinuierliche Erfassung hochwertiger Interaktionsdaten zur Treibung der Modelliteration" begonnen.
Jensen Huang setzt sich auch für körperliche KI ein
Auf dieser CES-Messe hat Huang Jensen das neue Grundmodell für körperliche KI, NVIDIA Isaac GR00T, speziell für Roboter vorgestellt und gleichzeitig die NVIDIA Cosmos-Plattform für die Entwicklung physikalischer KI eingeführt. Mit offenen Modellen, einer riesigen Datensatzmenge und einer Toolchain wird die Kerntechnikbasis für die allgemeine Umsetzung von Robotern geschaffen.
Als Demonstrationsobjekt für das neue Technologiekonzept hat Huang Jensen auf der Vortragsveranstaltung einen besonderen "Gast" mitgebracht - Reachy Mini. Da dieser Roboter in seiner Gestalt dem WALL - E aus "WALL - E" ähnelt, wird er auch als "WALL - E - Roboter" bezeichnet.
Bei der Interaktion mit "WALL - E" hat Huang Jensen es ihm ermöglichen, in einer Simulationsumgebung menschliche Bewegungen zu lernen, zu beobachten und zu imitieren. Anschließend versteht er die Beziehung zwischen Bewegung, Ergebnis und Rückmeldung und kann diese Fähigkeiten in die reale Welt übertragen.
Die Videobilder zeigen, dass "WALL - E" nach dem Training in der simulierten virtuellen Umgebung erfolgreich die Bewegung "Sturz - Aufstehen" auf einem realen Holzboden ausgeführt und das Gleichgewicht gehalten hat. Huang Jensens Demonstration wird von außen als Beweis dafür angesehen, dass physikalische Simulationsplattformen Robotern helfen können, komplexe physikalische Interaktionen schnell zu lernen und die Lücke zwischen digitaler Zwillingstechnik und realer Welt zu schließen.
Unter dem Einfluss der Simulationsumgebung und des Weltmodells hat Huang Jensen erklärt, dass dies gleichbedeutend ist damit, das "Trainingsfeld" in die "digitale Welt" zu verlagern. Er meint, dass man so nicht nur Trainingsfelder in Massen erstellen kann, sondern auch die Szenarien, die vom Modell generiert werden, in Bezug auf ihre "physikalische" Plausibilität einschränken und kalibrieren kann. Diese physikalische Plausibilität umfasst die Kombination von Beleuchtung, Materialien und Szenarien.
Insgesamt ist Huang Jensens Ansicht, dass die Zukunft der KI nicht nur von Supercomputern abhängt, sondern auch eng mit der realen Welt verbunden sein muss. Virtuelle Simulation ist der Schlüssel, um die Datenengpässe zu überwinden.
Diese Meinung hat Huang Jensen schnell in der Branche der körperlichen KI Fuß fassen lassen. Auf der CES-Messe hat er angekündigt, dass er bereits mit mehreren amerikanischen Robotikunternehmen wie Apptronik, Agility Robotics, Figure, Boston Dynamics und Sanctuary AI zusammenarbeitet. Im Rahmen der Zusammenarbeit mit Sanctuary AI bietet NVIDIA Sanctuary AI technische Unterstützung wie Rechenplattformen und Simulationswerkzeuge, um die Forschung und Entwicklung von allgemeinen humanoiden Robotern gemeinsam voranzutreiben.
Nachdem NVIDIA den "Wettlauf um die Rechenleistung" gewonnen hat, versucht es nun, in der Branche der körperlichen KI eine weitere "CUDA" zu schaffen.
Der entscheidende Faktor für den Durchbruch chinesischer Akteure
Das von Silicon Valley entzündete Feuer hat sich auch in Asien schnell ausgebreitet. Im Gegensatz zu NVIDIA, das auf "hochpräzise Simulation + allgemeines Modell" setzt, bevorzugen chinesische Akteure eher den praktischen Ansatz von "Anregung durch reale Szenarien + vertikaler geschlossener Kreis".
Im Oktober 2025 hat das Ministerium für Industrie und Informationstechnik den "Entwurf der Normen für die Datenerfassung und -annotierung von körperlicher KI" veröffentlicht, in dem erstmals ein Leitrahmen für das Format, die Qualität und die Sicherheit von physikalischen Interaktionsdaten vorgegeben wird. Dies bedeutet, dass die "Datenstandardisierung" auf die Ebene der nationalen Strategie gehoben wurde. In Anbetracht dessen haben bereits viele Unternehmen in der Branche der körperlichen KI Maßnahmen ergriffen.
Unter ihnen hat Zheyuan Robotics die erste Open - Source - Simulationsplattform, GenieSim3.0, basierend auf einem großen Sprachmodell veröffentlicht, die über 200 Aufgaben und Tausende von Stunden an Simulationsdatensätzen in Open - Source - Form enthält. Obwohl Zheyuan Robotics diese Open - Source - Simulationsplattform vorgestellt hat, betont es immer noch die zentrale Rolle von Daten aus realen Maschinen und meint, dass Daten aus der realen Welt die Grundlage für das Modelltraining sind. Gleichzeitig werden Simulationsdaten als Ergänzung für die frühen Tests und die technische Iteration genutzt.
Yinhe Tongyong treibt die Forschung und Entwicklung eines großen Modells für körperliche KI mit synthetischen Daten an und schlägt ein "Drei - Ebenen - Großmodellsystem" bestehend aus Hardwareebene, Fähigkeitsebene und oberem Großmodell vor. Aus der Sicht von Yinhe Tongyong ist die Zusammenarbeit zwischen synthetischen und realen Daten sehr wichtig. Einerseits werden Simulationsdaten für das Lernen von grundlegenden Fähigkeiten in großem Maßstab genutzt; andererseits werden reale Daten für die Überprüfung und Verbesserung der Anpassungsfähigkeit des Modells in realen Szenarien verwendet, um sicherzustellen, dass das Modell sowohl schnell lernen als auch präzise umgesetzt werden kann und so einen geschlossenen Kreis von "Simulationsvorausbildung → Feinabstimmung mit realen Daten → Modelloptimierung" zu bilden.
Tashi Zhihang konzentriert sich auf die Richtung von menschlichen Videodaten und erweitert die semantische Abdeckung durch eine große Anzahl von Videos menschlicher Verhaltensweisen.
Luoming Robotics, eines der "Vier Drachen der Datenerfassung für körperliche KI", hat sich für die Methode der "leichtgewichtigen Handgreifer" zur Datenerfassung entschieden.
Yu Chao, der Gründer von Luoming Robotics, meint, dass diese Methode darauf beruht, dass die Simulation Millionen von Szenarien generieren kann, aber nur reale Maschinen die Staub, Ölverschmutzung und Materialalterung in der realen Welt wahrnehmen können. Nach Yu Chaos Ansicht war die Branche in der Vergangenheit im Teufelskreis der Datenerfassung von realen Maschinen gefangen, nämlich "hohe Kosten, geringe Effizienz und geringe Anpassungsfähigkeit". Wenn man beispielsweise das traditionelle Fernsteuern betrachtet, können nur 30 - 35 Datensätze pro Stunde erfasst werden, was sehr kostspielig ist. Gleichzeitig können die Daten von Roboterarmen unterschiedlicher Marken und Modelle nicht miteinander kompatibel sein, und die Erfassung kann nur für eine einzelne Maschine passen, was zu einem enormen Ressourcenverschwendung führt.
Unter diesen Umständen hat Luoming die FastUMI Pro - System selbst entwickelt, das durch die Vereinheitlichung der Greifer Schnittstellen, Kraftsteuerungsmodule und visuelle Kalibrierungslösungen die Daten von Roboterarmen unterschiedlicher Marken direkt wiederverwenden kann. Dies bedeutet, dass ein Modell, das auf einer Automobilschweißlinie trainiert wurde, mit geringfügigen Anpassungen für die 3C - Montage oder die Logistiksortierung verwendet werden kann.
Yu Chao meint, dass der Kernwert darin besteht, die Abhängigkeit von bestimmten Roboterhardware zu überwinden und schnell an Dutzende von Roboterarmen und Greifern auf dem Markt anzupassen, um wirklich die Dateninseln zu brechen und die Datenwiederverwendung über Plattformen hinweg zu ermöglichen. Im Vergleich zur traditionellen Datenerfassungstechnologie steigert die Effizienz von FastUMI Pro um das Fünffache, senkt die Kosten auf ein Fünftel und erreicht eine Genauigkeit von 1 - 3 mm, was ein hohes Niveau in der Branche ist.
Was die entscheidende Phase der Datenerfassung betrifft, hat ein Investor gesagt: "Das Wesen der Investition in körperliche KI besteht darin, sowohl eine Garantie für die Gewinnwahrscheinlichkeit zu haben als auch genügend Raum für die Gewinnspanne zu lassen."
Betrachtet man die momentanen Akteure in der Branche der körperlichen KI, liegt die Gewinnwahrscheinlichkeit für alle Akteure darin, sich auf einen ausreichend praktischen Punkt zu konzentrieren. Einfach ausgedrückt, konzentrieren sie sich auf Bereiche, in denen die Kunden in industriellen Szenarien eine starke Zahlungsbereitschaft haben, die Aufgabengrenzen klar definiert sind und der ROI quantifizierbar ist. Beispiele hierfür sind Szenarien wie die 3C - Elektronik, die Logistik und Lagerung sowie die Qualitätsprüfung und Fehlererkennung.
"Dies lässt sich daran erkennen, dass die Akteure sich auf vertikale Bereiche konzentrieren. Im Fall von Luoming Robotics zeigt das Ergebnis der 60%igen Verkürzung des Taktzyklus in der Mitsubishi - Produktion auch, dass seine Technologie bereits durch reale Geschäftsanwendungen validiert wurde und nicht mehr nur ein Labor - Demo ist. Dies ist die grundlegende Garantie für die Gewinnwahrscheinlichkeit", sagte Yu Chao.
Der Raum für die Gewinnspanne besteht darin, dass aus dem Paradigma von "Körper + Daten" oder "Daten × Modell × Körper" gesehen, wenn die Datenerfassungslösung eines Unternehmens in der Branche weit verbreitet wird, dessen Wert nicht mehr von der Anzahl der verkauften Robotereinheiten als Hardwareträger abhängt, sondern davon, wie viele Roboter in seinem Datenökosystem laufen und sich entwickeln.
"In Bezug auf die Richtung strebt Luomings FastUMI Pro in Richtung der 'USB - Schnittstelle' für körperliche KI", sagte Yu Chao dazu. "Wir machen nicht einfach nur Roboter, sondern bauen die Infrastruktur für körperliche KI. Luomings Ziel ist klar: Durch die Datenerfassung aus der Betriebserfahrung von realen Maschinen in Szenarien trainieren wir bessere Modelle und bieten der Branche zwei Infrastrukturen, Daten und Hardware, um die Branche bei der gemeinsamen Schaffung eines allgemeinen Körpers und Ökosystems zu unterstützen."
Die Vorabend der heißesten Finanzierungsbranche
Wenn man fragt, welche Branche die heißeste Finanzierungsbranche 2025 war, dann ist die Antwort wahrscheinlich die "körperliche KI". Die Daten zeigen, dass das Interesse an der chinesischen Branche in den letzten Jahren stetig gestiegen ist. Im vergangenen Jahr betrug die Anzahl der Finanzierungsereignisse 298, was einem Anstieg von 144% gegenüber dem Vorjahr entspricht. Das Gesamtfinanzierungsvolumen belief sich auf 32,9 Milliarden Yuan, was einem Anstieg von 291% gegenüber dem Vorjahr entspricht.
Hierfür ist sowohl das "starke" Interesse der Kapitalgeber an der Branche der körperlichen KI als auch die Wette auf die aufstrebende Neuheit von "KI + physikalische Interaktion" verantwortlich. Im Verlauf hat der Industriekapital weiterhin in diese Branche investiert und ist zu einer der aktivsten Investitionskräfte geworden.
Nehmen wir JD.com als Beispiel. Es hat an einem Tag in drei Unternehmen der körperlichen KI investiert, nämlich Qianxun Intelligence, Zhujie Dynamics und Zhongqing Robotics. Gleichzeitig hat es 2025 auch RoboScience und Pasini im Blick. Die Ziele dieser strategischen Investitionen sind klar: Durch die Investitionen deckt JD.com mehrere Schritte von der gesamten Maschine bis zu den Schlüsselkomponenten ab, baut ein Ökosystem für körperliche KI auf und fördert die Anwendung der Technologie in Szenarien wie Logistik, Lagerung und Werkseinrichtungen.
Ningde Times, das führende Unternehmen im Bereich der Batterien für Elektromobile, hat auch seine Aufmerksamkeit auf diesen Bereich gelenkt. Durch Investitionen dringt es in die Branchenketten ein und bietet Lösungen für die Energieversorgung von Robotern, um die Anwendung von Robotern in Industrie, Logistik und anderen Bereichen zu fördern.
Darüber hinaus hat Meituan seit 2020 in den Robotikmarkt eingestiegen und bisher in mehr als zehn Unternehmen in der Robotik und der körperlichen KI investiert, darunter auch führende Unternehmen. Durch die Investitionen baut Meituan Anwendungszenarien wie lokale Lebensdienstleistungen, Lieferung und Sortierung auf und verbessert die Effizienz der Dienstleistungen und die Benutzererfahrung.
Was die heißeste Finanzierungsbranche betrifft, hat der oben genannte Investor am direktesten bemerkt, dass sich die Investitionen 2025 deutlich an die beiden Pole "früh und klein investieren" und "stark und gut investieren" tendieren.
Einerseits machen die Finanzierungsereignisse in der Seed - Runde, Angel - Runde und Serie A zusammen 74% der Gesamtzahl aus. Viele Kapitalgeber streuen wie Goldsucher frühzeitig und setzen auf das nächste potenzielle Unicorn. Andererseits machen die Finanzierungsrunden ab Serie B 15% aus. Dies bedeutet, dass die Fähigkeit führender Unternehmen, große Summen zu finanzieren, weiter gestärkt wird. Die Investoren stellen in der Regel die "Fähigkeit zur Datenerfassung" und die "Validierung der Umsetzung in Szenarien" als Kernkriterien für die Due Diligence fest.
Bis jetzt, obwohl die vier Unternehmen, die als "Vier Drachen der Datenerfassung für körperliche KI" bezeichnet werden, bei der Datenerfassung unterschiedliche Technologien und Wege verfolgen, versuchen sie alle, einen hochfrequenten, dringenden und skalierbaren Umsetzungsszenario zu erschließen, um die Vorteile der unterliegenden Technologie zu nutzen.
Ein Bericht des GGII (Global Market Research Institute for Robotics) zeigt, dass das globale Marktvolumen im Jahr 2025 voraussichtlich 633,9 Millionen Yuan betragen wird, wobei China mehr als 50% davon ausmacht. Es wird vorausgesagt, dass die weltweite Verkaufszahl humanoider Roboter bis 2030 nahezu 340.000 Einheiten erreichen und das Marktvolumen über 64 Milliarden Yuan betragen könnte.
Daraus folgt, dass in der Vorabend des Ausbruchs des Marktes für humane Roboter Daten, insbesondere hochwertige Interaktionsdaten, der Schlüssel für die Massenumsetzung von humanoiden Robotern sind und ein unumgänglicher Schritt in der Branche ist.
Dieser Artikel stammt aus dem WeChat - Account "DsstCapital" (ID: DsstCapital), Autor: Chen Mei, veröffentlicht von 36