2026 wird es lukrativer sein, Daten zu verkaufen als Roboter.
Hinter der 99%-igen Datenlücke bei embodied intelligence: Wer verkauft die "Schaufeln"?
Humanoidroboter können auf der Frühlingsgalatheater tanzen und Marathon laufen, aber können einen unbekannten Deckel nicht öffnen.
Dies liegt daran, dass die Daten nicht genug "Weltwissen" haben. Im Jahr 2026, als die Kapitalwelle die embodied intelligence-Branche erobert, taucht eine grausame Wahrheit ans Licht: Hohe Qualität an embodied-Daten ist zur größten Kette geworden, die die Evolution von embodied intelligence hemmt. Angesichts der 99%-igen Datenlücke geben alle Akteure in der Branche ihr Bestes, um an der Dateninfrastruktur zu arbeiten. Dieses Jahr wird daher als das "Jahr der Datenmassivierung" von embodied intelligence angesehen.
"Was wir unter 'Jahr der Massivierung' verstehen, ist nicht, dass das Problem gelöst ist, sondern dass die Branche erstmals vom 'Erstellen von Demos' in die Phase des 'Aufbaus eines massiven Datensystems' eintritt." So sagte ein Mitarbeiter von Guanglun Intelligence gegenüber Digital Frontline. Sie beobachteten drei Dinge: Erstens ist eine Million Stunden an effektiven, hochwertigen Daten der Eintrittsschwellenwert für Spitzenteams geworden; zweitens ist der Datenaufwand von einem Randbudget zu einem Kernbudget geworden; drittens beginnen immer mehr reale industrielle Szenarien, für die Dateninfrastruktur zu zahlen, die für das Training, die Bewertung und die Implementierung von embodied intelligence benötigt wird.
In der AI-Szene gibt es seit jeher eine unumstößliche Regel: Diejenigen, die am schnellsten Geld verdienen, sind immer die "Schaufelverkäufer". Im Jahr 2026 entfacht sich heimlich ein Geschäft mit embodied-Daten.
Embodied-Daten: Die Nachfrage explodiert
Zu Beginn des Jahres 2026 steigt die Datennachfrage im Bereich der embodied intelligence rapide an.
"Ich denke, die Nachfrage ist um das Hundertfache im Vergleich zum vergangenen Jahr gestiegen." So gab Yang Haibo, Mitbegründer und Präsident von Guanglun Intelligence, preis. Als Unicorn-Unternehmen im Bereich der embodied-Daten hat Guanglun Intelligence einen deutlichen Anstieg in seinem Datenbusiness verzeichnet. Im ersten Quartal 2026 hat es Aufträge im Wert von 550 Millionen Yuan erhalten, mehr als im gesamten Jahr 2025, was einen neuen Branchenrekord setzt. Über 80% der Simulationsassets und synthetischen Daten bei den wichtigsten internationalen embodied intelligence-Teams stammen von dieser Firma.
Hinter diesem Erfolg steckt die Tatsache, dass Daten auf eine bisher nie dagewesene strategische Ebene gehoben wurden. "Seit Anfang dieses Jahres sind embodied-Daten von einem Nebeneinsatz zu einem Kernbudgetposten geworden und gehören zu den am schnellsten wachsenden Teilen im Kundenbudget." So sagte ein Mitarbeiter von Guanglun Intelligence gegenüber Digital Frontline. Die Branche hat erkannt, dass nicht nur Algorithmen und die Roboter selbst, sondern auch ein kontinuierlicher, iterierbarer und bewertbarer Datensupply-Sektor die Obergrenze der Modellfähigkeiten und die Geschwindigkeit der Szenarioimplementierung bestimmen.
Yao Maoqing, Vorsitzender und CEO von Mifeng Technology, einer Tochtergesellschaft von Zhiyuan Robot, spürt ebenfalls diese Welle. Im April gab er preis, dass die Datennachfrage derzeit bei Spitzenteams von großen Modellen, embodied intelligence-Konzernen und Start-ups in China und im Ausland konzentriert ist. "Die Nachfrager sind im Allgemeinen in einem Zustand, in dem sie so viel kaufen, wie man anbietet, und so bald wie möglich brauchen."
In seiner Ansicht wird Daten wie Rechenleistung zu einem grundlegenden Produktionsfaktor mit Investitionscharakter und Rücklaufzeit. "Die Schaufelverkäufer verdienen zuerst das Geld." Yao Maoqing ist der Meinung, dass die Branche derzeit riesige Mengen an Daten benötigt, um Anwendungen zu entwickeln und zu validieren. Angesichts des Prinzips, dass die Infrastruktur zuerst aufgebaut werden muss, wird die Rücklaufzeit für Daten kürzer sein als für Roboter oder Lösungen für bestimmte Branchen.
Die Branche ist sich einig, dass hinter dieser starken Nachfrageerhöhung hauptsächlich drei Treiber stehen:
Erstens: Die Evolution des "Gehirns" zwingt die Daten "Nahrung" zu liefern. Der Kernhaken, der die Massenimplementierung von Robotern hemmt, hat sich von der Hardware und der unteren Ebenen der Steuerung auf das "Gehirn", d. h. die embodied intelligence-Modelle selbst, verschoben. Embodied VLA und Weltmodelle machen rasante Fortschritte und treten in komplexere Aufgabenräume ein. In diesem Prozess müssen sie mit einer riesigen Datenmenge gefüttert werden.
Zweitens: Die industrielle Implementierung beschleunigt, und die Datennachfrage steigt von der Laborstufe auf die Implementierungsstufe. Wenn Roboter in Fabriken, Logistikzentren, Handelsbetrieben und andere reale Szenarien eintreten, steigt die Anforderung an die Datenmenge erheblich. "Ein Roboter benötigt möglicherweise eine Tausendstunden-Datenmenge, um eine einzelne Aufgabe zu erfüllen, und noch mehr für komplexe Aufgaben." So sagte Yang Haibo.
Drittens: Der Wert von nicht-roboterspezifischen Daten wird bestätigt, und die Erfassungseffizienz steigt sprunghaft. In der Vergangenheit wurde die Erfassung von embodied-Daten hauptsächlich manuell im Labor durchgeführt, und es konnten pro Tag nur wenige Stunden an Daten erfasst werden, was weit davon entfernt war, die für das Training von embodied intelligence-Modellen und die industrielle Implementierung erforderliche Datenmenge zu decken. Heute werden Technologien wie VR-Fernsteuerung, Exoskelette, UMI, Ego und andere immer reifer, und die Datenerfassung geht von einer kleinen, ineffizienten "Handwerksstatt" in eine Phase der größeren und effizienteren Datenmassivierung über.
Im krassen Gegensatz zur explosiven Nachfrage ist jedoch die gravierende "Datenwüste". Die Branche ist sich einig, dass für das Training eines embodied-Modells mit allgemeiner Generalisierungsfähigkeit mindestens eine Million Stunden an Daten erforderlich sind. Bis Anfang 2026 belief sich die globale Menge an hochwertigen, realen physikalischen Interaktionsdaten jedoch nur auf etwa 500.000 Stunden, weniger als ein Zwanzigtausendstel der Trainingsdaten für große Sprachmodelle. Die Daten von CSDN zeigen auch, dass embodied intelligence Hunderte von Petabyte an physikalischen Interaktionsdaten benötigt, und die aktuelle Lücke beträgt über 99%.
Angesichts von Chancen und Hindernissen hat ein Kampf um embodied-Daten begonnen.
Die Datenpyramide: Die Akteure positionieren sich
Angesichts der 99%-igen Datenlücke hat die Angebotsseite das sporadische Ausprobieren hinter sich gelassen und schnell eine Welle der Dateninfrastrukturentwicklung ausgelöst.
"Eine Million Stunden" ist zum Standard-Eintrittsschwellenwert geworden. Lingchu Intelligence, Luming Robot, Xinghaitu und andere setzen sich gemeinsam auf die Erfassung von einer Million Stunden an effektiven Daten. JD hat vorgeschlagen, innerhalb von zwei Jahren 1 Million Stunden an Roboter-Daten und 10 Millionen Stunden an Videos von realen menschlichen Szenarien zu erfassen. Mifeng Technology hat angekündigt, dass es 2026 eine Kapazität von einer Million Stunden an Daten erreichen wird.
Hinter der massiven Kapazitätserweiterung in der Branche steht ein allgemeines Konsensmodell der "Datenpyramide": Die Spitze besteht aus echten Roboter-Daten, die die höchste Genauigkeit haben und am besten an reale Szenarien angepasst sind, aber teuer und rar sind; die Mitte besteht aus synthetischen Simulationsdaten, die kostengünstig und leicht massenproduzierbar sind, aber das Problem der "Sim-to-Real"-Migration haben; die Basis besteht aus Internet-Videos und menschlichen Verhaltensdaten, die eine hohe Generalisierungsfähigkeit haben, aber eine niedrige Genauigkeit und eine große Menge an Reinigung und Handlungsausrichtung erfordern. Alle drei Arten von Daten sind unverzichtbar, und die Branchenakteure positionieren sich um die Pyramide herum.
Die Angebotsseite hat zuerst die echten Roboter-Daten an der Spitze der Pyramide angegriffen. Die Mainstream-Fernsteuerungsdaten werden als "Golddaten" angesehen, die von Fachleuten durch Fernsteuerung von realen Robotern über Master-Slave-Systeme oder VR-Geräte erzeugt werden. Laut Drittanbieterdaten hatten bis Anfang April 2026 in China 64 embodied intelligence-Datenerfassungszentren, Innovationszentren und Trainingsplätze entworfen oder geplant, die mindestens 27 Städte abdecken.
Spitzenunternehmen sind die Hauptakteure bei der Infrastrukturentwicklung: Zhiyuan hat Datenerfassungszentren in Shanghai, Chengdu und anderen Städten eingerichtet; Luming Robot hat drei standardisierte Datenerfassungszentren gebaut. Nach der Eröffnung seiner Datenerfassungsfabrik in Tianjin im April letzten Jahres hat Pasini dieses Jahr angekündigt, dass es in Suqian, Wuhan, Ganzhou und anderen Städten weitere vier Datenerfassungsfabriken bauen wird. JD plant, 600.000 Menschen zur Crowdsourcing-Datenerfassung zu mobilisieren. Die lokale Regierung in Shanghai Zhangjiang hat das erste heterogene Humanoidroboter-Trainingszentrum in China errichtet und hat sich das Ziel gesetzt, in diesem Jahr 5 Millionen echte Roboter-Daten zu erfassen.
Aber aufgrund der Erfassungskosten und -effizienz ist es schwierig, die echten Roboter-Daten schnell zu massenproduzieren. Die Branche wendet sich zunehmend einer Mischstrategie zu, die auf die "Stärkung der synthetischen Simulationsdaten in der Mitte und die Verstärkung der menschlichen Daten an der Basis" abzielt, um die absolute Abhängigkeit von den teuren echten Roboter-Daten zu verringern.
Synthetische Simulationsdaten sind derzeit die Hauptroute zur Massenproduktion von Daten. Guanglun Intelligence geht davon aus, dass die Simulationsdaten in Zukunft die Aufgaben der massiven Vorabtraining, Bewertung und verstärkten Lernens übernehmen werden, die menschlichen Videodaten das Verhaltensvorwissen liefern werden, und die echten Roboter-Daten hauptsächlich für die Szenarioausrichtung und die endgültige Optimierung von 1% verwendet werden werden. Dazu hat Guanglun Intelligence einen eigenen physikalischen Simulationsmotor entwickelt, der die Bewegungs- und Verformungsgesetze der realen Welt nachbildet, und ein Technologiesystem aufgebaut, das die Generierung von Simulationswelten, die Massenproduktion von Daten und die Bewertung der Modellfähigkeiten abdeckt.
Neben den echten und synthetischen Daten rücken daten ohne Roboter, wie UMI und Ego-centric-Daten (erstpersonliche menschliche Videodaten, im Folgenden Ego-Daten genannt), in den Vordergrund. Diese Daten können einfach durch das Tragen von tragbarem Gerät von Erfassern aufgezeichnet werden und zeichnen sich durch Effizienz, Kostengünstigkeit und starke Generalisierungsfähigkeit aus. Yao Maoqing gab preis, dass der Marktpreis für echte Roboter-Daten in China etwa 500 - 1.000 Yuan pro Stunde beträgt. Die Erfassungseffizienz von daten ohne Roboter ist etwa zwei- bis dreimal höher als die von echten Roboter-Daten. Obwohl es in der Vergangenheit aufgrund der fehlenden Massenproduktion Fälle gab, in denen die Preise teurer waren, wird erwartet, dass sich der Preis schließlich auf ein Drittel bis die Hälfte der echten Roboter-Daten einpendelt.
Bei der UMI-Lösung wird die Bedienung manuell mit einer Greifzange demonstriert und von einer Kamera aufgezeichnet. Solange das Aussehen der Greifzange und die Kamera-Parameter übereinstimmen, können die Daten für verschiedene Roboterarme verwendet werden, was die Wiederverwendung von daten ohne Roboter ermöglicht. Die Ego-Daten werden über Kopf- und Handgelenkgeräte erfasst, die die erstpersonliche Perspektive und die Bewegungsinformationen aufzeichnen. Beide Lösungen ermöglichen leichter die "Crowdsourcing-Erfassung".
Luming Robot hat das "Gesamtpaket" für die daten ohne Roboter-Erfassung FastUMI veröffentlicht und plant, 2026 eine Kapazität von über 1 Million Stunden an UMI-Daten zu erreichen. JD hat das selbst entwickelte Ultra-HD-Erfassungsterminal JoyEgoCam vorgestellt, das für Lager, Handel, Haushalt und andere Szenarien geeignet ist. Mifeng Technology hat die MEgo-Serie von daten ohne Roboter-Erfassungsgeräten veröffentlicht und plant, dass 60% - 70% seiner geplanten Kapazität von einer Million Stunden an Daten in diesem Jahr aus der daten ohne Roboter-Erfassung stammen werden.
Der Markt für embodied-Daten entwickelt sich rasant, aber eine Million Stunden ist noch lange nicht das Ziel. Der echte Engpass in der Branche liegt nicht an einer einzigen Datenquelle, sondern an der fehlenden einheitlichen, zirkulierbaren und nachhaltigen Dateninfrastruktur. JD hat eine ganzheitliche Infrastruktur für embodied intelligence-Daten und eine Datenhandelsplattform vorgestellt. Leju hat zusammen mit China Mobile, Huawei, Alibaba Cloud und anderen eine Datenökosystem aufgebaut. Mifeng Technology hat sich als One-Stop-Physik-AI-Datendienstplattform positioniert. Guanglun Intelligence verbessert auch kontinuierlich seinen embodied-Datenmotor, baut ein Simulationsökosystem und einen Bewertungszyklus auf und plant, in diesem Jahr zusammen mit über 1.000 Szenarioanbietern eine Million Stunden an embodied-Daten zu produzieren.
Welche Daten können embodied intelligence sättigen?
Mit dem Beginn des Kampfes um embodied-Daten taucht eine entscheidende Frage auf: Was interessiert die Datennachfrager am meisten bei der Anschaffung? Welche Daten sind die "guten Daten", die die Branche derzeit am dringendsten benötigt?
Ein Mitarbeiter von Guanglun Intelligence sagte gegenüber Digital Frontline, dass die Kunden heute bei der Anschaffung von embodied-Daten nicht mehr so sehr an der "Menge" oder dem "Preis pro Einheit" interessiert sind, sondern daran, ob diese Daten tatsächlich zu einer Verbesserung der Modellfähigkeiten führen können. Sie kaufen nicht nur "Datenmenge", sondern "die systematische Fähigkeit, das Training, die Bewertung und die Implementierung in einem geschlossenen Zyklus zu unterstützen".
Cao Yu, Leiter der embodied-Datenlösung von Kupasi, sagte auch, dass die allgemeine Rückmeldung nach Gesprächen mit Spitzenunternehmen sei: Der Algorithmus derzeit nicht mehr einfach neue Daten benötige, sondern eine Methode, wie die Daten direkt in das Modell eingespeist und ausgeführt werden können. Man müsse von der endgültigen kommerziellen Anwendungsumgebung ausgehend zurückschließen, wie die Daten erfasst, markiert, trainiert und bewertet werden sollten und ob die Effekte erklärt werden können. Die Branche strebt den "AI ready"-Zustand an.
Ein Mitarbeiter von JD's embodied intelligence sagte: "Die Kunden interessieren sich zuerst für die Art der Daten und fragen, ob es sich um Fernsteuerungs- oder Kopfgerätedaten handelt. Zweitens interessiert sie, ob die Daten bereits markiert sind und welche Dimensionen markiert wurden, wie z. B. Handpunkte, Position, Textbeschreibung und ob die Genauigkeit im Millimeter- oder Zentimeterbereich liegt." Dies wird zu einem wichtigen Kriterium für die Entscheidung der embodied-Unternehmen, ob sie die Daten verwenden möchten.