StartseiteArtikel

Dieses Robotikunternehmen steckt "Embodied Data" in 10.000 Rucksäcke.

邱晓芬2026-02-12 20:05
Wenn es um das Modell-Architektur Design geht, im Endeffekt ist es nicht die Architektur, sondern die Qualität der Modellerstellungsdaten, um die es geht. Dies ist ein Konsens in der Branche.

Autor | Su Jianxun

Im Bereich der Embodied Intelligence ist das Sammeln von Daten wahrscheinlich eines der wenigen Gemeinsamkeiten.

Durch das Training mit einer riesigen Menge von Daten wurde das Large Language Model ChatGPT entwickelt, und das "Scaling Law" ist zum Glauben der KI-Experten geworden. Doch in der physischen Welt, zu der die Embodied Intelligence gehört, gibt es keine riesige Menge von Daten wie im Internet. Weder Menschen noch Roboter haben in der Realität genug Daten, um einen GPT-Moment zu reproduzieren.

Deshalb ist es für die Praktiker der Embodied Intelligence eine der wichtigsten Aufgaben, herauszufinden, wie man Daten sammeln kann, wie viele Daten man sammeln kann und wie man die Qualität der Daten gewährleisten kann.

Kürzlich hat eine Roboterkompanie versucht, etwas Neues im Bereich der Datenerfassung zu entwerfen. Lumii Robotics hat das weltweit erste rucksackförmige UMI-Datenerfassungsgerät FastUMI Pro (Rucksackversion) vorgestellt und plant, 2026 10.000 Geräte auszuliefern und in sechs realen Szenarien wie Industrie, Haushalt, Hotel, Restaurant, Einkaufszentrum und Büro eine systematische Datenerfassung durchzuführen.

Das weltweit erste rucksackförmige UMI-Datenerfassungsgerät: Lumii FastUMI Pro (Rucksackversion)

Eine einfache Erklärung von "UMI (Universal Manipulation Interface)": UMI ist ein kostengünstiges Framework für Datenerfassung und Lernen, das von der Stanford University, der Columbia University und dem Toyota Research Institute gemeinsam entwickelt wurde. Im Gegensatz zur Fernsteuerungsmethode der Konkurrenten auf dem Markt kann UMI von der Robotereinheit entkoppelt werden. Das bedeutet, dass die trainierten Daten nicht nur für eine bestimmte Roboterform geeignet sind.

Bei einer Pressekonferenz Anfang 2026 hat Yu Chao, Gründer und CEO von Lumii Robotics, auch über den Vergleich von Effizienz und Kosten zwischen UMI und Fernsteuerung gesprochen:

"Beim Falten von Kleidung beispielsweise benötigt die Fernsteuerungsmethode für die Datenerfassung 50 Sekunden und kostet 3 - 5 Yuan. Wenn man die Methode von FastUMI Pro verwendet, benötigt man nur 10 Sekunden und die Kosten sind weniger als 0,6 Yuan. Somit kann die Effizienz der Datenerfassung erheblich gesteigert und die Kosten gesenkt werden."

Lumii Robotics wurde im September 2024 gegründet. Der Gründer Yu Chao war der ehemalige Leiter des Embodied Robotik-Business von Dreame und hat fast 10 Jahre Erfahrung in der Entwicklung von Embodied Robotern. Er hat die Entwicklung und Serienproduktion von Tausenden von Xiaomi CyberDog geleitet. Der Mit-CTO Ding Yan war einer der ersten in China, der UMI studierte und hat es erstmals aus dem Labor in die Industrie gebracht.

Quantität und Qualität

2025 hat Lumii durch die Einrichtung eines eigenen Datenerfassungszentrums eine Datenproduktionskapazität von 100.000 Stunden erreicht. Yu Chao schätzt, dass die Datenmenge der führenden Embodied Modelle 2026 mindestens 1 Million Stunden betragen wird.

Das wichtigste Ziel von Lumii für 2026 ist es, eine UMI-Datenproduktionskapazität von einer Million Stunden pro Jahr aufzubauen. Das bedeutet, dass Lumii effizientere Methoden einsetzen muss, um mehr Daten zu sammeln.

"Die Trainingsdaten für Roboter sollten nicht so teuer und knapp sein. Die Daten, die Menschen bei ihrer Arbeit in der physischen Welt generieren, gibt es überall, aber sie werden nicht gut gesammelt." sagte Yu Chao.

Das rucksackförmige FastUMI wurde entwickelt, um dieses Problem zu lösen - es ist ein tragbares Standard-Datenerfassungsarbeitsplatz, der die realen Szenarien effizient in hochwertige Trainingsdaten umwandeln kann.

Bisher wurde die Embodied-Datenerfassung hauptsächlich in Laboren oder in einzelnen Szenarien durchgeführt. Dies führt zu einem Problem: Die Roboter wiederholen in der Regel nur wenige Bewegungen in einem Szenario, wodurch die Daten an Vielfalt fehlen und die Generalisierungsfähigkeit des Modells beeinträchtigt wird.

Deshalb möchte Lumii Robotics eine tragbare Datenerfassungsmethode einsetzen, indem die Datenerfassungswerkzeuge direkt in einen Rucksack gepackt werden, um die Schwelle für die Datenerfassung in realen Szenarien zu senken.

In Bezug auf die konkreten Szenarien möchte Lumii Robotics sechs Kernbereiche wie Industrie, Haushalt, Hotel, Restaurant, Einkaufszentrum und Büro abdecken und 30 Unterkategorien von Aufgaben definieren, um ein strukturiertes und mehrdimensionales Operationsdaten-System aufzubauen.

Die integrierte Fähigkeit des "Sammeln - Trainieren - Anwenden" - Zyklus ist der Kern der Dateninfrastruktur von Lumii. Der Start der massiven Datenerfassung stützt sich auf dieses vollständig verbundene Infrastruktursystem: Mit Hilfe von FastUMI Pro hat der zweiarmige Embodied Roboter MOS von Lumii in nur 5 Stunden den gesamten Prozess der Fabrikqualitätskontrolle von "Datenerfassung - Strategietraining - Modellinferenz" abgeschlossen; Nach der Installation von FastUMI Pro in Hefei hat es nur 7 Stunden gedauert, um die Datenerfassung, das Training und die Inferenz in einem realen Szenario abzuschließen.

FastUMI Pro hat den Zyklus von "Datenerfassung - Strategietraining - Modellinferenz" beim Sortieren von Teilen abgeschlossen

Daten zuerst, um Modelle zu trainieren

Neben dem rucksackförmigen Datenerfassungswerkzeug hat Lumii auch eine "Daten-Supermarktkette" eingerichtet, um die gesammelten Daten in standardisierte Produkte umzuwandeln, die von Kunden direkt auf der offiziellen Website gekauft werden können. Man kann sehen, dass das aktuelle Unternehmensstrategie von Lumii, als einer Embodied Intelligence - Firma, hauptsächlich um "Daten" herum kreist.

Die Reihe von Aktionen von Lumii Robotics spiegeln tatsächlich die dringendsten geschäftlichen Bedürfnisse in der Embodied Intelligence wider.

Bei der Pressekonferenz Anfang des Jahres hat Ding Yan, Mit-CTO von Lumii Robotics, Medien wie "Intelligence Emergence" über seine Einsichten in Daten und Modelle berichtet.

"Ich bin aus dem Bereich der Modellentwicklung. Ich habe immer Modelle trainiert und festgestellt, dass es ein großes Problem gibt. Um ein sehr gutes Modell zu trainieren, muss man eine gute Datenpipeline haben, einschließlich Datenproduktion, Datenbewertung und Datenselektion. Der Aufbau dieser Pipeline braucht Zeit." sagte Ding Yan.

Nachdem er die reale Situation der Branche verstanden hatte, entschied Ding Yan und sein Team, dass wenn man zwischen Modell und Daten wählen muss, man zuerst die Daten wählen sollte und nicht direkt mit dem Training des Modells beginnen sollte.

"Am Ende geht es nicht um die Modellarchitektur, sondern um die Qualität der Modelldaten. Das ist ein Konsens in der Branche." sagte Ding Yan.

Die Leistungsfähigkeit der Embodied Intelligence hängt stark von der Menge und Qualität der realen Operationsdaten ab. Wenn die allgemeinen Daten wie Hardware online bestellt werden können, wird die Schwelle für das Modelltraining in der Branche erheblich gesenkt, und die Embodied Intelligence kann von der individuellen Erforschung zur industriellen Produktion übergehen.

Von der "gleichzeitigen Datenerfassung mit 10.000 Geräten" bis zur "Online-Bestellung von allgemeinen Daten" verwandelt Lumii die "überall vorhandenen, aber nicht gesammelten" Operationsdaten in der physischen Welt in eine standardisierte Infrastruktur, die in Massen zur Verfügung gestellt werden kann, und baut damit ein datengesteuertes Ökosystem auf. Wenn die Daten nicht mehr knapp sind, werden die Roboter wirklich universell einsetzbar.

Ende