StartseiteArtikel

Roboter auf der Welle der Mode sind tatsächlich noch weit davon entfernt, "zur Arbeit zu gehen".

差评2025-09-22 12:02
Wenn man Roboter früher zur Arbeit bringen und sie an sozialen Praktiken teilnehmen lässt, dann ist das eine gute Methode.

Es ist allseits bekannt, dass humanoide Roboter dieses Jahr eine der heißesten Technologien sind. Aber ich habe festgestellt, dass je beliebter diese Sache ist, desto größer sind die Kontroversen.

Seit den Robotern, die beim Frühlingsfestfolkdance getanzt haben, entwickelt sich diese Branche wirklich schnell. Im April haben die Roboter noch an einem Marathon teilgenommen, und im August konnten sie schon an Sportmeisterschaften teilnehmen.

Dieses Jahr gab es auch viele verschiedene Roboterausstellungen. Selbst die WAIC, eine Messe, die in den vergangenen Jahren hauptsächlich sich mit Large Language Models befasste, hat diesem Jahr einen großen Bereich für Roboter reserviert.

Aber obwohl es auf der Oberfläche so aussieht, als wäre alles lebhaft und aufregend, hat sich darunter eine andere Stimme entwickelt.

Anfang dieses Jahres hat Zhu Xiaohu von Jinshajiang Venture Capital direkt gesagt: "Humanoide Roboter sind nur eine Blase."

Viele Internetnutzer stimmen ihm in gewisser Weise zu. Der Grund ist offensichtlich. In den Videos scheinen diese Roboter alles zu können, sogar in die Luft zu fliegen. Man würde gern, dass sie morgen schon wie die Terminator werden. Aber in der Realität können diese Stahljungs nicht einmal eine Tür öffnen...

Zunächst möchte ich meine Position klarstellen. Ich denke, dass Embodied Intelligence in Zukunft sicherlich großartige Chancen hat und ein sicherer Wurf ist. Aber um herauszufinden, warum es so viele Kontroversen gibt, habe ich mich auch mit der Branchenlage befasst.

Überraschenderweise habe ich festgestellt, dass einige Probleme tatsächlich nicht ganz unfounded sind.

Weil in der Branche der Embodied Intelligence tatsächlich noch einige Schwierigkeiten bestehen. Nicht nur die Internetnutzer, sondern auch viele Branchenexperten sind sich nicht einig über diese branchenspezifischen Probleme.

Zum Beispiel ist in dieser Branche noch keine einheitliche technische Route festgelegt. Wird in Zukunft die Reinforcement Learning oder das World Model dominieren? Sollten wir uns mehr auf die Daten oder auf das Modell konzentrieren? ... Es gibt keine endgültigen Antworten auf diese Fragen. Jeder macht seine eigene Sache, und es kann keine gemeinsame Kraft gebildet werden.

Kenner werden vielleicht sagen, dass zumindest das Ziel aller diesen Ansätze das gleiche ist.

Ehrlich gesagt, ja. Wenn man nur das Ziel betrachtet, dann ist der ultimative Wert der gesamten Robotikbranche die Teilnahme am Arbeitsmarkt und die Steigerung der Produktivität. Genau wie uns Menschen: "Arbeit ist das Lobenswerteste."

Aber das Problem ist, dass selbst wenn wir diese Differenzen außer Acht lassen, es noch ein direkteres und fataleres Problem für die Branche gibt: fehlende Daten...

Das ist nicht meine Erfindung. Die gesamte Branche steht derzeit vor dem Problem, "ohne Reis zu kochen".

Um ein Large Language Model intelligent zu machen, benötigt man mindestens 10 bis 100 Milliarden Token an Daten, was mehr als das Zehnfache der Modellparameter ist. Aber wie sieht es jetzt aus? Die meisten Forschungen haben nur eine Datenmenge von einigen Hundert Millionen, und der größte öffentliche Datensatz hat nur etwa 1 Milliarde Token.

Wie man sagt: Wiederholung ist die Mutter des Lernens. Wenn die Trainingsmenge nicht ausreicht, kann man natürlich keine neuen Fähigkeiten erlernen.

Deshalb haben die gegenwärtigen Roboter nur sehr wenige Aufgabenarten und eine sehr schlechte Generalisierungsfähigkeit. Mit anderen Worten, ohne genügend Daten, insbesondere Daten aus realen Szenarien, sind die Roboter wie "eingesperrte Ferkel" im Labor. Sobald sie in die Realität kommen, sind sie ratlos.

Die Datenengpässe blockieren die Entwicklung der Roboter aus dem Labor in die Fabriken und in die Haushalte. Auf der Bundang-Konferenz diesen Monats hat auch Wang Xingxing, der Gründer von Unitree, gesagt, dass eines der vielen Herausforderungen, denen die Entwicklung der Embodied Intelligence gegenübersteht, das Problem der Daten ist.

Nehmen wir das VLA-Modell als Beispiel. Die Daten für die Interaktion mit der realen Welt reichen derzeit nicht aus.

Aber es wäre voreilig, die Branche nur wegen dieser Schwierigkeiten zu verneinen. Wir sollten lieber schauen, ob es in der Branche Lösungen gibt.

Wir haben einen Freund getroffen, der sich bei Huawei Cloud mit Embodied Intelligence befasst. Er sagte: "Es stimmt, dass es branchenspezifische Probleme gibt, aber man darf nicht nur auf diese Ebene schauen."

Was heißt das? Um die neuen Probleme in diesen neuen Technologien zu lösen, braucht es natürlich auch neue Methoden und Plattformen.

Zum Beispiel die Cloud-Nutzung, um die verschiedenen Probleme der Robotikbranche systematisch zu lösen.

Nehmen wir das am dringendsten zu lösende Datenproblem, das wir vorhin erwähnt haben.

Da die Datenerfassung und das Training in der Realität sehr schwierig sind, kann man diese Dinge nicht in die Cloud verlagern? Tatsächlich kann man das.

Tatsächlich ist dies auch ein Branchentrend. Das von NVIDIA kürzlich entwickelte Cosmos-Basis-Modell nutzt die Cloud, um synthetische Daten zu generieren und die physikalische KI zu trainieren.

Auch in China hat Huawei Cloud eine CloudRobo Embodied Intelligence Plattform. Sie kann in der Cloud eine digitale Welt schaffen, die genau wie die reale Welt ist, und dann in dieser Welt Daten generieren und trainieren.

Das ist wie das Training in "Matrix". Die Roboter können in der virtuellen Welt alle Fähigkeiten perfekt beherrschen und dann in die reale Welt gehen, um zu arbeiten.

Wie machen sie das konkret? Es ist nicht so kompliziert und hauptsächlich in zwei Schritten.

Der erste Schritt ist die Lösung des Datenproblems, d. h. man muss zuerst Reis haben.

Bei Huawei Cloud CloudRobo steht ein eigenes entwickeltes MetaEngine dahinter, um die Daten neu aufzubauen. Es kann eine reale physikalische Szene in der Cloud als digitales Zwillingsprodukt reproduzieren. Der gesamte Prozess ist wenig arbeitsintensiv und wird automatisch abgeschlossen.

Dann wird in dieser virtuellen Szene die Datenvermehrung durchgeführt. Tatsächlich bedeutet dies, dass in dieser digitalen Welt verschiedene Arten von Robotern simuliert werden und eine riesige Menge an Daten aus erster Person generiert werden, wie RGB-Bilder, Tiefendaten und Zeitreihendaten. Alles ist da, und alle Daten sind automatisch annotiert.

Es wird gesagt, dass in einigen Szenarien die Effizienz des Robotertrainings durch die Anpassung des Verhältnisses von realen Daten zu synthetischen Daten verbessert werden kann, und somit kann das Problem des "fehlenden Reises" im Wesentlichen gelöst werden.

Wang He, der Gründer von Galaxy Universal, hat sogar gesagt, dass synthetische Daten den größten Teil der Trainingsdaten ausmachen werden, und dass es für gewöhnliche Menschen nicht möglich ist, dies zu tun. Es erfordert eine langfristige Akkumulation und Kerntechnik von den Herstellern.

Der zweite Schritt ist die Lösung des Trainings- und Betriebsproblems, d. h. die Roboter müssen lernen, zu arbeiten.

Die Trainingsplattform von CloudRobo ermöglicht es den Robotern, in dieser virtuellen Welt durch das Lernen durch Imitation unzählige "virtuelle Arbeitsvorgänge" durchzuführen. Dies kann die Kosten für Fehlversuche erheblich reduzieren und das Erlernen von Fähigkeiten beschleunigen.

Diese beiden Dinge zusammen sind eine sehr fortschrittliche Idee.

Früher musste man die Bewegungen der Roboter manuell eingeben, um ein Robotermodell zu trainieren. Manche Datenerfassungen erforderten sogar die Bewegungskompensation. Es war wie beim "Iron Fist", wo man sich bewegt und die Daten gleichzeitig aufzeichnet und dann wiederholt lernt.

Aber wenn man all dies in die virtuelle Welt verlagert, ist es sehr bequem, denn das Training in der Cloud hängt vollständig von der Rechenleistung und der Stromversorgung ab. Mit den Garantien der heutigen Cloud-Anbieter kann man in der Cloud in zwei Jahren und einem halben Tag so viel trainieren, wie man es in der Realität in einem Tag nicht schafft. Es ist wie die "4-Uhr-Morgens-Los-Angeles-Situation".

Nachdem die Roboter in der virtuellen Welt fertig trainiert sind, kann ihre Betriebsplattform nahtlos mit den physischen Robotern verbunden werden und direkt in die Robotergehirne übertragen werden. Sobald sie eingeschaltet werden, können sie singen, tanzen und arbeiten. Deshalb überlegen viele große Unternehmen diesen Ansatz.

Es ist bekannt, dass man nicht nur reden, sondern auch handeln muss. Huawei Cloud hat kürzlich ein Zweiarmroboter gezeigt, das von der CloudRobo-Plattform ausgebildet wurde. Es konnte in einer kleinen Lichtverteilungsbox hochpräzise Arbeiten durchführen, und die Erfolgsrate betrug über 90%. Es kann auch einem Industriebeschichtungsarm von EVATAR helfen, schnell das Beschichten neuer Teile zu lernen und einem humanoiden Roboter von Leju helfen, auf der Automobilproduktionslinie zu laden und zu transportieren.

Deshalb denke ich, dass die Lösung des Daten- und Trainingsproblems in der Cloud sehr viel Potenzial hat.

Aber außer der Datensimulationstraining in der Cloudplattform gibt es noch viele komplexe Probleme in der Robotikbranche, und es gibt jetzt auch Lösungen, die auf der Cloud basieren.

Zum Beispiel gibt es in dieser Branche noch das Problem, dass die Branchenstandards in Ordnung sind. Die verschiedenen Robotermanufacturer sind wie die frühen Mobiltelefonhersteller, wie Nokia, Motorola und Ericsson. Die Systeme und die Ladebuchsen sind alle unterschiedlich. In dieser Situation kann es natürlich keine Massenmulti-Robotersynergie wie bei iOS, Android und HarmonyOS geben.

Deshalb braucht man ein einheitliches Protokoll, damit sie sich verstehen können. Der Huawei Cloud-Kollege hat gesagt, dass sie ein Projekt namens R2C (Robot to Cloud) Protokoll haben. Dies ist wie der "Type-C"-Anschluss in der Robotikwelt. Es dient hauptsächlich dazu, die Ökosysteme zu aggregieren und die Branchenstandardisierung voranzutreiben.

Alle Partner, die mit dem R2C-Anschluss vorinstalliert sind, können "plug-and-play" nutzen. Das ist wie wenn man eine neue Maus kauft. Egal ob Windows oder Mac, man kann sie einfach an den USB-Anschluss anschließen und nutzen, ohne nach Treibern suchen zu müssen.

Topspieler aus verschiedenen Bereichen wie das national-regional gemeinschaftlich gegründete Innovationszentrum für humanoide Roboter, Topsun, Youi Intelligent und andere haben sich dem R2C-Protokoll angeschlossen. Es gibt das Gefühl, dass wenn jemand ruft, alle Schulen antworten und alle an Bord gehen.