Mit einem Schätzwert von 39 Milliarden US-Dollar forscht das weltweit teuerste humanoide Roboterunternehmen daran, einen Geschirrspüler mit den Füßen zu schließen.
Die Richtung im Roboterbereich könnte sich wieder ändern.
Am 28. Januar veröffentlichte Figure sein neuester Modell, Helix 02, und begleitete es mit einem Videodemo von etwa dreieinhalb Minuten.
Als Normalsterblicher mag man auf den ersten Blick das Video als durchschnittlich empfinden. Es zeigt nur einen Roboter, der in der Küche herumgeht und einige Aktionen wie das Entnehmen von Tassen aus der Spülmaschine und das Verstauen in der Schublade ausführt.
Allerdings taucht kurz vor Ende des Videos eine äußerst menschähnliche Bewegung auf.
Als es die Spülmaschinentür schloss, stieß es zunächst mit dem Fuß dagegen, um die Tür hochzustoßen, bevor es sich bückte, um die Tür zu schließen.
Man mag es vielleicht schon früher gesehen haben, wie ein Roboter Tassen einsammelt, aber diese Bewegung war bisher noch nicht zu sehen.
In der Vergangenheit war die Logik der Roboter, die uns vertraut waren, in Blöcke aufgeteilt. Navigation, Gehen, Greifen - diese Aufgaben wurden in voneinander unabhängige Module aufgeteilt.
Die Roboter im Jahr 2025 lassen sich grob in zwei Kategorien einteilen. Eine Kategorie betrifft Roboter mit Ganzkörperkontrolle, wie die tanzenden Roboter. Im Wesentlichen führen sie ein starres Programm aus. Selbst wenn sie auf ein Hindernis stoßen, werden sie mechanisch weiter tanzen.
Die andere Kategorie betrifft Roboter mit feinfühliger Handhabung, wie die Tassen einsammelnden Roboter. Normalerweise ist nur der Oberkörper dieser Roboter aktiv, während der Unterkörper wie ein starrer Sockel auf Rädern sitzt und nur für die Bewegung zuständig ist.
Der Durchbruch von Helix 02 liegt darin, dass in diesem Modell Bewegung und Handhabung vollständig vereinigt sind, was die Probleme beider Roboterarten löst.
Die Ingenieure von Figure haben es nicht vorab trainiert, „wie man mit dem Fuß die Tür stoßen kann“. Diese Bewegung war eine spontane Wahl des Roboters auf der Grundlage seines internen Wissens - es hat vielleicht entschieden, dass es für das Gleichgewicht ungünstig wäre, sich zu tief zu bücken, und hat daher auf der Grundlage der aktuellen physikalischen Umgebung selbstständig entschieden, dass „mit dem Fuß stoßen“ die effektivste Hilfsmethode ist.
Im Jahr 2025 hat Figure offiziell angekündigt, dass sein Unternehmenswert auf 39 Milliarden US - Dollar gestiegen ist, was dreimal so hoch ist wie der angebliche Börsenwert von Unitree von 100 Milliarden Yuan.
Dieses weltweit teuerste humanoide Roboterunternehmen hat herausgefunden, wie man mit dem Fuß die Spülmaschinentür schließt. Dies könnte schließlich die Kritik an tanzenden Robotern, die keine Arbeit können, beenden und die nächste Roboterwelle einleiten.
01 Vereinigung von Bewegung und Handhabung humanoider Roboter
Diesmal hat Figure sein neues Modell, Helix 02, veröffentlicht.
Das Modell selbst ist ein End - zu - End - Design.
Die Panoramakamera im Kopf, die Nahaufnahmekamera in der Handfläche, die taktilen Sensoren an den Fingern und der Bewegungszustand aller Gelenke im ganzen Körper werden in das neuronale Netzwerk eingespeist.
Das Ergebnis ist ein vollständiges Ganzkörperbewegungspaket. In dieser Momentanentscheidung sind die Stützkraft der Beine, die Balanceneigung des Rumpfs, die Ausdehnungspfade der Arme und die Kraft der Fingerspitzen enthalten.
Ein einziges Modell kann den Roboter mit 30 Freiheitsgraden von Figure 03 steuern.
Die derzeit vorherrschenden VLA - Modelle sind in der Regel darauf angewiesen, dem Roboter eine riesige Datenmenge zuzuführen. Beispielsweise werden sie mit Daten trainiert, die von Menschen gewonnen werden, die einen Roboter ferngesteuert haben, um Tassen einzusammeln, damit sie diese Fähigkeit erlernen.
Im Vergleich dazu lernt das neuronale Netzwerk von Helix 02 nicht mehr, „wie man eine Aufgabe zum Einsammeln von Tassen ausführt“, sondern eher „die allgemeinen Regeln menschlicher Bewegung“. Helix 02 lernt aus über 1000 Stunden von auf Gelenke umgerichteten menschlichen Ganzkörperbewegungsdaten und gewinnt dadurch ein allgemeines physikalisches Vorwissen.
Außer dem Stoßen der Spülmaschinentür mit dem Fuß hat auch eine andere Bewegung breite Aufmerksamkeit erregt.
Beim Schließen der Schublade nach dem Entnehmen von Gegenständen hat das Modell von Helix 02 einfach entschieden, die Schublade mit der Hüfte zu stoßen, um die Schubladentür zu schließen.
Figure hat in seinem Blog erklärt, warum es ein solches System zur Kombination von Bewegung und Handhabung entwickelt hat:
Mobile Manipulation, d. h. die Fähigkeit eines Roboters, Bewegung und Manipulation von Gegenständen als eine einzige, kontinuierliche Handlung auszuführen, war immer eines der schwierigsten Probleme im Roboterbereich. Dies liegt nicht daran, dass die einzelnen Fähigkeiten so schwierig zu realisieren sind, sondern daran, dass es schwierig ist, beide Fähigkeiten gleichzeitig klar zu trennen. Wenn ein Roboter ein schweres Objekt hebt, ändert sich seine Balance; wenn er einen Schritt vorwärts macht, ändert sich auch seine Reichweite. Arme und Beine begrenzen sich ständig gegenseitig.
Humanoide Roboter haben beeindruckende kurzfristige Verhaltensweisen gezeigt, wie z. B. Springen, Tanzen und Yoga. Aber fast alle Roboter haben eine Einschränkung: Sie sind nicht wirklich steuerbar. Die meisten Systeme wiederholen einfach voreingestellte Bewegungen offline mit begrenzter Rückmeldung. Wenn sich ein Objekt bewegt oder die Kontaktbedingungen sich ändern, bricht das Verhalten zusammen.
Traditionelle Roboter lösen dieses Problem, indem sie Bewegung und Manipulation in verschiedene Controller aufteilen und diese mit einem Zustandsautomaten verbinden: Gehen, Stoppen, Stabilisieren, Ausstrecken, Greifen, wieder gehen. Diese Art der Umschaltung ist langsam, schwer zu beurteilen und unnatürlich.
Echte Autonomie erfordert etwas grundlegend Andersartiges: ein einzelnes Lernsystem, das gleichzeitig über den gesamten Körper nachdenken kann. Ein System, das kontinuierlich wahrnehmen, entscheiden und handeln kann - während es geht, transportiert es Gegenstände, während es nach etwas greift, passt es seine Balance an und korrigiert Fehler in Echtzeit.
Tatsächlich ist dieser Ansatz mit dem übereinstimmend, den Figure bei der Entwicklung des ersten Helix - Modells verfolgte. Damals hat Helix bewiesen, dass ein einzelnes neuronales Netzwerk den gesamten Oberkörper eines Roboters steuern kann, nicht nur den Roboterarm oder die Greifzange.
Aber in dieser Phase war diese Fähigkeit immer noch begrenzt. Da der Sockel des Roboters fest oder unabhängig war, konnte er nur in einem begrenzten Bereich aktiv sein.
Mit der Entstehung von Helix 02 wird die End - zu - End - Steuerung auf jedes Gelenk des Roboters erweitert, was eine echte Ganzkörperautonomie ermöglicht.
Und in diesem ungeschnittenen Video hat Helix 02 61 Bewegungs - und Handhabungsaktionen nacheinander ausgeführt und hat sogar Bewegungen wie das Bücken gezeigt, die sowohl die Balance als auch die Handhabungskapazität testen. Dies zeigt, dass Helix 02 in diesem System einen gewissen Erfolg erzielt hat.
Wenn man als Zuschauer direkt hinsieht, wenn Bewegung und Handhabung in ein Modell integriert sind, scheint der Roboter eine gewisse grundlegende Körperwahrnehmung zu entwickeln und versteht endlich, „ich halte etwas in der Hand, also stoße ich die Schublade mit der Hüfte zu“. Dies ist eine Art von Intuition, die bisher nur Menschen hatten, dass „der gesamte Körper ein Werkzeug ist“.
02 Das mysteriöse System 0
Ein Teil der Ursache für diese Vereinigung liegt darin, dass in die Architektur von Helix 02 dieses Mal eine äußerst wichtige untere Komponente, System 0, integriert wurde.
Dies ist ein speziell für physikalische Instinkte verantwortliches neuronales Netzwerk. Bevor es existierte, mussten Ingenieure komplexe physikalische Gleichungen manuell schreiben, um die Balance des Roboters aufrechtzuerhalten. Figure hat diesmal 109.504 Zeilen manuell geschriebenen C++ - Codes gelöscht und stattdessen ein einzelnes neuronales Netzwerk als Vorwissen eingesetzt.
Die Kernaufgaben von System 0 sind nur drei: Balance, Kontakt und Ganzkörperkoordination. Es arbeitet mit einer Frequenz von 1000 Hertz, was bedeutet, dass es dem Motor alle Sekunde 1000 Befehle erteilt. Diese extrem hohe Verarbeitungsgeschwindigkeit ermöglicht es ihm, wie eine menschliche Rückenmarksreflexion, die Muskelkräfte auszugleichen, bevor man sich überhaupt bewusst ist, dass man „fallen wird“.
Was noch interessanter ist, ist die Trainingsmethode von System 0. Die Ingenieure haben keine komplexen Belohnungsfunktionen für Gehen, Drehen oder Hocken entwickelt, sondern dem Modell einfach über 1000 Stunden von auf Gelenke umgerichteten menschlichen Ganzkörperbewegungsdaten zugeführt und in der Simulation ein Training mit verstärktem Lernen durchgeführt.
Während des Lernens, wie man „menschliche Bewegungen wiederholen“ kann, hat das Modell selbstständig gelernt, wie man die Momente des gesamten Körpers koordiniert und wie man das Gleichgewicht in verschiedenen Haltungen aufrechterhält. Deshalb wirken die Bewegungen von Helix 02 nicht mehr steif, denn es berechnet nicht mehr die Balance nach einer Formel, sondern kopiert eine von Daten bestätigte „menschliche Intuition“.
In der dreistufigen Architektur von Helix 02 hat jede Stufe eine klare Aufgabenteilung. Auf der höchsten Stufe befindet sich System 2, das wie ein ruhiger Kommandant fungiert und für semantische Schlussfolgerungen zuständig ist. Es muss sich nicht mehr darum kümmern, wie der Roboter einen Schritt macht, sondern gibt direkt vage Zielbefehle, wie „Gehe zur Spülmaschine und öffne sie“ oder „Bring die Tassen auf den Tresen“.
Die mittlere Stufe, System 1, ist der wendige Ausführungsmanager. Es arbeitet mit einer Frequenz von 200 Hertz und ist dafür verantwortlich, die von den Augen gesehenen Pixel und die Ziele des Kommandanten in Bewegungsziele für die 30 Gelenke im ganzen Körper umzuwandeln.
Schließlich werden diese Ziele an System 0 übergeben und in reale Drehmomentausgaben umgewandelt. Auch bei Fehlern kann eine hochfrequente Korrektur vorgenommen werden.
Tatsächlich war die Diskussion über dieses Modell bereits im Jahr 2025 ein neues Thema im Roboterkreis.
Der Investor in Embodied Intelligence, Bihe, hat erwähnt, dass das von NVIDIA veröffentlichte Projekt Sonic und das Out - of - Body - System der Westlake University ähnliche Logiken gezeigt haben. Das Projekt Sonic von NVIDIA hat damals 700 Stunden an Daten verwendet. Noch früher lässt sich diese Technologie bis zu klassischen Arbeiten in der Wissenschaft zurückverfolgen, wie die DeepMimic - und BeyondMimic - Serien.
Auf der CES 2026 hat Sharpa auch eine ähnliche Arbeit wie CraftNet gezeigt, deren Kern ebenfalls die Kopplung von System 1 und System 0 ist.
Das von Sharpa vorgeschlagene „Last - Millimeter - Intelligence (LMI)“ nutzt System 0, um in dem Moment, in dem es ein Objekt berührt, eine Echtzeitfeinabstimmung über taktile und Kraftrückmeldung vorzunehmen. Die Betriebsfrequenz von System 0 beträgt etwa 100 Hz, was es dem Roboter ermöglicht, wie eine menschliche Hand den Widerstand und das Rutschen zu spüren und in Echtzeit zu korrigieren.
Im Jahr 2026 werden die Überraschungen, die System 0 für Roboter bringt, vielleicht noch größer werden.
03 Das teuerste humanoide Roboterunternehmen
Abgesehen von der Ganzkörperautonomie gibt es bei Helix 02 noch viele andere Highlights:
Beispielsweise erreicht Helix 02 mit der Hardwarebasis von Figure 03 tatsächlich die Grenzen der feinfühligen Manipulation mit mehreren Fingern. Frühere humanoide Roboter waren oft hilflos, wenn es um „Selbstverschattung“ ging - sobald der Körper die Sicht der Kopf - Kamera blockierte, war der Roboter blind. Aber Figure hat in die Handfläche jeder Hand eine Weitwinkelkamera integriert, was ihm eine Art „Gottessicht“ verleiht.
In Kombination mit den taktilen Sensoren an den Fingern, die eine Mikrokraft von 3 Gramm erfassen können, kann es jetzt äußerst feine Aktionen ausführen: Ein dünnes Tabletten aus einem durcheinander liegenden Arzneimittelbehältnis herausnehmen oder 5 Milliliter Flüssigkeit präzise aus einer Spritze drücken. Diese Präzision bedeutet, dass der Roboter nicht mehr nur körperliche Arbeit wie das Transportieren von Kisten verrichten kann, sondern auch die Fähigkeit entwickelt, komplexe Industrieteile zu bearbeiten und sogar Haushaltsarbeiten zu erledigen.
In Silicon Valley ist der Roboter von Figure ein relativ mysteriöses Wesen. Sie erscheinen selten auf belebten Messen.
Aber auf dem Kapitalmarkt ist die Resonanz gewaltig. Im September 2025 absolvierte Figure eine C - Runde - Finanzierung von über einer Milliarde US - Dollar, und der Unternehmenswert stieg auf 39 Milliarden US - Dollar.
Der Gründer von Figure, Brett Adcock, ist ein äußerst hart