Die Ära der „großen Werbung“ für Embodied Intelligence: Begleiterroboter könnten der einzige Ausweg sein
Am 20. Juni veröffentlichte Figure CEO Brett Adcock auf X ein Diagramm. Die Kurve der Roboterbestände durchbrach die Kurve der Mitarbeiterzahl nach oben.
Die Bildunterschrift lautet: "For the first time, robots now outnumber humans at Figure."
Einige Leute auf X jubelten über einen "Wendepunkt", andere machten Spaß mit "Good luck humanity". Technische Medien folgten schnell nach und es begannen in den Titeln Wörter wie "Meilenstein" und "historischer Moment" aufzutauchen.
Wenige bemerkten jedoch, dass das Vorspiel dieses Diagramms die 200-stündige Live-Übertragung vor einem Monat war. Drei Roboter sortierten in der Nähe von 250.000 Paketen neben einer Förderband. Ein 10-stündiger Vergleichstest zwischen Mensch und Maschine zeigte, dass der Roboter pro Paket 2,83 Sekunden benötigte, während der menschliche Praktikant 2,79 Sekunden brauchte. Der Unterschied betrug weniger als 0,04 Sekunden.
Zwischen diesen beiden Veröffentlichungen lag nur ein Monat. Die erste belegte die "Fähigkeit", die zweite die "Serienproduktion". Der Rhythmus scheint perfekt, ist aber tatsächlich eine sorgfältig geplante Erwartungsverwaltung. Im Tech-Bereich ist es schließlich oft viel einfacher, ein schönes Diagramm zu erstellen als einen Roboter zu bauen, der sich selbst reparieren kann.
200-stündige Live-Übertragung: Die geschickteste Testumgebung gewählt
Von dem 14. bis 22. Mai live-übertragte Figure acht Tage lang von seinem Hauptquartier in San José. Drei F.03-Roboter standen neben einer Förderband und wiederholten ständig eine Aufgabe: Sie erkannten die Pakete, hoben sie auf, drehten sie, scannen den Barcode und legten sie wieder auf die Förderband, mit dem Barcode nach unten.
Fast 250.000 Pakete in 200 Stunden ohne Pause. Das klingt beeindruckend, aber wenn man es genauer betrachtet, ist dies ein klassisches Szenario in der industriellen Automatisierung. Das Förderband bewegt sich mit konstanter Geschwindigkeit, die Pakete haben feste Abmessungen, die Barcode-Position ist bekannt und die Bewegungen sind einfach und wiederholend. Traditionelle Roboterarme sind in einem solchen Szenario in Effizienz, Präzision und Stabilität weit über menschoidlichen Robotern, haben niedrigere Kosten, eine niedrigere Ausfallrate und sind einfacher zu warten.
Figure hat in der optimalen Umgebung gerade einmal die Geschwindigkeit des menschlichen Praktikanten erreicht. Dies kann nicht als Durchbruch gelten, sondern zeigt eher die Peinlichkeit der menschoidlichen Roboter: In dem am besten für Automatisierung geeigneten Szenario hat er gerade erst die Schwelle des menschlichen Anfängerlevels erreicht. Selbst in der am besten geeigneten Logistik-Sortierszene kann man von keiner Führung der menschoidlichen Roboter sprechen.
Der Express-Sortierroboter von ABB (dem schweizerischen Industrieroboter-Riesen) kann pro Stunde 1.500 Pakete verarbeiten. Das Sortiersystem von AGV (Automated Guided Vehicle) kann durchschnittlich zwischen 640 und 1.100 Pakete pro Stunde verarbeiten. Drei Figure-Roboter zusammen haben in 10 Stunden 12.732 Pakete verarbeitet, was einer Leistung von etwa 424 Paketen pro Stunde und Roboter entspricht. Dies ist nicht das Problem, "dem Menschen nahe zu sein", sondern der Roboter kann nicht einmal den Abgasen eines traditionellen Roboterarms folgen.
Das wahre Prüfsteing für menschoidliche Roboter ist nie die standardisierte Sortierung. "Selten auftretende Ausnahmen" wie plötzliches Anhalten des Förderbands, beschädigte oder auslaufende Pakete, verdeckte Barcodes sind die wirklichen Herausforderungen. Diese wurden in der Live-Übertragung absichtlich vermieden. Die Roboter behandelten nur Standardpakete. Abnormale Pakete wurden entweder von der Förderband geschoben oder lösten eine "Automatische Rücksetzung" aus, bis die Hintergrundingenieure sie remote behandelten.
Ayanna Howard, der Dekan der Fakultät für Ingenieurwissenschaften der Ohio State University, beurteilte diese Demonstration als eher ein wissenschaftliches Projekt, das noch weit von einem reifen kommerziellen Service entfernt ist.
Figure möchte nicht, dass Sie die Ausnahmen, die Rücksetzungen oder die Expertenmeinungen in Erinnerung behalten. Sie wollen nur, dass die Öffentlichkeit drei Zahlen in Erinnerung behält: 250.000 Pakete, 200 Stunden, nahe der menschlichen Geschwindigkeit. Und diese Zahlen wurden einen Monat später zum besten Kommentar zur Erzählung "Mehr Roboter als Menschen".
Zahlenüberschreitung: Dreifacher Begriffsaustausch in der Zahlenmagie
Die 200-stündige Live-Übertragung war ein "Beweis der Fähigkeit", die "Mehr Roboter als Menschen"-Meldung am 20. Juni war ein "Beweis der Skalierbarkeit". Diese beiden Ereignisse füllen die Lücke in der Erzählung von "Fähigkeit zu Skalierbarkeit". Aber in jeder Etappe steckt etwas hinter der Kulisse.
Die Logistik-Sortierung ist das "trickreichste" Szenario für menschoidliche Roboter, strukturiert, standardisiert und ohne Ausnahmen. Aus diesem Szenario auf die Aussage "Roboter können Arbeiter ersetzen" zu schließen, ist wie wenn jemand ein Marathon auf einem Laufband läuft und dann behauptet, alle Berglandschaften zu beherrschen. Aus der Leistung im optimalen Szenario auf die Ersetzungsfähigkeit in der gesamten Branche zu schließen, das ist der erste Begriffsaustausch.
Das Diagramm zeigt, dass die Anzahl der Roboter die Mitarbeiterzahl deutlich übersteigt. Aber diese Kurve repräsentiert die Gesamtproduktion seit der Inbetriebnahme. Gemäß der Herstellerpraxis enthält sie Halbfabrikate auf der Montagelinie, Geräte im Lager, die noch ausgeliefert werden müssen, und Prototypen im Labor. Die tatsächlich an den Kundenproduktionslinien eingesetzten und stabil arbeitenden Roboter weisen laut öffentlich zugänglichen Kundenfällen einen deutlichen Unterschied zur Gesamtproduktion auf. "Eigene Produktion und Eigenverbrauch" mit "Vollzeitangestellten" gleichzusetzen, ist wie wenn eine Bäckerei sagt: "Ich habe mehr Formen als Bäcker". Mehr Formen bedeuten nur Lagerbestände, wenn keine Kuchen gebacken werden. Die Gesamtproduktion als Arbeitskräfte an der Front zu vermarkten, das ist der zweite Begriffsaustausch.
Diese Roboter reduzieren die Arbeitskräfte nicht, sondern erfordern stattdessen mehr Menschen im Hintergrund. Datenannotatoren annotieren Bewegungsmuster, Bewegungskontrollingenieure optimieren Ganganalysen, und die On-Site-Wartung behandelt Abstürze. Die sogenannte "Arbeiterersetzung durch Maschinen" verschiebt nur die Arbeitskräfte von der Frontlinie in die Hintergrundtechnik. Die Gesamtzahl der Arbeitskräfte verringert sich nicht, sondern die Kostenstruktur wird komplexer. Die Kostenersparnis als Effizienzvorteil zu vermarkten, das ist der dritte Begriffsaustausch.
Der Figure 02 hat 11 Monate lang in der BMW-Fabrik in Spartanburg getestet, teilte an der Produktion von über 30.000 BMW X3 und transportierte über 90.000 Teile. Diese scheinbar gute Leistung zeigt jedoch bei genauerer Betrachtung die Effizienzgrenze auf. Bei 1.250 Arbeitsstunden im Gesamtzeitraum betrug die Leistung etwa 72 Teile pro Stunde. Bei der Beförderung von Teilen gleicher Spezifikation ist es normal, dass qualifizierte Arbeiter hunderte von Teilen pro Stunde verarbeiten können. Eine Leistung von 72 Teilen pro Stunde würde bei einem Arbeiter zu einem Gespräch führen.
Warum setzt BMW dennoch weiterhin Roboter ein? Die Roboter sind zwar nicht sehr effizient, aber genügend günstig. Der Figure 03 kostet etwa 25 US-Dollar pro Stunde, was unter dem durchschnittlichen Lohn in der amerikanischen Produktion liegt. Aber günstig und technische Ersetzung sind zwei verschiedene Dinge. Das Ersetzungslogik lautet "Ich bin besser als du, also ersetze ich dich", während die Logik von Figure "Ich bin billiger als du, also kannst du meine niedrige Effizienz tolerieren" lautet. Zwischen Kostenersparnis und technischer Revolution liegt ein großer Abgrund.
Interessanterweise endete die BMW-Testphase des Figure 02 bereits im November 2025. Derzeit arbeiten keine Figure-Roboter in der Spartanburg-Fabrik, und BMW hat auch kein Zeitplan für die Wiederbestellung oder die Erweiterung veröffentlicht. Sogar in der neuen Testphase in Europa hat BMW nicht den Figure 03, sondern den AEON-Roboter von Hexagon gewählt. Der Kunde hat nach der Testphase nicht bestellt und sich stattdessen für einen anderen Anbieter entschieden.
Dies ist nicht nur ein Problem von Figure. Die Branche der menschoidlichen Roboter stürzt sich in eine "Szenariofalle": Die ersten Anwendungen in der Logistik-Sortierung und der Produktionslinienbeförderung sind gerade die Szenarien, in denen keine menschoidlichen Roboter benötigt werden. Traditionelle Roboterarme und AGV-Fahrzeuge haben niedrigere Kosten und höhere Effizienz. Der Kernwert der menschoidlichen Roboter ist die Universalität, aber die Branche erzählt aus kommerziellen Gründen Geschichten in den Szenarien, in denen keine Universalität benötigt wird. Aus der Leistung im optimalen Szenario auf die Zukunft aller Szenarien zu schließen, ist wie wenn die gesamte Branche sich einen Teppich vor die Füße spannen will.
Zuerst die Schrauben in den nicht-standardisierten Szenarien richtig anziehen
Natürlich können wir den technischen Wert von Figure nicht komplett verneinen. Die 200-stündige öffentliche Live-Übertragung war tatsächlich ein wichtiger Schritt in der Branche der Embodied AI. Sie hat zum ersten Mal menschoidliche Roboter aus dem Konzeptvideo im Labor in eine öffentlich überwachbare reale Umgebung gebracht. Aber Fortschritt ist Fortschritt, Erzählung ist Erzählung, und Demonstration und kommerzielle Reife sind zwei verschiedene Dinge.
Chinesische Unternehmen in der Branche der menschoidlichen Roboter gehen ähnlichen Wegen. Yushu Technology hat 2025 über 5.500 menschoidliche Roboter ausgeliefert, und Zhiyuan Robotics hat über 5.100 ausgeliefert. Beide Unternehmen haben fast 80 % des chinesischen Marktes erobert. Aber wie bei Figure sind diese Zahlen eher "Produktionskapazität" und "Auslieferungszahlen" als "Arbeitskräfteersetzung an der Front".
Der Fall von Ubtech ist repräsentativer: Sein Walker S2 hat in einer industriellen Umgebung getestet, und die Jahresaufträge beliefen sich auf fast 1,4 Milliarden Yuan, aber die Auslieferung betrug nur einige hundert Geräte. Inzwischen hat Ubtech kürzlich die Konsumproduktreihe U1 vorgestellt, die auf emotionale Begleitung abzielt. Es gibt zwei Modelle, männlich und weiblich. Innerhalb von 10 Tagen Vorverkauf betrug die Auftragszahl fast 4.000 Geräte, was die gesamte Jahresverkaufszahl der menschoidlichen Roboter des vergangenen Jahres weit übersteigt. Das Produkt ist auf der offiziellen Website mit "Nur für Erwachsene" gekennzeichnet.
Hinter der Erzählung von "Tausenden von Geräten" stehen Aufträge aus Datenakquisitionszentren, Ausstellungen, Bildungs- und Trainingseinrichtungen sowie emotionale Begleitung. Der Anteil der echten Produktionslinienersetzung ist begrenzt. Die Branche der menschoidlichen Roboter befindet sich allgemein in der Schwierigkeit, dass "technisches Ideal und kommerzielle Umsetzung auseinanderklaffen". Wenn die Wiederbestellrate in der industriellen Umgebung nicht steigt und die Effizienzgrenze in der Produktionslinienersetzung 11 Monate lang nicht überschritten wird, entdecken die Unternehmen der menschoidlichen Roboter, dass die Käufer vielleicht nicht die Fabriken, sondern die Wohnzimmer sind.
Im Kurzzeitraum wird es keine flächendeckende "Arbeiterersetzung durch Maschinen" geben. Menschoidliche Roboter werden als "teure Spezialwerkzeuge" in hochstandardisierten Produktionslinien einfache Hilfsaufgaben übernehmen. Arbeiter übernehmen komplexe Aufgaben, Maschinen übernehmen wiederholende Aufgaben. Die Zusammenarbeit zwischen Mensch und Maschine wird der Hauptstrom sein.
Der kommerzielle Wendepunkt der Embodied AI hängt nie von "wie viele Roboter eine Fabrik pro Stunde herstellen kann" ab. Drei harte Kriterien sind interessanter: Kann der Lebenszyklusgewinn eines einzelnen Roboters den Personalaufwand eines Ingenieurs an der gleichen Position übersteigen? Kann die Wiederbestellrate der Kunden von "Testkooperation" zu "kontinuierlicher Bestellung" werden? Kann die Dauer der ununterbrochenen Arbeit ohne menschliche Intervention von 200 Stunden auf 1.000 Stunden steigen, und zwar nicht neben einem Förderband, sondern in einer realen Umgebung mit Ausnahmen, Veränderungen und Störungen?
Technisch gesehen hat NVIDIA kürzlich das SpatialClaw-Raumschlussrahmenwerk veröffentlicht, das es ermöglicht, dass intelligente Agenten mithilfe von Code als Bewegungschnittstelle ohne erneutes Training für jedes neue Szenario flexibel Wahrnehmungswerkzeuge kombinieren und sich an Umweltveränderungen anpassen können. Dies weist auf eine Schlüsselrichtung hin: Erst wenn Roboter in einem neuen Szenario autonom verstehen und arbeiten können, wird die Zeit der universellen Embodied AI wirklich beginnen.
Wenn Figure jemals verkündet: "Wir haben die Hälfte unserer Wartungsingenieure entlassen, weil die Roboter selbst Störungen diagnostizieren und reparieren können", dann ist der echte Wendepunkt der Ersetzung erreicht.
Bis dahin sind die Kapazitätszahlen im Diagramm nur noch Kosten, die abgebaut werden müssen, und haben noch einen langen Weg bis zur "Arbeiterersetzung".
Zuer