StartseiteArtikel

Möchten Sie einen humanoiden Roboter nutzen? Dann müssen Sie zunächst vier Prüfungen bestehen.

半熟财经2025-08-11 19:26
Humanoidroboter haben gute Fortschritte bei der Generalisierungsfähigkeit für einzelne Aufgaben erzielt. Allerdings ist die Generalisierungsfähigkeit für Mehrfach- und Quertasks immer noch relativ schwach, was die Leistung der humanoiden Roboter in realen Anwendungsfällen beeinträchtigt.

Auf der kürzlich beendeten Weltkonferenz für Künstliche Intelligenz 2025 (im Folgenden “WAIC”) war die Halle für Embodied Intelligence-Roboter am beliebtesten. Laufende Roboterhunde und verschiedene Roboter ließen die Besucher stehen bleiben.

Nach Angaben wurden auf dieser WAIC mehr als 150 humanoide Roboter gemeinsam ausgestellt, was die größte Ausstellung von humanoiden Robotern in China bisher ist. Anders als im vergangenen Jahr, als die Roboter eher statisch ausgestellt wurden, sollen die diesjährigen Roboter ihre Fähigkeiten in realen Szenarien demonstrieren.

Die Ausstellungsfläche von Zheyuan Robotics beträgt 300 Quadratmeter und ist die größte Fläche unter den an der Konferenz teilnehmenden Embodied Intelligence-Unternehmen. Das Unternehmen hat fünf Geschäftsszenarien wie industrielle Logistik, kommerzieller Service, Haushalt, Forschung und Bildung, Unterhaltung und Performance eingerichtet und verschiedene Roboter eingesetzt, um ihre Stärken zu zeigen: Der als universeller humanoider Roboter für interaktiven Service konzipierte Expedition A2 ist für die Führung auf der Ausstellungsfläche zuständig und führt die Führung voll autonom ohne menschliche Beteiligung durch; der Elf G1 fungiert als “Allroundhelfer” auf der Ausstellungsfläche und reicht den Besuchern Gegenstände und setzt Gedenkstempel; ein anderer Roboter, der Expedition A2-W, führt fleißig Entpalettierungs- und Transportarbeiten durch und greift präzise Umschlagboxen unterschiedlicher Größen.

Yinhe General hat eine 1:1 Nachbildung einer realen Supermarktszene aufgebaut, die rund um die Uhr von dem Yinhe General-Roboter Galbot bewacht wird.

Xingdong Jiyuan hat eine Logistik- und Lagerungsszene simuliert, um die Fähigkeiten der Roboter bei der intelligenten Sortierung, dem Scannen und dem Service zu zeigen, also “echte Arbeit” zu leisten.

Eine Studie von Goldman Sachs prognostiziert, dass das weltweite Marktvolumen für humanoide Roboter bis 2035 auf 154 Milliarden US-Dollar ansteigen könnte. In einer optimistischeren Annahme könnte es sogar auf 205 Milliarden US-Dollar kommen. Morgan Stanley schreibt in einem Forschungsbericht, dass China als die größte Roboter-Markt und -Herstellungszentrale der Welt das Marktvolumen der Roboterindustrie 2024 bereits 47 Milliarden US-Dollar betrug, was 40 % des weltweiten Volumens ausmacht. Es wird vorausgesagt, dass es bis 2028 auf 108 Milliarden US-Dollar steigen wird, was einer durchschnittlichen jährlichen Wachstumsrate von 23 % entspricht.

Das CITIC Think Tank hat am 27. Juli auf der WAIC den tiefgehenden Forschungsbericht “Das neue Zeitalter der KI: Hartnäckig voranschreiten, die Flammen der Intelligenz entfachen” über die Entwicklung der KI + Branche veröffentlicht. Der Bericht weist darauf hin, dass die Trainingsmethode für große Roboter-Modelle sich jetzt in Richtung eines End-to-End-Großmodells + Weltmodells (Modellierung physikalischer Regeln) entwickelt. Gleichzeitig werden die Modalitätsfähigkeiten immer reichhaltiger. Aber aufgrund von Problemen wie der begrenzten Generalisierungsfähigkeit des “Gehirns” des Roboters, der Schwierigkeit bei der Datensammlung, der zu optimierenden Strukturgestaltung und den hohen Kosten der Lieferkette ist es für humanoide Roboter kurzfristig noch schwierig, eine Massenkommerzialisierung zu erreichen.

Warum humanoide Roboter?

Humanoide Roboter werden allgemein als eines der vielversprechendsten Anwendungsgebiete der KI angesehen. In Zukunft werden sie in Bereichen wie Industrie, Handel, Haushalt und Weltraumforschung breite Anwendungen finden und die Menschen aus niedrigwertigen und gefährlichen Berufen befreien, die Produktivität und Effizienz der Menschen verbessern.

Es muss darauf hingewiesen werden, dass der humane Roboter nur ein typisches Trägermedium für Embodied Intelligence ist, aber der Bereich von Embodied Intelligence weit über humanoide Roboter hinausgeht. Der Kern von Embodied Intelligence liegt darin, “Intelligenz durch die dynamische Interaktion des Körpers mit der Umwelt zu erzeugen”. Die Form des “Körpers” kann vielfältig sein. Solange er die Fähigkeiten zur Wahrnehmung und Handlung hat und mit der Umwelt interagieren kann, kann er ein Träger von Embodied Intelligence werden.

Das CITIC Think Tank weist im Bericht darauf hin, dass die Gestaltung als menschliche Form aus verschiedenen Gründen gewählt wurde.

Erstens kann er sich besser an die Umwelt anpassen. Viele reale Szenarien wie Treppen und Werkzeuge sind nach der Anthropometrie des Menschen gestaltet. Wenn ein Roboter in menschlicher Form ist, kann er in diesen Szenarien direkt eingesetzt werden.

Zweitens hat er eine bessere Universalität bei der Aufgabenausführung. Der menschliche Körper hat eine hohe Beweglichkeit. Durch die Nachahmung der menschlichen Gelenke und des Sinnesystems kann der humane Roboter flexibler werden und verschiedene Aufgaben ausführen.

Drittens verringert das menschenähnliche Aussehen die psychische Barriere bei der Mensch-Roboter-Interaktion. Im Vergleich zu anderen Typen von Robotern werden humanoide Roboter in Zukunft weniger Barrieren bei der emotionalen Kommunikation haben.

Viertens ist die Verfügbarkeit von Daten höher. Die tiefe Biomimetik bedeutet, dass eine große Menge an Bewegungsdaten aus menschlichen Bewegungen gewonnen werden kann, was die Schwierigkeit und die erforderliche Trainingszeit von Trainingsmethoden wie Deep Reinforcement Learning deutlich verringern kann.

Der humanoide Roboter Optimus von Tesla hält sich an die menschenähnliche Struktur. Der Roboter Optimus ist 1,73 Meter groß und verwendet in der Verbindung der Aktuatoren eine Federgestaltung, die Sehnen nachahmt. Die Handform ist von der menschlichen Hand inspiriert, um eine hohe Empfindlichkeit zu erreichen und schwere und dünne Gegenstände greifen zu können.

Nach dem im Januar dieses Jahres von Tesla veröffentlichten Plan sollen im Jahr 2025 Tausende von Optimus-Robotern in Serie produziert und in den Tesla-Fabriken zunächst getestet werden; 2026 sollen 50.000 - 100.000 Stück in Serie produziert werden, und 2027 soll die Produktion um das Zehnfache erhöht werden.

Seit Anfang dieses Jahres ist es ein Trend, dass Automobilhersteller in den Bereich der humanoiden Roboter eintreten. Laut einer unvollständigen Statistik von “Caixin” auf der Grundlage offizieller Ankündigungen haben derzeit 15 chinesische Automobilhersteller wie GAC, SAIC, BYD, XPeng, Chery und Xiaomi sowie Lieferkettenunternehmen wie Huawei, Horizon Robotics und Hesai Technology nacheinander in den Bereich der humanoiden Roboter eingestiegen. Im Ausland haben sechs Automobilhersteller wie Tesla, BMW, Mercedes-Benz, Honda, Toyota und Hyundai auch ihre eigenen Ideen für humanoide Roboter vorgestellt. Die weltweit führenden Automobilhersteller sind grundsätzlich in den Bereich der humanoiden Roboter eingestiegen (siehe dazu den Bericht “21 Automobilhersteller setzen auf humanoide Roboter - das nächste Ticket?”).

In China ist der Bereich der humanoide Roboter auch eines der heißesten Bereiche auf dem Kapitalmarkt dieses Jahres. Am 18. Juli zeigten die Informationen auf der offiziellen Website der chinesischen Wertpapieraufsichtsbehörde, dass Yushu Technology die Beratung für die Börsengänge begonnen hat und einen Unternehmenswert von über 12 Milliarden Yuan hat. Yushu Technology wurde 2016 gegründet und begann mit der Forschung an Roboterhunden. 2023 begann es mit der Veröffentlichung von Produkten für humanoide Roboter und ist eines der am meisten beobachteten chinesischen Start-ups für humanoide Roboter. Die Firma Tusmart Navigation hat die dritte Runde der Finanzierung begonnen. Im März dieses Jahres gab die Robotergesellschaft Vita Power bekannt, dass sie eine Finanzierung in Höhe von 200 Millionen Yuan abgeschlossen hat. Diese Firma hat bereits zwei Runden der Finanzierung abgeschlossen, obwohl sie erst 100 Tage alt ist.

Nach dem Unternehmenswert haben die chinesischen Start-ups für humanoide Roboter derzeit eine klare Hierarchie gebildet. Es gibt drei Unternehmen in der ersten Staffel: Yushu Technology, Zheyuan Robotics und Yinhe General, deren Unternehmenswerte alle über 7 Milliarden Yuan liegen. Die Unternehmen in der zweiten Staffel umfassen Tusmart Navigation, Independent Variable Robotics, Zhujian Dynamics, Qianxun Intelligence und mehr als zehn andere, deren Unternehmenswerte zwischen 2 Milliarden und 5 Milliarden Yuan liegen.

Schwierigkeiten bei der kommerziellen Nutzung

Obwohl die Branche der humanoide Roboter sehr heiß ist, steht sie immer noch vor dem Problem, dass eine Massenkommerzialisierung kurzfristig schwierig ist. Das CITIC Think Tank weist im Bericht darauf hin, dass die Widerstände hauptsächlich aus folgenden vier Aspekten stammen.

Zunächst ist die Generalisierungsfähigkeit des “Gehirns” des Roboters, d. h. des Embodied Intelligence-Großmodells für Roboter, begrenzt, was die aktuellen Anwendungsbereiche einschränkt.

Das Embodied Intelligence-Großmodell bezieht sich auf ein universelles Intelligenzagentenmodell, das durch das Vor-training mit einer riesigen Menge an multimodalen Daten (Vision, Sprache, Bewegung) die Fähigkeiten zur Umweltwahrnehmung, zur Aufgabenverstehen und zur Handlungsgenerierung erlangt hat und schrittweise vom “Ausführen einzelner Befehle” zum “Selbstentscheidungsverhalten” übergeht. Sein Kern besteht darin, dass der Roboter wie ein Mensch “die Welt versteht, Befehle versteht und handelt” und die Intelligenzsteigerung in Bereichen wie Industrie, Medizin und Haushaltservice vorantreibt.

Das CITIC Think Tank ist der Meinung, dass das Großmodell für Roboter grob der Technologieentwicklung im autonomen Fahren folgen kann und auch in die Phasen L1 - L5 eingeteilt werden kann. Derzeit befindet es sich in der Phase L4, die durch die Realisierung echter interaktiver Rückmeldungen gekennzeichnet ist. Das repräsentative Modell ist das Gemini Robotics, das von Google DeepMind im März dieses Jahres vorgestellt wurde und eine tiefe Integration der drei Modalitäten Vision - Sprache - Bewegung (VLA) erreicht hat und eine starke räumliche Inferenzfähigkeit aufweist.

Derzeit entwickelt sich das Embodied Intelligence-Großmodell schnell, aber es bleiben immer noch Probleme wie unzureichende Datensätze, das Nachhinken des Denkens hinter der Bewegung und das Fehlen einer Ökosystem. In Bezug auf die Ergebnisse hat der humane Roboter in der Generalisierungsfähigkeit bei einzelnen Aufgaben gute Fortschritte gemacht, aber die Generalisierungsfähigkeit bei mehreren Aufgaben und über Aufgaben hinweg ist immer noch relativ schwach, was sich auf die Anwendungsbereiche der humanoide Roboter auswirkt.

Daten sind das “Kernfundament der Kognition” von Embodied Intelligence. Derzeit ist die erforderliche Datenmenge für das universelle Großmodell für Roboter enorm, und die Datenerhebung ist schwierig. Daher ist es für universelle Roboter kurzfristig schwierig, genügend echte Daten von echten Robotern für das Training des Großmodells zu sammeln.

Im Gegensatz zu großen Sprachmodellen, die direkt eine große Menge an Internet- und Buchwissen lernen können, ist es für Roboter schwierig, ihre Bewegungs- und Planungsfähigkeiten schnell zu verbessern, indem sie nur Internetvideos oder menschliche Bewegungsvideos anschauen.

Nie Kaixuan, CEO der Firma Songying Technology, die sich auf die Entwicklung von physikalischen AI-Simulationssystemen spezialisiert hat, sagte der Zeitschrift “Caixin”, dass humanoide Roboter eine große Menge an Daten aus der Interaktion in der realen physikalischen Umwelt benötigen, um ihre Entscheidungs- und Handlungsfähigkeiten zu trainieren. Der Mangel an Daten aus der physikalischen Welt beschränkt die Entwicklung der humanoide Roboter.

Die Strukturgestaltung der Roboter muss noch optimiert werden, und Probleme wie die Zuverlässigkeit der Komponenten und die Akkulaufzeit müssen dringend gelöst werden.

Im April 2025 startete die Halbmarathon “Mensch-Roboter-Gemeinsamer Lauf” 2025 in Beijing Yizhuang im Nanhaizi-Park in Beijing. Die Halbmarathon ist eine Herausforderung für die Gesamtleistung der Roboter und eine umfassende Prüfung ihrer Gelenkstrukturgestaltung, Wärmemanagement, Akkulaufzeit, Steueralgorithmus, Kommunikationsstörung, Kopplung von Hardware und Software usw.

Während der Rennen hatten die meisten Robotertanzteilen Probleme mit der Bewegungsstabilität und stürzten, was auf eine schlechte Stabilität hinweist. Gleichzeitig traten bei vielen Robotern Wärmeabfuhrprobleme auf, und es musste ständig Kühlflüssigkeit gesprüht werden, um die Temperatur zu senken. Dies liegt daran, dass die Hochleistungs-Motoren und die dichten elektronischen Komponenten der Roboter bei Dauerbetrieb eine große Menge an Wärme erzeugen, insbesondere bei hoher Geschwindigkeit und Dauerbetrieb oder bei hoher Belastung, die Wärmeakkumulation sehr schnell ist. Da die humanoide Roboter in einer menschenähnlichen Struktur gestaltet sind, ist ihr innerer Raum kompakt, und es ist schwierig, die Wärme schnell abzuführen.

Derzeit ist die Akkulaufzeit der humanoide Roboter begrenzt. Die Akkulaufzeit der meisten humanoide Roboter liegt zwischen 2 und 5 Stunden, was für die kontinuierliche Arbeit in Szenarien wie Haushaltservice und industrieller Zusammenarbeit nicht ausreicht und noch verbessert werden muss.

Derzeit sind die Kosten der Lieferkette für humanoide Roboter relativ hoch, und die Preise der Hardware müssen noch weiter gesenkt werden. Da die Serienproduktion von humanoide Roboter noch in einem begrenzten Maßstab ist, ist die Nachfrage nach den zugehörigen Komponenten noch nicht vollständig freigesetzt. Einige Komponenten wie Präzisionssensoren und Planetenrollspindeln sind aufgrund ihrer begrenzten Anwendungsbereiche relativ teuer. Die weitere Ausweitung der Branche hängt auch von der weiteren Kostensenkung in der Lieferkette ab.

(Dieser Artikel wurde auch von Liu Yiqin, Reporterin der Zeitschrift, Huang Siyun, Forscherin, und Gu Lingyu, freier Mitarbeiterin, mitgewirkt.)

Dieser Artikel stammt aus dem WeChat-Account “Caixin AI Wave”, Autor: Zhou Yuan, veröffentlicht von 36Kr mit Genehmigung.