StartseiteArtikel

Exklusive Interview mit Wang He von Galaxy Universal: Roboter, die wirklich "arbeiten" können, fürchten keine Preiswettkämpfe | 36 aufstrebende Perspektiven

王方玉2025-06-25 09:00
Der Markt für Empfangsaufführungen ist nur ein vorübergehender Phänomen, und man sollte Roboter für hochwertige Aufgaben trainieren.

 Emergenz (Emergence) ist ein Schlüsselphänomen in der Welle des generativen KI. Wenn die Größe des Modells einen kritischen Punkt erreicht, zeigt die KI menschliche Intelligenz, kann verstehen, lernen und sogar schaffen.

„Emergenz“ tritt auch in der realen Welt auf – die Siliziumbasiszivilisation steht kurz davor, loszubrechen. Gründer und Schöpfer im Bereich der KI nutzen ihre Intelligenz und ihr Gehirn, um den langen Weg zur Erreichung der künstlichen allgemeinen Intelligenz (AGI) zu beleuchten.

An der Schwelle des Übergangs von alter zu neuer Produktivkraft hat „Intelligente Emergenz“ eine neue Rubrik namens „36 Personen der Emergenz“ ins Leben gerufen. Wir werden durch Gespräche mit Schlüsselpersonen der Branche die neuen Überlegungen dieser Phase aufzeichnen.

Text | Wang Fangyu

Redaktion | Su Jianxun

„Was kann ein humanoider Roboter außer Tanzen und Runterrollen von Kopf noch tun?“

Wang He, Assistentprofessor an der Peking-Universität, Gründer und CTO von Galaxy General Robotics, ist vielleicht am besten qualifiziert, um Zhu Xiaohus obige „seelische Prüfung“ zu beantworten. Die von ihm gegründete Galaxy General ist ein Unicorn im Bereich der Embodied Intelligence in China und diejenige Firma in der Spitzengruppe der Branche, die am meisten auf die „Gehirne“ der Roboter konzentriert ist.

Seit der Gründung im Mai 2023 hat Galaxy General nur ein Roboter - Produkt, Galbot (G1), veröffentlicht, aber mehrere Embodied - Large - Models. Das Unternehmen hat die meisten Ressourcen und Mittel in die Forschung und Entwicklung von Embodied - Large - Modellen investiert und sich darauf konzentriert, die Allgemeingültigkeit und Generalisierbarkeit der Roboter zu verbessern.

Wang He, Gründer von Galaxy General       Bildquelle: Unternehmenslizenz

Nach Ansicht von Dr. Wang He führt die Konkurrenz um den Roboter - Körper dazu, dass die Roboter zu Preisen verkauft werden, die denen des Stahlrohmaterials entsprechen. Es gibt bereits Anzeichen eines Preiskriegs auf dem Markt. Nur die Verbesserung der Fähigkeiten des Embodied - Intelligence - Modells kann den humanoiden Robotern einen höheren Wert verleihen.

Das allgemeine Embodied - Large - Modell ist ein „unbesiedeltes Gebiet“ der menschlichen Spitzentechnologie. Wang He, der diese grandiose Aufgabe trägt, spricht über die gegenwärtige Entwicklung des Embodied - Modells überraschend „konservativ“ und realistisch:

„Ich rate dringend davon ab, über die Embodied - AGI zu sprechen. Viele Unternehmen hoffen, die Embodied - AGI in einem Schritt zu erreichen, aber ich stimme nicht damit überein.“

„Das Embodied - Intelligence - Modell hat noch viele Unzulänglichkeiten. Es könnte fünf bis zehn Jahre dauern, bis es in der Lage ist, alle Arten von Aufgaben zu erledigen.“

„In der Vergangenheit sind ständig zahlreiche Forschungsergebnisse hervorgegangen, aber es gibt noch keine Produkte, die in der Lage sind, in der Massenproduktion hergestellt zu werden.“

Zurzeit sind viele chinesische Hersteller von Embodied - Intelligence - Modellen darauf bedacht, ihre Stärke zu demonstrieren: Sie zeigen die Generalisierbarkeit ihrer Modelle durch Demo - Videos (Muster) komplexer Operationen wie „Kleidung falten, sich rasieren, Reißverschlüsse schließen“. Galaxy General konzentriert sich dagegen auf die Lösung der „nicht so komplexen“ Fähigkeiten wie Bewegen, Greifen und Platzieren. Die Benennung seines Embodied - Operation - Modells ist überhaupt nicht „sexy“ - das Grund - Greif - Large - Modell GraspVLA.

Wang He sagte gegenüber „Intelligente Emergenz“ direkt, dass Galaxy General auch die Fähigkeit, Kleidung an einem Haken aufzuhängen, entwickelt. Aber diese komplexe Operation ist nur ein Forschungsergebnis und es ist noch ein langer Weg bis zur Marktreife und Produktivierung.

Zurzeit ist die relativ „einfache“ Fähigkeit Mobile, Pick and Place (Bewegen, Greifen, Platzieren) diejenige, die am nächsten an der Marktreife ist. Galaxy General bemüht sich darum, diese Fähigkeit zunächst in einigen Szenarien wie Apotheken und Einzelhandel anzuwenden.

Dem Bericht zufolge hat Galaxy General zusammen mit Partnern die weltweit erste intelligente Einzelhandelslösung für humanoide Roboter entwickelt. Bisher wurden in Peking fast 10 Apotheken eröffnet, die rund um die Uhr von Robotern bedient werden. Die humanoiden Roboter von Galaxy General wählen die Medikamente automatisch und präzise aus und geben sie an die Kurierfahrer ab.

Das Unternehmen plant, in diesem Jahr insgesamt 100 selbstbediente Einzelhandelsgeschäfte in Städten wie Peking, Shanghai und Shenzhen zu eröffnen. Dieser Anwendungsfall ist bereits marktfähig und soll diesem Jahr Galaxy General einen Umsatz von fast 100 Millionen Yuan einbringen.

Anlässlich der Eröffnungsveranstaltung der recenten Zhipu - Konferenz hat der Roboter Galbot von Galaxy General eine Live - Demonstration auf der Bühne der Hauptkonferenz durchgeführt. Der Roboter bewegte sich autonom und präzise an die richtige Position und nahm ein Getränk vom Regal unter Wang Hes Sprachbefehl. Er hat den gesamten Prozess des Greifens und Abgebens von Gegenständen auf komplexen Regalen autonom durchgeführt, ohne Ferneingabe und ohne vorherige Datenerfassung des Szenarios.

Galaxy General zeigt Greifen und Abgeben auf der Zhipu - Konferenz   Bildquelle: Unternehmenslizenz

Wang He gestand, dass die Embodied - Intelligence in jedes Szenario einige Datenvorbereitungen erfordert, um ein hundertprozentig erfolgreiches Produkt zu schaffen. Die Fähigkeit Mobile, Pick and Place wird ständig aktualisiert. Galaxy General beginnt mit dem Regalszenario im Einzelhandel und verbessert schrittweise die Generalisierbarkeit der Operationen.

Nach Ansicht von Wang He wäre die vollständige Lösung des Problems der Generalisierbarkeit von „einfachen“ Operationen wie Mobile, Pick and Place bereits ein wichtiger Meilenstein in der Geschichte der menschlichen Embodied - Intelligence und der Roboter. Laut seiner Schätzung könnte die Reife dieser Fähigkeit einen neuen Markt von Hunderten von Milliarden Yuan eröffnen und in vielen Szenarien wie Einzelhandel, Vorlager und SPS - Sortierung in Automobilwerken den Menschen bei der schweren Arbeit helfen.

Wenn man die Generalisierbarkeit misst, wäre ein allmächtiger humanoider Roboter 100, ein Roboter, der die Fähigkeit Mobile, Pick and Place beherrscht, 10, und die Umsetzung von Mobile, Pick and Place im Regalszenario des Einzelhandels nur „1“.

Galaxy General hat derzeit den Sprung von 0 auf 1 geschafft und strebt das ultimative Ziel der allgemeinen Embodied - Intelligence an.

Im Folgenden finden Sie das Gespräch zwischen „Intelligente Emergenz“ und Wang He, Gründer und CTO von Galaxy General. Der Inhalt wurde geringfügig bearbeitet:

Der Markt für Empfangs - und Show - Performances ist nur ein vorübergehender Phänomen, man muss Roboter für hochwertige Arbeit trainieren

„Intelligente Emergenz“: Wie groß ist die Mitarbeiterzahl Ihres Unternehmens derzeit?

Wang He: Wir haben derzeit über hundert Mitarbeiter.

„Intelligente Emergenz“: Scheint es, dass es weniger ist als bei den Mitbewerbern in der gleichen Spitzengruppe.

Wang He: In der gegenwärtigen Phase konzentrieren wir uns auf das Produktions - und Forschungs - Team. Galaxy General hat bisher ein humanoides Roboter - Produkt, Galbot G1, vorgestellt. Es basiert auf den Kernbedürfnissen in Szenarien wie Industrie, Einzelhandel und Dienstleistungen und setzt auf Fähigkeiten wie Bewegen, Greifen und Platzieren.

Ich denke, dass diese Fähigkeit in verschiedenen breiten Szenarien wie Industrie, Handel und Dienstleistungen einen vollständigen geschlossenen Skill - Set bilden kann, anstatt viele kleine, abweichende Fähigkeiten oder eine Vielzahl von Robotern aller Kategorien zu entwickeln, denn das würde die Mitarbeiterzahl viel erhöhen.

„Intelligente Emergenz“: Galaxy General hat nur ein Roboter - Körperprodukt entwickelt, aber mehrere Modelle veröffentlicht. Wird mehr auf die Modelle fokussiert?

Wang He: Tatsächlich gibt es in unserem Unternehmen mehr Mitarbeiter, die sich mit der „Hardware“ befassen, als solche, die sich mit der „Software“ beschäftigen. Das mag anders sein, als die Außenwelt es sich vorstellt. Die Außenwelt könnte denken, dass Galaxy General nur ein Produkt herstellt, also nicht viele Hardware - Ingenieure benötigt. Tatsächlich haben wir andere Standards für unsere Roboter als viele Mitbewerber.

Wenn die Roboter nur für Forschungszwecke, als Hardware - Plattform oder für eine 5 - Minuten - Demo verwendet werden, wird von der Zuverlässigkeit des Produkts keine hohe Anforderung gestellt. Der Unterschied zur Zuverlässigkeit eines Roboters, der tatsächlich 24 Stunden am Tag arbeiten kann, ist sehr groß, denn er kann nicht in der Praxis eingesetzt werden.

Die Hardware von Galaxy General wurde in mehreren Runden intensiv für ein Produkt weiterentwickelt, damit wir tatsächlich erreichen können, dass der Roboter in einem selbstbedienten Apotheken - Szenario 24 Stunden am Tag arbeiten kann. Wenn die Hardware Probleme hat und ein Ingenieur vor Ort reparieren muss, ist dies sehr kostspielig. Deshalb ist unser Produkt von Anfang an so konzipiert, dass es nach Autobahn - Standards oder sogar höheren Standards hergestellt wird.

„Intelligente Emergenz“: Was ist mit den finanziellen Investitionen?

Wang He: Als Unternehmen, das sich mit Embodied - Large - Modellen befasst, investieren wir am meisten in die Forschung und Entwicklung von Modellen. Aber dies ist nicht einfach eine Frage der Anzahl der Mitarbeiter. Kein Unternehmen kann ein gutes Modell nur durch die Anstellung von vielen Mitarbeitern, die an der Modelltraining arbeiten, entwickeln. Es muss ein ganzes geschlossenes Team von Dateninfrastruktur über Modelltraining bis hin zum Test aufgebaut werden. Hierbei machen die Rechenleistungskosten einen großen Anteil aus. Tatsächlich gibt es nur wenige Spitzenkünstler in der Modellentwicklung in jedem Unternehmen.

„Intelligente Emergenz“: Die Wertschätzung von synthetischen Daten ist ein sehr markantes Merkmal von Galaxy General. Viele Mitbewerber sagen auch, dass sie Simulationsdaten verwenden und diese mit Internet - Videos und echten Roboter - Daten kombinieren. Wo liegt der Unterschied?

Wang He: Synthetische Daten können von Menschen, die nicht wissen, wie man sie richtig nutzt, nicht gut eingesetzt werden. Deshalb gibt es Leute, die sagen, dass die Simulation „giftig“ ist. Synthetische Daten haben bei unseren Erfolgen eine sehr wichtige Rolle gespielt. Dank unserer selbst entwickelten Technologie für synthetische Daten konnten wir die Trainingskosten für unser Embodied - Large - Modell erheblich senken. Gleichzeitig betonen wir die Integration von Realität und Simulation, was unser Embodied - Large - Modell an die Spitze der Welt bringt. Dies zeigt, dass wir synthetische Daten wirklich gut nutzen können.

Beispielsweise können alle Internet - Video - Daten herunterladen. Ein etwas höherer Schwierigkeitsgrad ist die Fernsteuerung. Die Embodied - Roboter, die wir derzeit in Supermärkten und Einzelhandelsumgebungen einsetzen, verwenden echte Fernsteuerungsdaten, aber der Anteil ist weit geringer als der der simulierten synthetischen Daten.

Die Erzeugung von synthetischen Daten erfordert von den Herstellern eine gute Infrastruktur in Grafik, physikalischer Simulation, physikalischer Rendering und automatischer Bewegungssynthese, einschließlich eines geschlossenen Validierungsprozesses. Dies erfordert langfristige Akkumulation und Kerntechnik - Know - how. Diese Akkumulation ist auch ein Schlüsselgrund dafür, warum Galaxy General bessere und generalisierbarere Modelle entwickeln kann.

Der Galbot - Roboter von Galaxy General   Bildquelle: Unternehmenslizenz

„Intelligente Emergenz“: Ihr Roboter hat ein Radfahrwerk. Können wir daraus schließen, dass Galaxy General stärker auf die Entwicklung der oberen Gliedmaßen - Betriebsfähigkeit der Roboter setzt?

Wang He: Es hängt davon ab, wo der Schwerpunkt liegt. Auf der Produktseite richten wir uns nach den Bedürfnissen der Marktreife.

Die meisten Kunden betrachten derzeit die eigenen Bedürfnisse. Beispielsweise in Fabriken und Supermärkten, wo es um Bewegen, Greifen und Platzieren geht, wird ein Fahrwerk bevorzugt. Zweibeinige Roboter erzeugen Lärm und haben eine kurze Akkulaufzeit. Unser Radfahrwerk - Roboter muss nur alle 6 - 8 Stunden aufgeladen werden und hat damit einen natürlichen Vorteil gegenüber zweibeinigen Robotern.

Von der Forschungs - und Entwicklungsseite aus gesehen, hat Galaxy General ein ganzheitliches Layout für die Embodied - Intelligence. Es gibt auch Pläne für zweibeinige humanoide Roboter, aber in der gegenwärtigen Phase ist es noch kein Produkt, das auf der Produktseite weit verbreitet eingesetzt werden kann.

„Intelligente Emergenz“: Empfangs - und Show - Szenarien sind in diesem Jahr ein neues Phänomen. Viele Mitbewerber gehen stark in diesen Markt ein. Warum hat Galaxy General diesen Markt nicht erobert?

Wang He: Meiner Meinung nach sind diese aufsehenerregenden Szenarien nur vorübergehend. Der Markt gewinnt nicht durch eine Welle von Traffic, sondern durch eine gute Benutzererfahrung.

Galaxy General legt immer großen Wert auf die Benutzererfahrung. Beispielsweise gibt es viele Empfangsroboter in Foyers, aber die meisten von ihnen erledigen nur unbedeutende Aufgaben. Wir entwickeln einen nächst - Generation - Empfangsroboter, der vom Kunden gerne eingesetzt wird und wirklich Menschen bei der Arbeit unterstützen kann. Wenn wir das erreichen können, glaube ich, dass wir in