ZhiYuan Robotics will eine Plattform für große KI-Modelle und eine offene Ökosystem schaffen.
Text | Wang Yuchan
Redaktion | Yang Xuan
Was bringt es für die Branche, wenn ein Robotikunternehmen beschließt, eine Plattform für große KI-Modelle und eine offene Ökosystem zu schaffen?
Letzten Monat hat Zhiyuan gerade die Schwelle von "10.000 Serienproduktionsrobotern" überschritten. Am 17. April legte dieses von Peng Zhihui, einem ehemaligen "Genius Teenager" von Huawei, und Deng Taihua, einem ehemaligen Vizepräsidenten von Huawei, gemeinsam gegründete Robotikunternehmen auf der Partnerkonferenz viel Zeit und Raum in die Präsentation neuer Softwareprodukte. Im Vergleich dazu war der Raum für Hardware eher gering.
Zhiyuan hat sechs KI-Modelle und sieben Produktivitätslösungen vorgestellt und erstmals das AIMA (AI Machine Architecture) Ganzstapel-Ökosystemtechniksystem öffentlich gemacht. Diese Softwareprodukte werden zusammen mit den Hardware-Robotern die Architektur von Zhiyuans "Einheit und Drei Intelligenzen" bilden.
Unter der "Einheit und Drei Intelligenzen" versteht man: Die "Einheit" bezieht sich auf den Roboter selbst; die "Drei Intelligenzen" umfassen: Bewegungsintelligenz (Grundintelligenz, die die Funktion des Aktuators des physischen Trägers übernimmt); Interaktionsintelligenz (höhere Intelligenz, als Einstieg für emotionale Werte); Arbeitsintelligenz (höhere Intelligenz, die Arbeitsleistung bietet).
"Zhiyuan ist nicht nur ein Robotikunternehmen, sondern auch ein Unternehmen für Embodied AI. Ohne eine mit dem Körper tief verwobene Intelligenz ist ein Roboter nur ein Werkzeug und keine echte Embodied AI." sagte Peng Zhihui.
Der Schlüssel, um zu ermöglichen, dass Roboter nicht nur nach vorgegebenen Programmen tanzen und Kopfsprünge machen, sondern auch in Industrie-, Geschäfts- und häuslichen Umgebungen autonom arbeiten können, liegt im Robotergehirn. Jetzt möchte Zhiyuan die Plattform für die "Entwicklung von Robotergehirnen" schaffen.
Peng Zhihui, Mitbegründer, Präsident und CTO von Zhiyuan
Zhiyuan bringt auf einmal sechs KI-Modelle auf den Markt und will ein "offenes Ökosystem" schaffen
Deng Taihua, Gründer, Vorsitzender und CEO von Zhiyuan, hat angekündigt, dass Zhiyuan in diesem Jahr sechs KI-Modelle vorstellen wird, die die Bewegungsintelligenz, Interaktionsintelligenz und Arbeitsintelligenz in der "Einheit und Drei Intelligenzen" abdecken.
Bezüglich der Bewegungsintelligenz werden zwei Basismodelle vorgestellt: Ein Ganzkörperbewegungssteuerungs-Basismodell, das die Integration von Sensorik und Steuerung unterstützt (durch Umgebungsperzeption wird eine adaptive Bewegungssteuerung ermöglicht), sowie ein generatives Bewegungssteuerungs-Basismodell (das in Echtzeit beliebige Bewegungen generiert, ohne vorherige Programmierung).
Bezüglich der Interaktionsintelligenz wird im dritten Quartal auf der Grundlage des bereits weit verbreiteten WITA-Großmodells das branchenerste Ende-zu-Ende Embodied Multi-Modal-Interaktions-Großmodell WITA Omni 1.0 veröffentlicht. Dieses Modell behält Informationen wie Gesprächsemotion, Kontext, Tonfall und Umgebung bei, ermöglicht eine natürliche und menschenähnliche emotionale Interaktionsausdrucksweise und unterstützt Unterbrechungen, Einwürfe und Korrekturen.
Die größte Investition und die höchste Dichte an Algorithmus-Experten liegen in der Arbeitsintelligenz. Zhiyuan hat kürzlich das GO-2-Modell, das Groß- und Kleinhirn integriert, das Aktionsweltmodell GE-2, den Open-Source-Datensatz AGIBOT WORLD 2026, die Simulationsplattform Genie Sim 3.0 und Genie Studio 2.0 veröffentlicht. Im dritten Quartal wird auch das GO-3-Modell vorgestellt, das die ViLLA-Architektur und die Weltmodell-Architektur integriert, Planungs- und Ableitungsfähigkeiten sowie die Fähigkeit zur Durchführung von komplexen Aufgaben hat, und dessen Datensatzumfang das Zehn- bis Hundertfache von GO-2 beträgt.
Deng Taihua zeigte den Branchenpartnern im Publikum ein Diagramm - die XYZ-Kurve der Entwicklung von Embodied AI.
Die XYZ-Kurve der Entwicklung von Embodied AI
Die X-Kurve (2022 bis 2025) ist die Phase der Entwicklung und des Ausprobierens, in der der Sprung von der Prototypentwicklung zur Massenproduktion erfolgt. 2023 wurde der erste humanoide Roboter vorgestellt, und die technische Machbarkeit wurde verifiziert; 2025 wurden 5.000 Stück in Serie produziert, und die Roboter wurden von "Exponaten" zu "Waren", und die Roboter konnten sich "bewegen".
Die Y-Kurve (2026 bis 2030) ist die Phase des Wachstums der Implementierung. Im März 2026 gingen 10.000 Zhiyuan-Roboter von der Band, die Interaktionsintelligenz und Arbeitsintelligenz wurden in Massen umgesetzt, und die Produktivität der Roboter näherte sich ständig dem menschlichen Niveau.
Die Z-Kurve (ab 2030) ist die Phase der Verbreitung der Implementierung, in der der Moment des Auftauchens von Embodied AI eintritt - die Produktivität der Roboter in Schlüsselbereichen wie Fertigung, Logistik und Dienstleistungen übertrifft die des Menschen vollständig, die Lernrate und die Evolutionsgeschwindigkeit sind extrem führend, und die Gruppenintelligenz beginnt aufzutauchen.
Nach dem Plan von Zhiyuan wird das Unternehmen in drei Jahren die X-Kurve durchlaufen und den ersten Umsatz von einer Milliarde erreichen; in fünf Jahren die Y-Kurve durchlaufen, die Implementierung von Tausenden von Einheiten abschließen und einen Umsatz von zehn Milliarden erreichen; in acht Jahren die Z-Kurve erreichen, gemeinsam mit globalen Ökosystempartnern schaffen und die Massenverbreitung von 1 bis N erreichen. Dieser Plan wird als "358-Großplan" bezeichnet, und das Jahr 2026, als Beginn der Y-Kurve, wird als "Jahr der Implementierungszustands" bezeichnet.
Peng Zhihui, Präsident und CTO, sagte, dass Zhiyuan 2026 als Bruchpunkt einschätzt, weil "drei Faktoren in diesem Jahr gleichzeitig zutreffen" - der Durchbruch bei den großen Modellen; der Roboter selbst und das Daten-Flywheel.
Erstens haben die Modelle bei den großen Modellen es den Robotern ermöglicht, die Welt zu verstehen und zu begreifen. Noch wichtiger ist, dass diese Modelle nicht mehr isolierte Algorithmen sind, sondern ein Open-Source-Ökosystem bilden, was die Iteration der Robotiktechnologie insgesamt beschleunigt.
Zweitens hat der Roboter selbst die Massenproduktion erreicht und kann 7×24 Stunden stabil laufen.
Schließlich sagte Peng Zhihui bezüglich des Daten-Flywheels: "Je mehr Roboter mit dem Daten-Flywheel ausgestattet sind, desto schneller dreht sich das Flywheel, desto mehr Daten werden gesammelt und desto stärker wird die Trainingsfähigkeit der Modelle. Sobald dieses Flywheel in Bewegung kommt, wird es einen exponentiellen Netzeffekt erzeugen. Zhiyuans Einschätzung ist, dass das Flywheel auch 2026 beschleunigt drehen wird."
Auf der Grundlage dieser Einschätzung ist Zhiyuans nächster Gedanke - Massenproduktion des Roboters, Iteration der Modelle, Open-Source-Daten und eine offene Ökosystemplattform. Peng Zhihui nennt dies "der schwierigste, aber auch der lohnendste Weg".
Die Branche fehlt an Daten, und die Konkurrenten machen unnötige Wiederholungen
Dass Robotikunternehmen im Jahr 2026 versuchen, gemeinsam mit den Konkurrenten in eine offene Richtung zu gehen, ist in gewissem Maße auch eine Notwendigkeit, die durch das Fehlen von Ressourcen verursacht wird.
Im Jahr 2026 verbrennen große Sprachmodelle und große Videogenerierungsmodelle wild Tokens, während die Branche der Embodied Roboter gerade die Situation "keine Tokens zum Verbrennen" durchmacht. Große Modelle können wie Menschen lesen, während Embodied AI in der realen Welt herumprobieren muss, um Daten zu sammeln - der Mangel an Daten ist der Engpass, der die gesamte Branche blockiert.
Ein Tag vor der Partnerkonferenz hat Mifeng Technology, ein Tochterunternehmen von Zhiyuan Robot, zuerst eine "One-Stop-Physikalische AI-Daten-Serviceplattform" vorgestellt. Sie ist auf die B2B-Daten-Serviceplattform für andere Robotikunternehmen ausgerichtet.
"Wer ist der größte Token-Verbraucher in der AI-Zeit? Nicht Chat-Software, nicht Code-Assistenten und auch nicht Bild- und Videogeneratoren - sondern Embodied AI-Agenten." sagte Peng Zhihui. "Der Aufgabenraum von Embodied AI-Agenten erstreckt sich über die digitale Welt und die gesamte physische Welt. Ein Roboter, der in der physischen Welt kontinuierlich läuft, verbraucht ständig Tokens."
Die Roboter wurden in Serie produziert, und die großen Modelle wurden entwickelt. Jetzt fehlt nur noch das "Daten-Flywheel".
"GPT5 hat 100 Billionen Tokens an Trainingsmaterial verwendet. Ein Token entspricht ungefähr 0,75 englischen Wörtern. Wenn ein normaler Mensch 150 Wörter pro Minute sagen kann, würde es einer Person 10 Milliarden Stunden dauern, um dieses Trainingsmaterial auszusprechen." sagte Yao Maoqing, Vorsitzender und CEO von Mifeng Technology. "Aber bei Embodied AI ist es anders. Heute, wenn man alle hochwertigen Daten der Welt zusammennimmt, beträgt der Umfang möglicherweise nur 500.000 Stunden."
Im Interview nach der Konferenz sprach Peng Zhihui erneut mit der Medien, einschließlich derjenigen, die sich mit dem Auftauchen von Intelligenz beschäftigen, über das Problem der "Datenknappheit".
"Die Datenlücke bei Embodied AI ist noch relativ groß, und es ist derzeit ein großer Engpass für die Branche. Außerdem sind die Anforderungen an die Datensammlung hoch, weil man in der physischen Welt echte Berührung haben muss und verschiedene Daten wie Reibungskraft und Schwerkraft statistisch auswerten muss." sagte Peng Zhihui. "Deshalb haben wir ständig Produkte und Geschäftsmodelle für die Datensammlung vorgestellt und gleichzeitig aktiv verschiedene offene Datenökosysteme aufgebaut."
Außerdem hat die Branche bis heute noch keine Standardisierung erreicht, was das Problem der unnötigen Wiederholungen verursacht.
Peng Zhihui ist auch stellvertretender Vorsitzender des Technischen Komitees für die Standardisierung von humanoiden Robotern und Embodied AI der Ministerium für Industrie und Informationstechnik. "Es gibt eine obere Leitung in China, und ich beteilige mich auch an der Standardisierung. (Wir hoffen,) dass alle zusammenarbeiten können, um die Entwicklung voranzutreiben." sagte Peng Zhihui. Zhiyuan wird einerseits weiterhin die Implementierung des Roboters erweitern, um mehr Roboter in den realen Arbeitsablauf zu bringen, um diese Daten zu sammeln, und andererseits hofft es, mehr Drittentwickler zu gewinnen, um gemeinsam zu bauen.
Das offene Ökosystem soll nicht nur das Problem der Datenknappheit gemeinsam lösen, sondern auch eine "Standardisierung" bilden, um zu vermeiden, dass die Unternehmen in der Branche einzeln und unnötig wiederholen.
"Je mehr Open-Source-Dinge es gibt, desto leichter bildet sich ein Ökosystem. Je mehr Menschen am Ökosystem beteiligt sind, desto eher kann ein 'faktischer Standard' entstehen. Dies ist auch ein Weg, den wir für die Förderung der Standardisierung gehen." sagte Peng Zhihui.
Laut Daten von ausländischen renommierten Institutionen und der Entwicklungsforschungsstelle des Staatsrates wird der Sektor der Embodied AI um das Jahr 2050 ein Volumen von 5 Billionen US-Dollar erreichen. In zehn Jahren, also 2035, wird allein der chinesische Sektor der Embodied AI ein Volumen von 1 Billion Yuan erreichen.
Im Vergleich zur Automobilindustrie beträgt die globale Kraftfahrzeugbestand derzeit etwa 1,6 Milliarden Fahrzeuge, was einem Marktvolumen von fast 5 Billionen US-Dollar entspricht. Das heißt, die Embodied AI wird in 25 Jahren "eine weitere Automobilindustrie schaffen".
Angesichts eines so großen und fernen Kuchens ist die Branche, die derzeit mit dem Datenengpass kämpft, noch lange nicht am Punkt, über Konkurrenz zu sprechen.
"Wir verlangen von allen unseren Partnern keine Exklusivität, keine Monopolisierung und keine Zwei-aus-Eins-Auswahl. Alles ist für die gesamte Branche offen. Wenn in unserem Zhiyuan-System andere Unternehmen erfolgreich werden und die Branche vorantreiben, heißen wir das willkommen. Wenn die Branche erfolgreich ist und die Produktivität steigt, profitieren wir alle." sagte Deng Taihua.