StartseiteArtikel

Gespräch mit Xiong Youjun: Der "OpenAI" für verkörperte Intelligenz werden, um den technologischen Abstand zwischen China und den USA in der Robotik zu verkleinern | Erscheinen von 36 Personen

田哲2024-12-24 11:08
Das Zeitalter der verkörperten Intelligenz ist noch nicht wirklich angekommen, wir stehen erst am Anfang.

Erstveröffentlichung auf dem offiziellen WeChat-Konto "Intelligentes Erscheinen"

Text | Tian Zhe

Bearbeitung | Su Jianxun

Die Serie "Westworld" zeichnet ein Bild einer Gesellschaft, in der Menschen und Roboter koexistieren: In einer technologisch hochentwickelten Zukunft gibt es fast keine Unterschiede mehr im Erscheinungsbild und Verhalten von Robotern und Menschen, und Menschen können in einem Vergnügungspark frei mit Robotern interagieren.

Für Xiong Youjun werden Roboter in der Zukunft nicht nur auf Vergnügungsparks beschränkt sein, sondern Teil des menschlichen Lebens - sie können Assistenten, Freunde oder sogar Teil des menschlichen Körpers sein. Mit diesem Traum vor Augen ist Xiong Youjun seit über 20 Jahren in der Roboterindustrie tätig.

Xiong Youjun ist einer der Mitbegründer des Roboterunternehmens UBTECH und leitete die Entwicklung mehrerer humanoider Roboter, darunter einen namens "Walker", der zweimal auf der Bühne der CCTV-Frühlingsgala auftrat. Zuvor war er auch für große Projekte zur Förderung der Innovation in der künstlichen Intelligenz verantwortlich, die von mehreren Ministerien, einschließlich der Staatlichen Kommission für Entwicklung und Reform, organisiert wurden.

Er unterteilt die Entwicklungsphasen der Roboter in drei Perioden: schwache KI, starke KI und superintelligente KI. Obwohl sich die Robotertechnologie seit Jahrzehnten entwickelt hat, bleibt sie auf dem Niveau der schwachen KI stehen. Er glaubt, dass Roboter erst dann in die nächste Entwicklungsstufe eintreten können, wenn allgemeine künstliche Intelligenz erreicht ist und Roboter mit der realen Welt interagieren können.

Im Jahr 2023 verließ Xiong Youjun Shenzhen, wo er über ein Jahrzehnt gelebt hatte, und zog nach Peking, um CEO des National-Regional Body Intelligence Innovation Center for Robotics zu werden.

Dies war eine bedeutende Veränderung in seinem Leben. "Wir sind eine nationale Innovationsplattform, die nicht nur durchbruchhafte Schlüsseltechnologien entwickeln muss, sondern auch die Verantwortung trägt, die Industrieentwicklung voranzutreiben," erklärt er.

Im Jahr 2023 tauchten zahlreiche Roboter-Startups auf, die unterschiedliche technologische Ansätze erforschten. Dies bedeutet jedoch auch, dass die Roboterindustrie einen langen Weg der technologischen Erkundung und Überprüfung durchlaufen muss, bevor Roboter in Massenproduktion gehen können. Gleichzeitig gibt es in den USA nicht nur den Branchenpionier Boston Dynamics, sondern auch neue Akteure wie Figure und Digit. Im Vergleich zu China besitzen amerikanische Roboterfirmen mehr finanzielle Mittel und hochkarätige Talente.

Im August dieses Jahres stellte Xiong Youjun dem Gründer von Boston Dynamics, Marc Raibert, eine Frage: Warum ist Boston Dynamics trotz der starken Technologie nicht bestrebt, sich zu kommerzialisieren? Marc Raiberts Antwort war einfach: "I don't care."

Das überraschte Xiong Youjun: "Er kümmert sich überhaupt nicht darum, sondern konzentriert all seine Energie und Ressourcen auf technologische Vorreiterrolle und Innovation."

Laut Xiong Youjun besteht insgesamt kein großer technischer Unterschied zwischen China und den USA in der Robotertechnologie, jedoch haben chinesische Roboter-Startups weniger Ressourcen zur Verfügung und es gibt einige Fälle von "das Rad neu erfinden". Das ist der Grund, warum er sich entschied, dem Innovationszentrum beizutreten, um die Reifung der chinesischen Robotertechnologie und Industriestandards zu beschleunigen.

Nach einem Jahr Forschung und Entwicklung hat das Innovationszentrum über die generische Roboterplattform "Tiangong" drei Roboter entwickelt und technologische Durchbrüche in Bereichen wie humanoides Gehen, humanoides Laufen und verkörperte Manipulation erzielt. Die Plattform "Kaiwu" konzentriert sich auf die Entwicklung eines allgemeinen Roboter-"Gehirns" und "Kleinhirns", das es ermöglicht, dass ein technisches Konzept auf verschiedene Robotertypen anwendbar ist. In Zukunft werden die im Innovationszentrum entwickelten Technologien nach und nach als Open-Source verfügbar gemacht.

Laut Xiong Youjun allein durch Open-Sourcing die Technologie voranzutreiben, ist nicht ausreichend, um den Fortschritt der Industrie merklich zu fördern. Das Innovationszentrum ist auch für die Standardisierung der Roboterindustrie verantwortlich. Das Zentrum hat bereits an der Ausarbeitung von vier nationalen und drei internationalen Standards teilgenommen.

Mit der Reifung der humanoiden Robotertechnologie erwartet Xiong Youjun, dass Roboter in der Zukunft für fast jeden erschwinglich sein werden. Trotzdem befürchtet er, dass Preiskämpfe in der Roboterindustrie erneut auftreten könnten, was der Branche schaden würde, und das möchte er nicht sehen.

"Wenn dieser Tag wirklich kommt, welche Rolle kann das Innovationszentrum spielen?" fragte "Intelligentes Erscheinen" Xiong Youjun.

"Es würde bedeuten, dass die Robotertechnologie sehr ausgereift ist und keine allgemeinen technischen Herausforderungen mehr zu lösen sind. Bis dahin hat das Innovationszentrum seine Mission erfüllt, und wir werden mit einer neuen Reise beginnen," sagt Xiong Youjun.

Im Folgenden das Gespräch zwischen "Intelligentes Erscheinen" und dem CEO des National-Regional Body Intelligence Innovation Center for Robotics, Xiong Youjun, redaktionell leicht bearbeitet:

Schaffung des OpenAI im Roboterbereich

"Intelligentes Erscheinen": Sprechen wir erstmal über die Aufgaben des Innovationszentrums. Was denkst du, unterscheidet es von anderen kommerziellen Unternehmen?

Xiong Youjun: Das National-Regional Body Intelligence Innovation Center for Robotics ist eine neuartige Forschungseinrichtung, die von der Regierung definiert wurde. Es repräsentiert sowohl die Nation als auch die gesamte Roboterindustrie und widmet sich der Überwindung von gemeinsamen und entscheidenden Kerntechnologien. Das ultimative Ziel ist es, zu ermöglichen, dass China in der globalen technologischen Konkurrenz im Bereich der verkörperten künstlichen Intelligenz die Spitze einnimmt.

"Intelligentes Erscheinen": Könnte man das Innovationszentrum mit dem frühen OpenAI vergleichen?

Xiong Youjun: Ja, ich denke, dass das Innovationszentrum im Roboterbereich eine leitende Rolle einnimmt, indem es Branchenressourcen bündelt und innovative Anwendungen fördert.

"Intelligentes Erscheinen": Woran arbeitet das Innovationszentrum derzeit hauptsächlich, und auf welche Weise kann es die Entwicklung der Roboterindustrie fördern?

Xiong Youjun: Das Innovationszentrum konzentriert sich auf die Entwicklung der verkörperten intelligenten Robotertechnologie und deren Ökosystems. Es befasst sich vordergründig mit zwei wichtigen Aufgaben: der "Tiangong"-Plattform für generische Roboter und der "Kaiwu"-Plattform für vielseitige verkörperte Roboter.

Das Innovationszentrum leitet auch nationale Aufgaben an, um entscheidende Technologien zu entwickeln und internationale sowie nationale Standards für Roboter zu erstellen. Zudem kooperiert es mit Szenarienpartnern, um Pilotanwendungen für Roboter zu fördern.

"Intelligentes Erscheinen": Wie groß ist das Team aktuell?

Xiong Youjun: Unser Team besteht derzeit aus fast 200 Personen mit einem Durchschnittsalter von 32 Jahren. Der Forschungsanteil beträgt etwa 70 %.

"Intelligentes Erscheinen": Das Thema des Innovationszentrums unterscheidet sich erheblich von deiner vorherigen Aufgabe bei UBTECH; wie wechselst du die Rollen?

Xiong Youjun: Ich bin derzeit noch nebenberuflicher CTO von UBTECH und kann weiterhin die Forschungsarbeit von UBTECH unterstützen. UBTECH ist auch einer der Hauptaktionäre des Innovationszentrums und stellte bei der Gründung bedeutende Ressourcen zur Verfügung. UBTECH hat nicht nur Forschungsmitarbeiter zur Unterstützung bei der Entwicklung mehrerer Projekte entsandt, sondern auch über 300 Patente für das Innovationszentrum freigegeben.

Ich denke, UBTECH hat wesentlich zur Entwicklung des Innovationszentrums beigetragen, insbesondere beim Erkennen von Schmerzpunkten in der Roboterindustrie.

"Intelligentes Erscheinen": Was sind deiner Meinung nach die Schmerzpunkte in der Roboterindustrie, die überwunden werden müssen, um eine massenhafte Produktion und kommerzielle Anwendungen zu ermöglichen?

Xiong Youjun: Ich sehe hier mehrere Aspekte:

Erstens benötigt die technische Reife Zeit. Das umfasst nicht nur die Robotik selbst, sondern auch Technologien in den Bereichen künstliche Intelligenz, verkörperte Wahrnehmung sowie ausgereifte Bewegungskontrolltechniken.

Zweitens schränkt die Reife der Lieferkette die großflächige Anwendung von Robotern ein. Bisher sind die Produktionsmengen von Robotern niedrig, was eine Senkung der Kosten verhindert.

Die Unreife sowohl der Technik als auch der Lieferkette verhindert die Massenproduktion humanoider Roboter, obwohl eine Nachfrage am Markt besteht. Mit technologischem Fortschritt und erhöhter Produktionsmenge werden diese Probleme schrittweise gelöst, was ein fortlaufender Prozess ist.

"Intelligentes Erscheinen": Wenn in der Branche neue Technologien auftauchen, wird sich das Innovationszentrum sofort engagieren, um diese zu verfolgen und zu erforschen? Welche Maßnahmen wird das Innovationszentrum ergreifen, um der Industrie zu dienen?

Xiong Youjun: Bei neuen Technologien führen wir zuerst eine Bewertung durch, wobei die Reife, das Anwendungspotenzial und die Übereinstimmung mit unserer langfristigen Strategie berücksichtigt werden.

Wenn eine neue Technologie in unser Zielprofil passt, investieren wir in die Forschung oder arbeiten mit Branchenpartnern zusammen, um voranzukommen. Außerdem bieten das "Tiangong" Open-Source-Projekt und die Entwicklung verkörperter intelligenten Datensätzen technologische Unterstützung, um den Fortschritt in der Industrie zu fördern.

"Intelligentes Erscheinen": Momentan gibt es keine standardisierten Technologien oder Komponenten im Bereich der Robotik; hat das Innovationszentrum eigene Standards für die technische Entwicklung von Robotern?

Xiong Youjun: Die humanoide Robotertechnologie variiert je nach Branche, und unterschiedliche Lösungen sind erforderlich, daher wird es keine einheitlichen Standards geben. Für industrielle Roboter werden kostenwirksame Lösungen entwickelt; für den kommerziellen und häuslichen Gebrauch wird es ebenfalls spezifische Lösungen geben. Derzeit befindet sich die Technologieentwicklung für humanoide Roboter noch in der Erkundungsphase. Möglicherweise werden sich bestimmte technologische Lösungsansätze schneller entwickeln und die Lieferkettenunterstützung ausbauen.

In einem sich schnell entwickelnden Bereich dürfen die Rahmenbedingungen also nicht in Stein gemeißelt werden, sondern müssen entsprechend der Branchensituation dynamisch angepasst werden.

"Intelligentes Erscheinen": Umfasst die Aufgabe des Innovationszentrums auch die Formulierung von Richtlinien und Standards in der Roboterindustrie?

Xiong Youjun: Ja, das ist eine unserer wichtigsten Aufgaben zur Lösung gemeinsamer Schlüsseltechnologien. Die Standardisierung ist entscheidend für die Branchenentwicklung, daher hat das Innovationszentrum seit seiner Gründung bereits bei der Ausarbeitung von drei internationalen und vier nationalen Roboterstandards eine federführende Rolle gespielt und hat zudem Industrie Standards veröffentlicht.

Kleine Lücke zwischen Roboterintelligenz und us Körperentwicklung

"Intelligentes Erscheinen": Was ist der aktuelle Schwerpunkt der Forschung des Innovationszentrums?

Xiong Youjun: Neben der "Tiangong"-Plattform haben wir auch mehr Ressourcen in die Entwicklung des "Gehirns" unserer Roboter investiert. Dieses "Gehirn" ist die "Kaiwu"-Plattform. Es ist eine verkörperte Intelligenzplattform, die es Robotern ermöglicht, mit "einem Gehirn mehrere Maschinen" sowie "einem Gehirn mehrere Fähigkeiten" zu betreiben.

"Ein Gehirn, mehrere Maschinen" bedeutet, dass die "Kaiwu"-Plattform nicht nur unsere Tiangong-Serie von Robotern bedienen kann, sondern auch Roboter anderer Unternehmen, einschließlich humanoider Roboter, vierbeiniger Roboter und Industrie-Roboter, was Roboter intelligenter macht. "Ein Gehirn, mehrere Fähigkeiten" bedeutet, dass die Plattform verschiedene Szenen wie die Industrie, den kommerziellen Service und das Heim bedienen kann.

Rund um dieses "Gehirn" haben wir auch eine Datenplattform für verkörperte Intelligenz eingerichtet, die zusammen mit mehreren Partnern eine Vielzahl von Anwendungsszenarien entwickelt hat. Neben industriellen Szenarien erforschen wir auch spezialisierte, häusliche und kommerzielle Servicemärkte und werden in Zukunft die weltweit umfassendste und vielseitigste Datenplattform für verkörperte Intelligenz aufbauen.

"Intelligentes Erscheinen": Roboter sind in ihren Formen vielfältig, obgleich die Anzahl der Finger variiert, wie erreicht die "Kaiwu"-Plattform die Unterstützung unterschiedlichster Robotertypen?

Xiong Youjun: Bei unterschiedlichen Typen von Robotern, z.B. mit fünf, vier oder zwei Fingern, wird ein repräsentativer Roboter ausgewählt, um Daten für verschiedene Aktionen zu sammeln. Zweitens haben wir einen Satz verkörperter intelligenter Algorithmen, die es der Kaiwu-Plattform ermöglichen, mit unterschiedlichen Typen von Robotern zu arbeiten.

"Intelligentes Erscheinen": Welche technische Strategie verfolgt das Innovationszentrum bei der Entwicklung seiner Roboter?

Xiong Youjun: Wir fokussieren derzeit auf einen Ansatz, der rein visuell und biomimetisch ist.

"Intelligentes Erscheinen": Warum?

Xiong Youjun: Da biomimetische Ansätze hinsichtlich Kosten und Verlässlichkeit von Produkten vorteilhaft sind.

"Intelligentes Erscheinen": Es wurde bemerkt, dass das Innovationszentrum drei selbstentwickelte "Tiangong"-Roboter vorgestellt hat. Welche Vorteile wurden erreicht, und was ist für die Zukunft geplant?

Xiong Youjun: Tiangong ist tatsächlich ein vollständiges System, und bei der Gründung des Innovationszentrums habe ich fünf entscheidende Aufgaben festgelegt: humanoide Roboterkörper, Bewegungssteuerungsalgorithmen, verkörperte intelligente Großmodelle, ein Roboter-Betriebssystem und Roboter-Toolchains.

Derzeit wurden einige Zwischenergebnisse bei der Entwicklung von Roboterbeinen und -armen erreicht. Als nächstes werden wir eine ganze Bibliothek von Bewegungssteuerungsalgorithmen veröffentlichen, die vorgefertigte Steuerungsmodelle, neue Bewegungssteuerungsalgorithmen sowie Verstärkungslernen und Modelllernen umfassen. Außerdem wird die "Kaiwu"-Plattform in Zukunft schrittweise als Open-Source verfügbar gemacht, um den technologischen Fortschritt in der gesamten Branche und den Ressourcenaustausch zu fördern.

"Intelligentes Erscheinen": Liegt die Priorität des Innovationszentrums in der Lösung von Bewegungssteuerungs- oder Roboterkörperproblemen?

Xiong Youjun: Ja, der Roboterkörper und die Bewegungssteuerung sind gegenwärtig wichtige Fokuspunkte im ersten Entwicklungsstadium, und wir treiben parallel die Entwicklung des "Gehirns" der Roboter voran.

"Intelligentes Erscheinen": Die Kaiwu-Plattform kann Robotern bereits die Fähigkeit verleihen, lange und komplexe Aufgaben auszuführen. Wie wird dies erreicht?

Xiong Youjun: Die Möglichkeit, langanhaltende Aufgaben auszuführen, ist ein Schlüssel zur Robotikintelligenz. Je mehr Schritte eine Aufgabe umfasst, desto komplexer ist sie. "Kaiwu" kann derzeit komplexe Aufgaben mit über 50 Schritten ausführen und flexibel auf unterschiedliche Szenarien reagieren.

Der Kern von "Kaiwu" ist das Design von "verkörpertem Gehirn + Kleinhirn": Das Gehirn wird von KI-Modellen gesteuert, die für die Aufgabenplanung, logisches Schließen und das Verstehen von Szenarien verantwortlich sind; das Kleinhirn ist für spezifische Aktionen zuständig, wie etwa das Ausführen von Fertigkeiten, das Handhaben von Fehlern und das Echtzeit-Feedback. Beide arbeiten zusammen über einen intelligenten Rahmen, um Aufgaben zu erfüllen.

Darüber hinaus baut das Innovationszentrum eine nationale Plattform für einen verkörperten intelligenten Datenpool auf, die Sammlungen, Kennzeichnungen und Optimierungen von Daten ermöglicht. Dies hilft nicht nur "Kaiwu" schneller zu lernen, sondern auch in mehr Szenarien besser abzuschneiden.

"Intelligentes Erscheinen": Mit der Fähigkeit, Aufgaben mit über 50 Schritten auszuführen, welche Anwendungsbereiche könnten für diese Roboter in Frage kommen?

Xiong Youjun: In Zukunft werden diese Fähigkeiten Roboter ermöglichen, weit in den Fertigungssektor, den Dienstleistungssektor und Haushaltsumgebungen vorzudringen. In Fabriken könnten Roboter komplizierte, langwierige und präzise Aufgaben übernehmen, während im Dienstleistungssektor Roboter, die komplexe Langstreckenaufgaben erledigen können, vielfältige Bedürfnisse erfüllen, nicht nur einfache Dialoge führen.

"Intelligentes Erscheinen": Kann der Tiangong-Roboter jetzt Aufgaben wie "Bring mir eine Cola" verstehen und ausführen?

Xiong Youjun: Derzeit hat das Innovationszentrum grundlegende Fähigkeiten zur Ausführung von Langstreckenaufgaben entwickelt, wie z.B. das Abwickeln von Frühstücksaufgaben. Mit weiteren technologischen Fortschritten, der Datenansammlung und der Optimierung des verkörperten großen Intelligenzmodells werden Roboter in der Zukunft stärker und in der Lage sein, vielfältigere komplexe Aufgaben zu meistern.

Aufgaben wie "Bring mir eine Cola" können durch die Architektur "verkörpertes Gehirn + Kleinhirn" umgesetzt werden: Das KI-Großmodell (verkörpertes Gehirn) ist verantwortlich für die Aufgabenplanung und Entscheidungsfindung; das datengesteuerte End-to-End-Fertigkeitsmodul (verkörpertes Kleinhirn) führt Aufgaben wie das Öffnen eines Kühlschranks durch, holt die Cola heraus und reicht sie an den Benutzer.

"Intelligentes Erscheinen": Derzeit kann das Robotergehirn komplexe Aufgaben ausführen, aber der Körper hat gerade das Laufen gelernt. Bedeutet das, dass die Bewegungssteuerung und die Gliedmaßen jetzt nicht mit der Gehirnentwicklung Schritt halten?

Xiong Youjun: Das bedeutet nicht, dass der Körper und die Bewegungssteuerung hinterherhinken. Die Integration von Großmodellen mit der Robotertechnologie ist erst seit zwei Jahren im Gange. Es gibt noch viele Herausforderungen in der gesamten verkörperten intelligenten Industrie, um Roboter weise genug zu machen, um selbstständig Aufgaben zu verstehen und auszuführen.

"Intelligentes Erscheinen": Welche Herausforderungen müssen gelöst werden, damit verkörperte intelligente Roboter in den Masseneinsatz gehen können?

Xiong Youjun: In Industrie- und kommerziellen Dienstleistungsumgebungen gibt es bereits erste Anwendungen einfacher Anforderungen. Um humanoide Roboter jedoch wirklich in Haushalte zu bringen, sind technische Durchbrüche erforderlich. Des Weiteren müssen Herausforderungen in den Bereichen Kosten, Gesetzgebung, Standards und Ethik überwunden werden.

Die technologische Herausforderung betrifft vor allem die Verbesserung der multimodalen Wahrnehmung, die Entwicklung natürlicherer emotionaler Interaktionen, die Generalisierungsfähigkeit bei der Ausführung und die Zuverlässigkeit bei langfristigem, sicherem Betrieb.

Die Kosten sind derzeit hoch, da humanoide Roboter noch nicht in Massenproduktion sind und folglich nicht für den allgemeinen Gebrauch geeignet. Wenn die Technologie reift und die Produktion skaliert wird, ist eine deutliche Kostensenkung möglich, was die kommerzielle Verbreitung vorantreibt.

In rechtlicher Hinsicht und bei Standards gibt es zurzeit keine einheitlichen Vorschriften, und die Fähigkeiten von Robotern unterscheiden sich stark zwischen Unternehmen. Zukünftige nationale oder branchenweite Standards werden die Kompatibilität zwischen verschiedenen Robotern verbessern. Darüber hinaus müssen Haftungsfragen, Nutzungsrechte und entsprechende Rechtsvorschriften geklärt werden.

Diese Faktoren beeinflussen die Geschwindigkeit und Reichweite, mit der humanoide Roboter von der technologischen Probephase in die großflächige Anwendung übergehen.

"Intelligentes Erscheinen": Wie schnell erfolgt die Datensammlung, und wann könnte eine signifikante Veränderung im verkörperten Gehirn sichtbar werden, basierend auf der Datenmenge?

Xiong Youjun: Derzeit deckt die Datensammlung sechs Arten von Roboterkörpern und sieben typische Szenarien ab, wobei täglich 10 TB Daten gesammelt werden. Außerdem hat das Innovationszentrum eine integrierte Datenplattform entwickelt, die Erstellung, Sammlung, Kennzeichnung und Speicherung von Daten in einem vereint, um die Roboterentwicklung umfassend zu unterstützen.

Ich bin optimistisch, dass ein Durchbruch im verkörperten intelligenten Gehirn bald erreicht werden kann. Mit der stetigen Erweiterung der Anzahl von Anwendungsszenarien und der Größe der Daten wird der quantitative Fortschritt schnell zu qualitativen Veränderungen führen und signifikante Fortschritte im verkörperten intelligenten Gehirn bewirken.

"Intelligentes Erscheinen": Wie groß ist der Datenbedarf für das Training von Robotern, und ist mehr Datenvolumen immer vorteilhaft?

Xiong Youjun: Ein großes Datenvolumen ist vorteilhaft, jedoch steigt bei fortdauernder Datensammlung der Anteil an sich wiederholenden Szenarien, Handlungen und Verhaltensweisen, deren Wert dann abnimmt. Wertvoll sind vor allem seltene Szenarien und qualitativ hochwertige Daten, die für die Verbesserung der Roboterfähigkeiten entscheidend sind.

Mit der Annahme von Tesla als einem "selbstfahrenden Roboter" meinte Elon Musk, dass zur Verwirklichung regulierungsfähiger autonomer Fahrzeuge 60 Milliarden Meilen an Fahrdaten notwendig sind, hauptsächlich basierend auf Bilddaten, deren Basisausgaben beschleunigen, bremsen und abbiegen miteinander verknüpft sind. Auch wenn der Kontrollfreiheitsgrad reduziert ist, bleibt das Szenario unstrukturiert.

Im Gegensatz dazu müssen Roboter in unstrukturierten Szenarien mit multimodalen Eingaben (z. B. Audio, Video, Bild und Text) umgehen und zudem Kraftwahrnehmung und Berührungswahrnehmung einbeziehen. Die Komplexität der von ihnen ausgeführten Handlungen übertrifft die Automobilindustrie, weshalb für das Training der Roboter deutlich mehr Datenvolumen benötigt wird.

"Intelligentes Erscheinen": Viele Unternehmen implementieren dieses Jahr end-to-end-Modelle bei Robotern, wird das Innovationszentrum ebenfalls end-to-end-Modelle ausprobieren?

Xiong Youjun: Natürlich, end-to-end ist eine gute Lösung. Für die verkörperte Intelligenz gibt es international unterschiedliche Ansätze:

Der erste ist der end-to-end-Ansatz, bei dem Sprach-, visuelle und Verhaltensdaten in einem großen Modell kombiniert werden. Dies ist eine gekoppelte Lösung, bei der Sprache, Planung, Ausführung von Handlungen usw. gemischt sind, was die Trainingskosten erhöht. Google verfolgt diese Methode.

Der zweite ist der entkoppelte Ansatz, bei dem Sprach-, visuelle und Bewegungskontrollmodule als einzelne separate Modelle betrachtet werden. Dies ist die Vorgehensweise von Figure und OpenAI, die nicht nur Mensch-Maschine-Interaktionen und Sprachkommunikation ermöglichen, sondern auch Handlungen ausführen können. Diese Lösung sehe ich persönlich als vorteilhafter an.

Darüber hinaus gibt es spezifische Modelle für bestimmte Arbeiten. Zum Beispiel verwendet Tesla Nachahmungslernen, um Aufgaben (wie Batteriesortierung) zu trainieren. Diese kleinen Modelle können schnell repliziert werden, haben jedoch eine begrenztere Generalisierungsfähigkeit.

Die drei Ansätze besitzen all ihre eigenen Vorzüge, und wir werden basierend auf unseren Anforderungen genau prüfen, welcher der richtige für uns ist.

Ungefähre jährliche Verzögerung beim "Intelligentisierten" Robotergehirn zwischen China und den USA

"Intelligentes Erscheinen": Was sind deiner Meinung nach die Unterschiede zwischen der Entwicklung humanoider Roboter in China und im Ausland?

Xiong Youjun: China und die USA sind die beiden führenden Länder weltweit in Bezug auf die Entwicklung humanoider Roboter, insbesondere mit dem Einzug der verkörperten Intelligenz werden diese beiden Länder in der Zukunft die Konkurrenz prägen.

In den USA wird dieses Feld von großen Technologieunternehmen dominiert, wie z.B. Tesla, Figure, Digit und Boston Dynamics. Jedes dieser Unternehmen hat seine einzigartigen Stärken. Figure hat die Rückendeckung von OpenAI, Digit hingegen wird von Amazon mit Basistechnologie, Kapital und branchenspezifischer Unterstützung versorgt, während sie innerhalb des akademischen Kreises wie Standford, Caltech usw. eine enorme Basis besitzen.

In China hingegen wird der humanoide Roboterbereich hauptsächlich durch Startups vorangetrieben, was bedeutet, dass die Technologiedichte, Kapitalinvestitionen und die Konzentration brancheninterner Ressourcen relativ geringer sind, bisher vergleichbar mit den Auswirkungen von amerikanischen Firmen.

"Intelligentes Erscheinen": Welche Vorteile hat die Roboterindustrie in China?

Xiong Youjun: Der chinesische Markt ist groß, die Lieferkette ist besser ausgestaltet, Anwendungsszenarien sind reichlich vorhanden und die Geschwindigkeit der technologischen Erkundung ist relativ schneller.

In Bezug auf die Entwicklung von Roboterkörpern gibt es keinen per se großen Unterschied zwischen China und den USA. In bestimmten Bereichen könnte die Technologieforschung in China sogar umfassender sein. Wenn man sich auf dieselbe technische Lösung konzentriert, entwickelt sich China möglicherweise schneller und zeichnet sich darüber hinaus durch die niedrigeren Kosten der wesentlichen Komponenten aus, die Zuverlässigkeit der Technologie und ihre Stabilität.

Auch bei der Bewegungssteuerung stehen sich China und die USA weitgehend auf Augenhöhe, viele Technologiesegmente, die amerikanische Unternehmen bewältigen, können auch wir umsetzen, und in bestimmten Bereichen der rein elektrischen Antriebstechnologie zeichnet sich China durch stärkere Bewegungssteuerungskapazitäten aus als die USA.

"Intelligentes Erscheinen": Ist das schnelle Iterationstempo in China aufgrund der Unterstützungsinfrastruktur für Roboteranwendungen, die schnelle Erprobungen, Datenkonversionen für Iterationen ermöglichen, diesen Vorteil herausragend?

Xiong Youjun: Ja, Chinas Vorteil liegt in der vollständigen Lieferkette, zahlreichen Anwendungsszenarien und starker politischer Unterstützung. Die Regierung bietet politische und ressourcenbezogene Unterstützung an, zusammen mit einem großen Markt und einem vielfältigen Anwendungsszenario, wodurch es China ermöglicht wird, Technologien schneller zu testen, Daten zu sammeln und Produkte zu iterieren. Zudem ist die Produktumsetzung bei uns schneller, wodurch Forschungsergebnisse rasch in fertige Produkte umgewandelt werden können und technische Optimierung und Umsetzung gefördert werden.

"Intelligentes Erscheinen": Wie groß ist der Unterschied zwischen China und den USA in der verkörperten, intelligenten Technologie?

Xiong Youjun: Der Unterschied zwischen China und den USA im Bereich der verkörperten Intelligenz ist marginal, betrachtet man Aspekte wie Daten, Herstellung und Anwendungsszenarien, so hat China teils gewisse Vorzüge.

Was Algorithmen betrifft, so starteten China und die USA nahezu zeitgleich, indem chinesische Forscher regelmäßig Auszeichnungen in führenden Robotik-Konferenzen erzielen, was auf gleichwertige Fähigkeiten hinweist. Bei Daten hingegen ist Interaktion mit dem physischen Weltbild für die verkörperte Intelligenz von entscheidender Bedeutung, während im Ausland die Erhebung solcher Daten teuer und schwierig ist. Aber in China, mit einer großen Herstellungsindustrie, einer Fülle an Anwendungsumgebungen sowie niedrigen Personalkosten, bildet dies einen deutlichen Vorteil beim Datensammeln und Anwenden.

Darüber hinaus gibt es in der Anwendung von "ausführenden Gehirnen" im Sektor der verkörperten, intelligenten Systeme keine signifikanten Unterschiede zwischen den beiden Ländern. Die Differenz liegt im niedrigen Algorithmus: Wir haben einige amerikanische Open-Source-Großmodelle und grundlegende technische Architekturen angewandt. Aber bei der Applikation sind wir schnell iterativ, daher betrachtet sich der Unterschied nicht umfassend groß, jede Partei hat ihre eigenen Stärken.

"Intelligentes Erscheinen": Könnten Sie einige Open-Source-Großmodelle oder grundlegende technologische Architekturen nennen? Welche Auswirkungen hat dies auf die aktuelle Entwicklung humanoider Roboter in China?

Xiong Youjun: Ein anschauliches Beispiel ist, dass viele der Fundamentmodelle in China durch eine Sekundärentwicklung und Optimierung amerikanischer Open-Source-Codes entstanden sind. Mit der Zeit entwickeln Firmen im Inland eigenständig Modelle, was die Einsatzmöglichkeiten und Umsetzung der Technologie beschleunigt.

Der Erwerb der zugrunde liegenden Strukturen von US-amerikanischen Open-Source-Modellen kann entwicklungskosten senken und die rasche Iteration von Technologie und Produkten fördern. Zugleich wird im Inland jedoch auch in die eigene Forschung investiert, um die Dominanz und Eigenverantwortung über die Technologie zu erhöhen.

Die Offenheit und der Zugang zu Open-Source-Initiativen im US-amerikanischen Robotikbereich helfen, das "Rad nicht neu zu erfinden" zu beschleunigen und das globale robotische Ökosystem zu stärken. Genauso fördern Unternehmen in China, dazu gehören Einrichtungen wie unser National-Regional Body Intelligence Innovation Center for Robotics, das humanoide Robotik-Innovationszentrum Shanghai, ZY-Robotics und Yushu, durch die aktive Offenlegung von technischen Geräten den globalen technischen Fortschritt und den Gewinn für alle Menschen.

"Intelligentes Erscheinen": Wenn der Zeitunterschied gemessen wird, wie viel sind China und die USA bei der Roboterentwicklung auseinander?

Xiong Youjun: Die Veröffentlichung eines neuen Großmodells in den USA wird üblicherweise innerhalb eines halben Jahres auch in China begleitet, was die Differenzierung im Allgemeinen auf etwa sechs bis zwölf Monate beschränkt, obwohl dies meine persönliche Sichtweise ist und zeitliche Lücken schwer genau einzuschätzen sind.

"Intelligentes Erscheinen": Was wird getan, um diese Lücke zu überbrücken, und was kann das Innovationszentrum dagegen tun?

Xiong Youjun: In den letzten Jahren hat China seine Investitionen in die Forschung verstärkt, optimiert die Rechenleistung und fördert die Integration der Industrie. Die Regierung von Peking beispielsweise brachte einen Plan zur Schaffung von Grundlagen für Rechenleistung und veröffentlichte eine Plattform für die Verifikation von Inlandsleistungen. Das Innovationszentrum arbeitet partnerschaftlich mit Forschungseinrichtungen und privaten Unternehmen zusammen, um dedizierte Chips für humanoide Roboter zu entwickeln und die Kluft in der Rechenleistung zwischen den Ländern zu verringern.

Roboter immer noch in der Ära der "schwachen" künstlichen Intelligenz

"Intelligentes Erscheinen": Du bist seit über 20 Jahren in der Roboterbranche tätig. Was fasziniert dich an Robotern?

Xiong Youjun: Mein Traum ist eine von Maschinen unterstützte Gesellschaft, wobei Roboter immer mehr in unseren Alltag integriert werden, während sich die Robotertechnik weiterentwickelt. Anfangs könnten Roboter Aufgaben im industriellen Sektor durchführen, dann in den kommerziellen Bereich übergehen und schließlich Teil des humanen Lebens werden, indem sie uns als Partner oder Helfer zur Seite stehen. Ich glaube, dass dies eine maßgebliche Entwicklung ist.

Gleichzeitig ist die Technik derzeit noch nicht ausgereift genug, und wir dürfen nicht an einem Punkt stehenbleiben. Wir können uns die Denkweise bei der Entwicklung von intelligenten Fahrzeugen zunutze machen, indem wir den Intelligenzgrad von Robotern aufstufen. Genauso wie das autonome Fahren von L0 bis L5 fünf Stufen aufweist, wobei die meisten intelligenten Fahrassistenzsysteme auf L2 und L3 verweilen, weit von L5 entfernt, hat jedoch die Technologie bereits eine weite Verbreitung gefunden.

Roboter werden einen ähnlichen Weg gehen. Auch wenn sie noch keine L5-Stufe erreichen, lassen sich bereits viele Anwendungen umsetzen. Roboter können schrittweise die Automation erhöhen, während wir "unterwegs" den Fortschritt nutzen, indem wir die derzeitigen Errungenschaften von Robotern in unterschiedlichen Szenarien anwenden, wodurch sie in Gesellschaft und allmögliche Berufe vordringen. Ich glaube, dass dies ins Geschäftsmodell passt.

"Intelligentes Erscheinen": Die jüngsten Fortschritte bei der Anwendung großer Modelle auf humanoide Roboter hat die Branche beschleunigt. Ist dies jetzt die beste Zeit in der Geschichte für die Entwicklung humanoider Roboter? Gibt es neben der Anwendung großer Modelle noch andere treibende Faktoren?

Xiong Youjun: Sicherlich, jetzt ist ein hervorragender Zeitpunkt für die Entwicklung humanoider Roboter, vergleichbar mit dem Ding des iPhone damals. Viele große Technologieunternehmen wie America's Tesla, Google, Amazon sowie in China Huawei, Tencent und andere Großunternehmen konzentrieren sich verstärkt auf die Förderung dieses Sektors.

Es gibt viele Faktoren, die zur Förderung humanoider Roboter beigetragen haben: der Ausbruch großer Modelle hat der inkorporierten künstlichen Intelligenz mehr Möglichkeiten eröffnet, die Lieferketten werden allmählich ausgefeilter, um die Produktionskosten zu senken und die Anwendungsmöglichkeiten dramatisch auszuweiten. Hinzu kommen Arbeitskräftemangel, steigende Arbeitskosten sowie Bedarf nach Ersatz gefährlicher und spezieller Tätigkeiten, wodurch Automatisierung in der Industrie und Dienstleistungsbereich einen immer stärkeren Bedarf an humanoiden Robotern haben.

"Intelligentes Erscheinen": Kürzlich trafst du auf einer Weltroboterkonferenz den Gründer von Boston Dynamics, Marc Raibert. Gab es Aspekte seiner Meinung zu humanoiden Robotern, die einen großen Eindruck auf dich machten?

Xiong Youjun: Ich habe ihm oft die Frage gestellt, warum Boston Dynamics, trotz seiner starken Technologie, nicht in die Industrialisierung geht? Warum nicht kommerziell operieren oder Finanzierung anstreben? Seine Antwort war einfach: "I don't care." Er legt keinen Wert darauf. Boston Dynamics konzentriert enorm viel Energie und Ressourcen auf technologische Spitzenleistungen und Innovation, was mit Hingabe und einer wachsamen Einstellung getan wird, die bewundernswert ist.

"Intelligentes Erscheinen": Früher hast du die Entwicklung von Robotern in drei Phasen unterteilt: schwache KI, starke KI und superintelligente KI. In welchem Stadium befindet sich jetzt die Roboterentwicklung?

Xiong Youjun: Ich denke, wir befinden uns nach wie vor in der Ära der schwachen künstlichen Intelligenz, auch wenn wir kontinuierlich auf die allgemeine künstliche Intelligenz zusteuern. Der Fokus künstlicher Intelligenz liegt immer noch vorwiegend im digitalen oder informationsbasierten Raum, während echte Interaktion mit der physischen Welt nach wie vor selten vorkommt. Die Ära der verkörperten Intelligenz hat nicht wirklich begonnen, selbst wenn wir dabei sind, die ersten Schritte zu unternehmen, es befindet sich noch in einem frühen Stadium.

Ob man nun mit einem Roboter spricht oder ihn Pläne generieren, Text schreiben oder Videos erstellen lässt, all diese Dinge sind dem virtuellen oder informativen Bereich zuzuordnen. Doch die menschliche Intelligenz geht weit über das hinaus, was möglich ist. Es geht, wie Fei-Fei Li sagte, auch um den kräftigen intelligenzorientierten Ansatz (Räumliches Denken), wobei wir in der Art und Weise, wie wir in physikalischen Welten denken, noch grundlegende Lücken haben.

"Intelligentes Erscheinen": Wenn Roboter in intensiver Wechselwirkung mit der physischen Umgebung stehen, kann man dies als superintelligente KI bezeichnen?

Xiong Youjun: Ich denke, es muss nicht so extrem sein, dass man dann an superintelligente KI denkt. Wir Menschen verstehen die Denkweisen unseres Gehirns schließlich selbst noch nicht vollständig, es bleibt vieles rund um die Mechanismen des menschlichen Gehirns ein Mysterium. Auch wenn die künstliche Intelligenz große Fortschritte macht, erreicht sie noch lange nicht das, was wir uns unter "superintelligente KI" vorstellen.

"Intelligentes Erscheinen": Welche Rolle spielen Roboter in der Ära der superintelligenten KI?

Xiong Youjun: Hier sind der Fantasie keine Grenzen gesetzt. Früher erwähnte ich mal einen ähnlichen Gedanken wie im Roman "Die drei Sonnen": In unserer Welt könnten verschiedene Lebensformen existieren. Neben uns Kohlenstoff-basierten Biomenschen könnte es auch Cyborgs geben, wo eine Hälfte menschlich, die andere Hälfte Roboter ist, oder sogar vollwertige Maschinenwesen entstehen.

Zum Beispiel könnte mein Gegenüber möglicherweise ein humanoider Roboter-Junge sein oder ein Roboterassistent. Er würde genauso aussehen wie wir, mit Haut und sehr menschenähnlichen Gesichtsausdrücken. Beim Gespräch würden seine Mimik und Gestik ebenso wie bei einem Menschen wirken und sich kaum von einem realen Menschen unterscheiden. Genau wie in der Serie "Westworld".

"Intelligentes Erscheinen": Welche Form könnte das Aussehen eines Roboters schließlich haben?

Xiong Youjun: Die Anwendungsgebiete von Robotern werden noch erforscht, wobei auch ihr Aussehen entsprechend den Anforderungen der Szenarien variieren könnte. In der häuslichen Umgebung könnten Roboter mehr Wert auf das Äußere legen, mit Gesichtsausdrücken, Haut und zahlreichen Berührungssensoren, sodass sie insgesamt attraktiver wirken. In industriellen Umgebungen wären die Anforderungen an das Aussehen eher einfach gehalten, der Schwerpunkt liegt dabei auf Stabilität, Präzision und Geschwindigkeit, also praktischen Eigenschaften.

"Intelligentes Erscheinen": Die Roboterindustrie befindet sich noch im Anfangsstadium, alle suchen nach Einsatzszenarien, und es ist noch ein langer Weg zur kommerziellen Anwendung. Einige Investoren drängen darauf, Ergebnisse zu sehen, was hältst du von den Spannungen zwischen Roboter-Startups und Investoren?

Xiong Youjun: Um ein großes Maß an kommerzieller Anwendung zu realisieren, ist die Reife der Technologie und Produkte entscheidend. Innerhalb der technologischen Entwicklung gibt es immer einige spezialisierte Szenarien und temporäre Anwendungen, wobei Technologieinnovation und Anwendungsimplementations Prozesse und Übergänge erfahren.

Derzeit konzentrieren wir uns auf industrielle Szenarien und einige kommerzielle Servicebereiche. Mit zunehmender Reife der Technologie und der Produkte werden humanoide Roboter in die verschiedenen Lebens- und Arbeitsbereiche eindringen, etwa in die industrielle Nutzung oder den häuslichen Service.

Ich hoffe, dass Kapitalgeber und die breite Öffentlichkeit geduldiger und verständnisvoller gegenüber dem Fortschritt verkörperter intelligenter Roboter und humanoider Roboter sind, damit die langfristige Entwicklung der Branche gefördert wird.

"Intelligentes Erscheinen": Du hast zuvor erwähnt, dass humanoide Roboter in der Zukunft "pro Kilogramm verkauft" werden. Ist dies eine Möglichkeit in der Ära der starken künstlichen Intelligenz?

Xiong Youjun: "Pro Kilogramm verkauft" bezieht sich darauf, dass die Kosten von humanoiden Robotern nicht die größte Sorge darstellen. Mit zunehmender technologischer Reife werden die Herstellungskosten nach kommerzieller Anwendung stark sinken.

Wie im Fall der Handybranche wurden frühe große Mobiltelefone teuer und schwer von "Reichen" verwendet, während heutige moderne Mobiltelefone bei gleicher Funktionalität wesentlich billiger sind. Sobald Roboter in Massenproduktion hergestellt werden, können Haushalte sie in Reichweite bringen.

Preiskämpfe möchten wir jedoch vermeiden, da sie niemandem nützen.

"Intelligentes Erscheinen": Sollte es in der Zukunft tatsächlich zu Preiskämpfen in der Roboterindustrie kommen, könnte das Innovationszentrum als einflussreiche Organisation in der Roboterindustrie am Markt Veränderungen vornehmen?

Xiong Youjun: Wenn dieser Tag kommt, deutet dies an, dass die Roboterbranche bereits floriert und alle technischen und industriellen Probleme gelöst wurden und sie in die großflächige industrielle Anwendungsphase eingetreten sind. Ich wäre dann der Meinung, dass das Innovationszentrum bereits sehr erfolgreich ist, und zu diesem Zeitpunkt beginnen, sich neue Aufträge anzuschauen.

Das nationale Ziel ist es, dass das Innovationszentrum in der verkörperten intelligenten Ära die Entwicklung der Roboterindustrie leitet, ähnlich wie die Pionierstellung Chinas im globalen Automobilmarkt. Sobald die Roboterindustrie ganz vom Markt getrieben ist, beginnt das Innovationszentrum möglicherweise mit neuen Aufgaben und Missionen.

"Intelligentes Erscheinen": Zu dieser Zeit, hat sich dein Robotertraum erfüllt?

Xiong Youjun: Ich kann mir vorstellen, dass zu diesem Zeitpunkt mein aktuelles Ziel erfüllt ist, jedoch kann das nächste Ziel oder eine größere Vision möglicherweise für mich da sein.