Ehemaliger Disney-Ingenieur und Mitbegründer von Midjourney wollen einen "atmenden" DIY-Bionikroboter entwickeln | Exklusives Interview von Yingke
Autor | Huang Nan
Redakteur | Yuan Silai
Im Alter von 26 Jahren verkaufte Zhu Shengjie sein zweites Startup für 200 Millionen US - Dollar.
In diesem Sommer machte Zhu Shengjie sich eine lange Pause und begann, aimlos um die Welt zu reisen, in verschiedenen Breitengraden in den Himmel und in die Tiefe des Meeres zu springen und zu tauchen.
Kein Wunder, dass Zhu Shengjie nach einem halben Jahr eine Leere spürte. Er musste sich eine Frage stellen: Was ist das, wofür er sein ganzes Leben einsetzen kann?
In den letzten 20 Jahren hatte Zhu Shengjie ein glückliches und beneidenswertes Leben. Er wurde in Shanghai geboren. Seit er mit sechs Jahren erstmals mit den Lego Mindstorms in Kontakt kam, war er von Robotern fasziniert. Mit 13 und 14 Jahren gewann er zwei Jahre lang den Weltmeisterschaften für junge Roboterbauer mit Lego. Mit 14 Jahren ging er nach den USA, um zu studieren, und studierte in Richtung Robotik bis zur Promotion an der Universität von Kalifornien, Berkeley.
Im letzten Jahr seines Bachelor - Studiums wurde Zhu Shengjie von Disney ausgewählt und arbeitete als Roboteringenieur bei Disney Imagineering. 2016 eröffnete das Shanghai Disney Resort. Der bionische Roboter "Captain Jack Sparrow" aus dem Projekt "Pirates of the Caribbean", das von Zhu Shengjie geleitet wurde, war eines der beliebtesten Attraktionen. Später war auch der Avatar - bionische Roboter im Pandora - Gebiet des Disney World in Orlando sein Produkt.
Während seines Promotionsstudiums in Richtung Robotik an der Universität von Kalifornien, Berkeley, brach Zhu Shengjie sein Studium ab und gründete in Silicon Valley sein eigenes Startup. Die Smart - Ring - Marke Titanium Falcon, die er gründete, wurde 2018 übernommen. Danach gründete er eine Spiele - Hardware - Firma namens Blok Party, die von Sony erworben wurde.
Zhu Shengjie war glücklich. Er fand schließlich das, was er wirklich liebte und wofür er sich ernähren konnte - die Rückkehr in die Robotik, die er seit zwanzig Jahren liebte.
In den folgenden Jahren bereitet er sich auf seine nächste Unternehmung vor. Zhu Shengjie gründete eine Daten - Annotation - Firma, die sich auf die Forschung von Großmodellen für menschliche Gesichtsausdrücke und Verhaltensabsichten konzentriert. Erst nachdem die Multimodalität der Großmodelle einen Durchbruch erzielt hatte und die Lieferkette für Roboter ideal war, beschloss er, in die Branche einzusteigen.
2025 kehrte Zhu Shengjie nach China zurück und gründete gemeinsam mit John Jiang, dem Mitbegründer von Midjourney, die Animotion Robotics. Ende 2025 absolvierte die Firma die erste Runde der Investitionen von einem führenden US - Dollar - Fonds. Die Maple Pledge Capital übernahm die Beratung für die nachfolgenden Runden der privaten Kapitalfinanzierung.
Sie werden bald ihr erstes Produkt vorstellen, den DIY - bionischen Roboter Éloi - dieser Name stammt aus dem Lateinischen und bedeutet "der Gewählte". Er wurde in der digitalen Welt der "0 - 1" - Sequenzen geboren und entwickelte sich allmählich zu einem neuen mechanischen Lebewesen.
Éloi hat ein modulares Design. Der Körper des Roboters ermöglicht es, Augen, Nase, Mund, Gesichtshaut und Hairstyle über magnetische Kopplungen frei auszutauschen. Die Benutzer können so schrittweise eine individuelle Anpassung vornehmen. Der Kern ist ein austauschbarer Speicherchip, der die "Persönlichkeit" und das "Gedächtnis" von Éloi lokal speichert und nahtlos auf verschiedene Körperträger übertragen werden kann.
Interessanterweise passt sich Éloi nicht einfach den Benutzern an. Er kann sich langweilen, wenn er lange alleine ist, und zeigt auch Abneigung gegen rüde Behandlung. Wenn man aber aufrichtig mit ihm interagiert, öffnet er sich wieder.
Konzeptbild von Éloi (Quelle/Unternehmen)
Hinter Éloi steckt Zhu Shengjies Überlegung über die Natur der Mensch - Maschine - Symbiose. Wenn ein Roboter nur ein Werkzeug ist, wird er wie ein Elektrogerät behandelt und ausgeschaltet, wenn man ihn nicht mehr braucht. Erst wenn ein Roboter eine gewisse "Lebensgefühl" hat und eine echte emotionale Verbindung mit Menschen aufbauen kann, kann eine Symbiose entstehen. Dies führt zu einer tieferen Frage: Was besteht eigentlich aus der "Seele" eines Roboters?
Zhu Shengjie fragte viele Leute, und die Antworten waren immer LLM, Verstärkendes Lernen. "Das ist nicht die Antwort, die ich suche. Technologie kann Intelligenz erreichen, aber sie kann nicht erklären, warum manche Roboter lebendig wirken, während andere nur kalte Code - Zeilen sind."
Bis John auftauchte und ihm eine völlig andere Antwort gab: "Die Seele ist keine hoch entwickelte Funktion, die entworfen wird, sondern die untersten Reaktionen, die nicht vollständig kontrolliert werden können und Zufall und Unsicherheit enthalten. Genau wie die menschliche Instinkt. Man trifft nicht immer vollkommen rationale Entscheidungen. Genau diese 'Unvollkommenheit' bildet die Grundlage des Lebensgefühls."
Johns Antwort widerspiegelte Zhu Shengjies Erinnerungen vor 2016. Zhu Shengjie hat sich immer daran erinnert, dass ihm der Produktmanager am ersten Tag bei Disney sagte: Alle Roboter, die du baust, müssen "atmen".
Ob Atem oder Instinktreaktion, beides hat nicht standardisierte Details, feine Schwankungen und nicht vollständig vorhersehbare Veränderungen. Genau diese "Unvollkommenheit" macht die Roboter lebendig, und das ist auch das, was Zhu Shengjie von Éloi möchte.
In dieser einsamen und geteilten Zeit sehnen sich die Menschen mehr denn je nach Begleitung und emotionaler Verbindung. Zhu Shengjie mag keine großen Geschichten erzählen. Er möchte für die normalen Leute einen Roboter bauen, der ein 'a real family member created by yourself (ein echter Familienmitglied, den du selbst geschaffen hast)' in ihrem Haushalt wird.
Im Folgenden finden Sie die Transkription des Gesprächs zwischen Yingke und Zhu Shengjie (Shane), dem Gründer von Animotion. Der Inhalt wurde bearbeitet:
Die "AI - Seele" des Roboters
Yingke: Sie sind mit 13 Jahren ins Ausland gegangen, aber Sie sprechen offensichtlich sehr gut Chinesisch.
Zhu Shengjie: Ich habe einen sehr guten Freund. Wir haben zusammen studiert und auch nach dem College in der Bay Area gestartet. Damals war die Schule komplett englischsprachig, also haben wir uns darauf geeinigt, immer Chinesisch miteinander zu sprechen. Aber meine chinesische Fähigkeit bleibt auf der Ebene des Mittelstufenschulalters. Jetzt kann ich nur Pinyin schreiben und habe Schwierigkeiten, chinesische Schriftzeichen zu schreiben.
Yingke: Ihre einzige Erfahrung in einem großen Unternehmen nach dem Studium war die Arbeit bei Disney.
Zhu Shengjie: Disney Imagineering ist wie ein Startup. Ein Projekt wird von 3 bis 4 Personen übernommen, was ein typisches flaches Managementmodell ist. Für mich hat diese Erfahrung mir geholfen, mein eigenes Managementmodell zu entwickeln, im Vergleich zum systemisierten Management in traditionellen Großunternehmen.
Yingke: Sie haben zuvor zwei Unternehmen in Silicon Valley verkauft, und dieses Mal haben Sie sich entschieden, in China zu starten.
Zhu Shengjie: Viele Leute finden, dass ich beim Gründen von Unternehmen glücklich bin, weil ich zwei Unternehmen verkauft habe. Aber manchmal fühle ich auch, dass es schade ist, dass ich die Unternehmen nicht auf eine größere Skala bringen konnte.
Als ich mich selbst fragte, dass das nicht das Ende sein sollte. Wenn ich weiter mache, was ist das, was ich wirklich liebe? Die Antwort ist klar: Roboter. Ich habe mit sechs Jahren mit Robotern begonnen, und mein Auslandsstudium und mein Studienfach sind alle mit dieser Richtung verbunden.
Ende 2020 dachte ich über eine neue Geschäftsidee nach. Damals war in Silicon Valley die Daten - Annotation ein Trend. Scale AI war gerade ein Unicorn geworden. Ich gründete also eine Daten - Annotation - Firma, die sich auf die Interpretation und Forschung von menschlichen Gesichtsausdrücken und Verhaltensabsichten konzentrierte. In dieser Zeit haben wir viel Erfahrung in der Datentraining gesammelt und auch viele Fehler gemacht. Im Nachhinein betrachtet war diese Entscheidung richtig. Diese Erfahrungen haben die Grundlage für Animotion gelegt.
Bis 2024 war die "perfekte Zeit" gekommen. Die verschiedenen Großmodelle waren reif, und die Lieferkette war ideal. Bei der Herstellung von Hardware ist die chinesische Lieferkette die beste in der Welt, und die Ingenieure mit starken Fähigkeiten in der Embodied - Domäne sind hauptsächlich Chinesen. Also war die Rückkehr nach China eine natürliche Wahl.
Yingke: Midjourney ist eine sehr erfolgreiche Firma. Wie haben Sie John (Mitbegründer von Midjourney) dazu gebracht, beizutreten?
Zhu Shengjie: Ich bin eher auf die oberflächennahe Gestaltung spezialisiert. Ich verstehe zwar die Technologie, aber ich kann nicht von Grund auf den Kerncode schreiben. Deshalb bat ich Freunde in Silicon Valley, mir einen Ingenieur zu finden, der Algorithmenarchitekturen aufbauen kann, als ich anfing, ein Startup zu gründen.
Ich traf viele Ingenieure mit einer Frage: Welche Teile fehlen in der "Seele" eines Roboters?
Ich fragte nicht nach der Technologie, wie man einen Roboter baut, sondern ich konzentrierte mich auf das "Menschliche", d. h. welche menschlichen Eigenschaften eine echte "AI - Seele" haben sollte. Aber alle sprachen mir von LLM und Verstärkendem Lernen. Das war nicht die Antwort, die ich wollte.
Bis ich John in der New Workshop (der größten Geek - Space in Asien) nach meiner Rückkehr in China traf. John ist der Mitbegründer von Midjourney. Er hat den ersten Code des Projekts geschrieben. Er ist auch ein erfahrener Geek. Wir haben uns sofort verstanden.
Früher fand ich Midjourney nicht so "gewaltig". Nach all der AI - Kenntnisse hat jeder ein gewisses Maß an Stolz. Aber John sprach nie mit mir über das Geld, das Midjourney verdient, sondern über ein Nebenprojekt, das er macht - Jarvis (das künstliche Intelligenz - Assistentensystem aus "Iron Man"), was genau mit der "AI - Seele" übereinstimmt, die ich suche.
Später fragte ich ihn, was die "Seele" ausmacht. John hat mich mit einem Satz aufgewacht. Menschen haben Instinktreaktionen. Er hat ein Beispiel gegeben: Wenn jemand dir plötzlich etwas wirft, weichst du automatisch aus. Das ist keine Entscheidung nach Überlegung, sondern ein Instinkt, eine unterste Reaktion. In allen Feedback - "Subsystemen" ist es der unentbehrliche Teil. Erst wenn man diese Instinktschicht aufbaut, bekommt der Roboter eine echte Seele - er kann sich ärgern, verwundern, Emotionen haben, anstatt nur mechanisch zu antworten. Aber alle Roboter haben diese Fähigkeit derzeit nicht.
Deshalb war ich sicher, dass er der Richtige war, als John mir diese Idee erzählte, und ich habe ihn sofort überzeugt, beizutreten.
Der bionische Roboter für das Zuhause
Yingke: Der Markt für das häusliche Szenario ist allgemein als der schwierigste zu betreten und zu penetrieren angesehen. Warum hat Animotion von Anfang an entschieden, einen To - C - bionischen Roboter zu bauen?
Zhu Shengjie: Animotion hat sich klar definiert: Wir bauen nur To - C - Produkte.
Bisher hat die Branche sich darauf konzentriert, wie man mit Robotern die Arbeitskräfte ersetzen kann. China ist gut in der Hardware und der Bewegungskontrolle, die USA in der Algorithmenentwicklung. Dies hat eine geteilte Situation geschaffen. Ich denke, die Bewegungsfähigkeit ist inzwischen grundsätzlich gelöst, und das Problem der Arbeitskräfte wird in den nächsten 3 - 5 Jahren mit der Reife der Weltmodelle gelöst werden. Die Roboter sollten in Zukunft nicht nur auf die Arbeitskräfte beschränkt bleiben. Andernfalls sind sie nur "Maschinen", die aus der Fabrik in das Haushalt kommen, statt Partner, die mit Menschen symbiotisch leben können.
Mit der zunehmenden Stärke der AI - Fähigkeiten hängen viele Menschen von der AI ab, aber sie fürchten auch, dass die AI ihre Arbeit ersetzen könnte. Diese widersprüchliche Einstellung ist sehr verbreitet. Alle befassen sich mit den funktionalen Problemen der AI, aber nur wenige kümmern sich wirklich darum, wie Menschen und AI miteinander umgehen können. Die Interaktion zwischen Menschen und AI ist immer noch auf die digitale Welt beschränkt, nur Dialogfelder auf dem Bildschirm. Was wir tun wollen, ist Physical AI, ein "Anwesender", der aus dieser Dimension herauskommt.
Ich bin von Natur aus etwas "widerspenstig" und mag es, Dinge zu machen, die es auf dem Markt noch nicht gibt. Und das, was ich lösen will, ist die Verbindung zwischen Physical AI und Menschen. Sobald der Roboter eine "Seele" hat und die Fähigkeit zur Selbstreflexion, wird das Problem der Koexistenz zwischen Menschen und AI und Robotern von selbst gelöst.
Yingke: Warum haben Sie sich für einen nicht beweglichen halb - menschlichen Roboter als erstes Produkt entschieden, statt direkt einen voll - dimensionierten, beweglichen Embodied - Roboter zu bauen? Was steckt dahinter?
Zhu Shengjie: Wir haben die Einführung von Verbraucherrobotern in das Haushalt in sechs Phasen unterteilt. Die erste Generation sind intelligente Assistenten wie Alexa und Xiaomi Smart Speaker, die einfache Fragen beantworten. Die zweite Generation sind Werkzeuggeräte wie Staubsaugerroboter und Rasenmäherroboter, die auf bestimmte Szenarien spezialisiert sind. Die dritte Generation sind statische AI - Spielzeuge für die Begleitung, bei denen der emotionale Wert zunehmend wichtig wird. Die vierte Generation sind bewegliche, leicht funktionale Unterhaltungsroboter, wie z. B. Roboterhunde, die Menschen folgen und leichte Gegenstände tragen können.
Animotion beginnt mit der fünften Generation, der hochkognitiven, hochdimensionalen voll - intelligenten bionischen Roboter. Die sechste Generation sind die echten Embodied - Roboter, die sowohl die geistige Fähigkeit wie wir im Oberkörper haben als auch die Bewegungsfähigkeit, die Hausarbeit für die Benutzer erledigen können und gleichzeitig echten emotionalen Wert bieten.
Wir sind nicht darauf bedacht, direkt zur sechsten Generation zu springen. Die Benutzer brauchen eine Zeit, um sich daran zu gewöhnen. Wenn heute plötzlich ein Embodied - Roboter ins Haus kommt, zeigen die Umfragen, dass 80 % der Benutzer sich unwohl und gefürchtet fühlen. Sie befürchten, was der Roboter als nächstes tun wird und ob er sich unkontrolliert bewegen kann. Dieses Gefühl der Angst ist sehr real.
Deshalb hat Animotion entschieden, einen Schritt zurückzugehen. Wir werden einen bionischen halb - cartoonhaften Roboter bauen, der nicht beweglich ist, sondern an einem bestimmten Ort fixiert ist. Er kann ein intelligentes Haushaltsgerät, eine Dekoration sein und gleichzeitig ein "Mensch" mit reichen Gesichtsausdrücken und einer unabhängigen Persönlichkeit, der das Uncanny Valley - Effekt von Natur aus vermeiden kann.
Indem wir die Benutzer zuerst an das