Xu Huazhe von "Broken Shell Robotics": Innerhalb von zwei Jahren wird es in China einsetzbare Haushaltsroboter geben.
Text | Qiu Xiaofen
Editor | Su Jianxun
Im Jahr 2026 haben sich die Unternehmer im Bereich der Embodied Intelligence Roboter übereinstimmend auf die "Tiefenwassergebiete" - die Haushalte - konzentriert.
Was diese Begeisterung entfacht hat, sind die in letzter Zeit im Bereich auftauchenden Anzeichen des Scaling Law -
Zunächst hat das kalifornische Unternehmen Generalist AI in Bezug auf das GEN - 1 - Modell die Bestimmtheit bestätigt. Nachdem sie ihren Robotern eine riesige Datenmenge zugefüttert haben, ist die Erfolgsrate bei feinen Handhabungsaufgaben von 64 % auf erstaunliche 99 % gestiegen.
Anschließend hat auch das aufstrebende kalifornische Unicorn Unternehmen Sunday Robotics versucht, die Schwierigkeiten bei den Daten für Haushaltszenarien zu lösen. Sie haben nicht nur das Umi - Handschuh - Datenerfassungssystem vorgestellt, sondern auch den Roboter Memo in Haushalte geschickt, um Hausarbeiten zu erledigen (z. B. Tisch abräumen, Kaffee machen, Kleidung falten), was eine große Anzahl von Investoren angelockt hat.
Im fernen China ist unter den kürzlich in den Bereich der Haushaltsroboter eingestiegenen Unternehmern auch eine vertraute Gestalt - Xu Huazhe - zu finden.
"Innerhalb von zwei Jahren wird es in China brauchbare Haushaltsroboter geben", so seine optimistische und radikale Einschätzung der Branche.
Als einer der "Vier von Berkeley zurückgekehrten" und als Assistentprofessor am Cross - Information - Institut der Tsinghua - Universität hat Xu Huazhe 2023 der Firma "Xinghaitu" als ehemaliger Chefwissenschaftler und Mitbegründer beigetreten und zusammen mit anderen die Firma zu einem Starunternehmen im Bereich der Embodied Intelligence in China gemacht.
Allerdings hat Xu Huazhe in dem Höhepunkt, als der Unternehmenswert von Xinghaitu 20 Milliarden Yuan überschritt und fast 3 Milliarden Yuan an Kapital beschafft wurden, beschlossen, "allein zu gehen" und gründete das neue Embodied - Intelligence - Unternehmen "Poke Robot".
Bei diesem Neustart möchte er einen Embodied - Intelligence - Roboter schaffen, der in Haushaltsumgebungen arbeiten kann und eine echte Generalisierbarkeit aufweist.
△ Xu Huazhe
Tatsächlich war die Idee, ein Haushaltsroboterunternehmen zu gründen, keine plötzliche Idee. Als er in der Mittelschule und Highschool das Buch "Steve Jobs" gelesen hat, hat in ihm der Keim einer Idee entstanden, ein großartiges To - C - Unternehmen zu gründen. Seitdem hat er während seines Studiums an der Tsinghua - Universität, an der Universität von Berkeley und an der Stanford - Universität immer weiter in Richtung Robotik und Verstärkungslernen geforscht und den Traum gehabt, Roboter in Tausende von Haushalten zu bringen.
Sein idealer Haushaltsroboter ist zwar nicht allmächtig, aber er kann komplexe Aufgaben erledigen, die die Roboter der vorherigen Generation (z. B. Staubsauger, Bodenreiniger) nicht bewältigen können. Beispielsweise kann er feinere Reinigungsarbeiten durchführen und langwierige, mehrstufige Aufgaben wie das Waschen und Aufbewahren von Kleidung in geordneter Weise abwickeln.
Nach seiner Meinung ist die Wahl dieser Unternehmensrichtung auch von einer starken ästhetischen Vorliebe geprägt. Xu Huazhe meint, dass die Essenz der Generalisierbarkeit eine "Schönheit und Einfluss" ist - mit dem einfachsten und elegantesten Modell die komplexen Lebensprobleme der Menschen zu lösen und die KI tatsächlich in Produktivität umzuwandeln, anstatt nur niedrig qualifizierte Arbeitskräfte zu ersetzen.
Aus einer rationaleren Perspektive beinhaltet der Einstieg in die To - C - Haushaltsbranche auch Xu Huazhes geschäftliche Einschätzung. Nach seiner Ansicht schicken derzeit viele Roboterhersteller humanoide Roboter in Fabriken, um Aufgaben wie das Be- und Entladen und das Transportieren von Kisten zu erledigen, die auch traditionelle Roboterarme bewältigen können. Im Wesentlichen machen sie mit neuen Mitteln das, was man in der Vergangenheit schon getan hat, und die Roboter entfalten ihre echte Universalität nicht.
Er ist der Meinung, dass die echte AGI (Allgemeine Künstliche Intelligenz) in Haushaltsumgebungen entstehen und angewendet werden sollte, denn die Aufgaben in Haushalten sind ungeordneter und zufälliger als in Fabriken, und die Daten sind reichhaltig. Dies ist gerade der beste Boden für das Training von universellen Modellen.
Um die Gelegenheit nicht zu verpassen, hat das neue Unternehmen "Poke Robot" in nur einem Monat nach Gründung die Kapitalbeschaffung, die Gründung des Kernteams, das Training des Embodied - Modells und die Hardware - Iteration abgeschlossen.
Nach exklusiven Informationen von "Intelligent Emergence" hat Poke Robot kürzlich eine Angel - Runde von mehreren Millionen US - Dollar abgeschlossen, die von Yunqi Capital angeführt wurde. Unterstützt wurden sie von führenden Dollar - Fonds wie Shunwei Capital und Honghui Fund, bekannten Branchenunternehmen wie Xiaomi Strategic Investment und Xinghaitu sowie von führenden marktorientierten Fonds wie BV Baidu Venture Capital, Inno Angel Fund, Tsinghua Alumni Seed Fund und Dongfang Jafu.
Die schnelle Kapitalbeschaffung ist auch darauf zurückzuführen, dass Xu Huazhe bei der Wahl der Schlüsseltechnologien einige andere Entscheidungen getroffen hat.
Um die Generalisierbarkeit zu erreichen, hat er bei der Wahl der Schlüsseltechnologien eine eher unkonventionelle Entscheidung getroffen. Er hat das von der Branche vorherrschende VLA (Visual - Language - Action) - Basismodell völlig aufgegeben und stattdessen ein Weltmodell aufgebaut, das direkt "Video - Aktion" - Daten ein- und ausgeben kann.
Bezüglich der Modellstruktur hat er auch das einzigartige "UAG - Architektur" vorgeschlagen. Anstelle der herkömmlichen kaskadierten Trainingstechnik nutzt er ein paralleles Vor - Training und integriert das Verstärkungslernen in das gesamte Vor - Training und die Implementierung, wodurch die Trainingsleistung um das Fünffache gesteigert wird.
Neben der Grundlegung des Modells hat er auch auf Daten - und Hardwareebene durch die dreistufige Lösung von UMI, Exoskelett und Erstpersonenperspektive hochwertige Daten gesammelt und eine geschlossene Schleife von Aufgabenbeschreibung über Daten, Modell bis hin zum Roboter selbst geschaffen.
Laut Xu Huazhe ist das erste Embodied - Weltmodell mit 32 Milliarden Parametern von Poke Robot die erste Runde des Trainings abgeschlossen und befindet sich derzeit in der kritischen Phase der Daten - Iteration. Auf Hardwareebene hat das für die Datenerfassung maßgeschneiderte Handschuh - Hardware von Poke Robot bereits fünf oder sechs Versionen hinter sich.
Kürzlich hat "Intelligent Emergence" mit Xu Huazhe gesprochen. Im Folgenden finden Sie die Transkription des Gesprächs (leicht gekürzt):
Warum hat er Xinghaitu verlassen?
Intelligent Emergence: Warum haben Sie sich entschieden, Xinghaitu zu verlassen und ein neues Roboterunternehmen zu gründen?
Xu Huazhe: Diese Idee hat sich schon lange in mir entwickelt. Im August und September 2023 habe ich mit Gao Jiyang darüber gesprochen, Xinghaitu beizutreten. Aber nach zwei Jahren, im November und Dezember des vergangenen Jahres, war ich im Wesentlichen entschieden, zu gehen. Die formalen Abläufe wurden erst in diesem Jahr abgeschlossen. Die Gründung von "Poke Robot" ist eine Sache des letzten Monats.
Der Hauptgrund für mein Verlassen war, dass ich immer ein To - C - und wirklich generalisierbarer universeller Roboter machen wollte.
Intelligent Emergence: Wenn Sie immer To - C - Roboter machen wollten, warum haben Sie nicht direkt in diese Richtung begonnen?
Xu Huazhe: Es gibt mehrere Gründe. Als ich 2023 Xinghaitu beigetreten bin, habe ich auch darüber nachgedacht, ob ich selbst ein Unternehmen gründen sollte. Aber damals war ich gerade aus den USA zurückgekommen und arbeitete erst seit etwa einem Jahr am Cross - Information - Institut. Es wäre eine große Herausforderung gewesen, ein eigenes Unternehmen zu leiten und gleichzeitig meine Lehrtätigkeit zu bewältigen.
Damals haben auch Xinghaitu und andere Embodied - Intelligence - Unternehmen mich eingeladen, beizutreten. Ich fand es eine sicherere Wahl, zunächst als Mitbegründer einem ausgezeichneten Team beizutreten. Außerdem hat die Werbung von Xinghaitu damals auch etwas über "Roboter, die Tausenden von Menschen dienen" gesagt, was mit einem Teil meiner Ideen übereinstimmte.
Intelligent Emergence: Was sind die Fortschritte Ihres neuen Unternehmens, das erst einen Monat alt ist?
Xu Huazhe: Im Team gibt es derzeit etwa 20 Personen. Auf der AI - Seite gibt es einige talentierte junge Leute, und auf der Hardware - Seite gibt es viele Ingenieure, die Erfahrungen in der To - C - Massenproduktion und - lieferung haben. Wir sind noch in der Phase der rege Rekrutierung.
Technisch gesehen haben wir in unseren AI - Modellen gute Vorarbeiten in den drei Dimensionen "schnelles Handeln", "starke Generalisierbarkeit" und "hohe Erfolgsrate" gelegt. Wir können die Roboter bei bestimmten komplexen Aufgaben eine nahezu 100 %ige Erfolgsrate erreichen lassen.
Unser erstes 32 - Milliarden - Parameter - Modell hat die erste Runde des Trainings abgeschlossen, aber es braucht noch die Iteration der Datenmenge, um seine besseren Fähigkeiten zu entfalten. Unsere Hardware - Handschuhe haben bereits fünf oder sechs Versionen hinter sich.
Im ersten Monat mussten wir uns mit verschiedenen Dingen wie der Unternehmensregistrierung, der Standortwahl und der Renovierung befassen. Ich finde, dass wir in dieser Zeit recht viel erreicht haben.
Intelligent Emergence: Wie unterscheidet sich Ihre Einstellung bei diesem Start - up von der beim ersten Mal?
Xu Huazhe: Der größte Unterschied liegt in der Einstellung. Ich bin nun sicherer und mutiger. Vor dem ersten Start - up habe ich mich Sorgen gemacht: Wie kann ich anderen Arbeit geben, wenn ich selbst noch nie gearbeitet habe? Was soll ich tun, wenn ich noch nie im Geschäft tätig war und noch nie mit Investoren und der Regierung zusammengearbeitet habe?
In den zwei Jahren bei Xinghaitu habe ich mit diesen Dingen zu tun gehabt. "Wenn man es noch nie gemacht hat, muss man es einfach tun." Tatsächlich hat alles recht glatt geklappt. Zu viele Bedenken sind unnötig. Wichtig ist, dass man sich erstmal traut, loszulegen. Diesmal bin ich psychisch entspannter.
Intelligent Emergence: Was sind die Unterschiede zwischen einem Start - up im Bereich der Haushaltsroboter im Jahr 2023 und 2026?
Xu Huazhe: Die Unterschiede sind beträchtlich. Erstens ist die Hardware - Infrastruktur in China in den letzten drei Jahren besser geworden. Es gibt mehr brauchbare Roboter. Im Jahr 2023 konnte man vielleicht nur Industrieroboterarme verwenden.
Zweitens waren die Daten von Robotern im Jahr 2023 fast null. Jetzt gibt es auf der Internet - Plattform Hunderttausende von Stunden an Open - Source - Daten, und es sind auch viele Datenlieferanten aufgetaucht. Obwohl die Datenqualität und die Anpassung an verschiedene Roboter - Typen noch Probleme darstellen, ist die Datenmenge schon viel größer.
Drittens war es im Jahr 2023 schwierig, Kapital für To - C - Roboter zu beschaffen, und die Investoren gaben weniger Zeit. Heute ist es einfacher, zu starten als 2023.
Die Anwendung von AGI in Haushalten - Fabriken sind das Gebiet der vergangenen Technologie
Intelligent Emergence: Was war der Auslöser für Ihre Idee, To - C - Roboter zu machen?
Xu Huazhe: Zunächst einmal ist die zentrale Frage: Was tun wir eigentlich, wenn wir Roboter bauen? Die Herstellung von Robotern ist seit alters her ein Streben der Menschheit. Wir haben Roboter in Restaurants wie Haidilao, in Hotels und in Fabriken gesehen. Aber wenn wir nur mit humanoide Roboter in Fabriken Schrauben drehen und Kisten transportieren, machen wir im Wesentlichen das, was man in der Vergangenheit schon getan hat.
Der wichtigste Unterschied dieser Generation von Robotern liegt in ihrer Universalität. Die Universalität sollte in ungeordneteren Umgebungen eingesetzt werden, wo allgemeine Fähigkeiten benötigt werden. Die Antwort ist also der Haushalt oder der breitere Dienstleistungssektor. Ich bin der Meinung, dass die universelle AGI (Allgemeine Künstliche Intelligenz) im Haushalt eingesetzt werden sollte.
Zweitens ist es aus persönlicher Präferenz attraktiv, ein markenstarkes Unternehmen zu gründen. Viele große Unternehmen sind To - C - Unternehmen, wie Apple und Xiaomi.
Drittens benötigt die Universalität reichhaltige Daten, und die ungeordneten Haushaltsumgebungen können genau diese Daten liefern. Wenn die Datenquelle falsch ist, kann man kein richtiges Modell entwickeln.
Aufgrund dieser drei Gründe finde ich, dass es richtig ist, To - C - Roboter zu machen, und ich bin persönlich sehr interessiert.
Intelligent Emergence: Wann glauben Sie, dass die AI - Modelle in der Lage sein werden, To - C - Haushaltsroboter zu unterstützen?
Xu Huazhe: Meine Prognose ist eher optimistisch und radikal. Ich glaube, dass innerhalb von zwei Jahren brauchbare Roboter auf den Markt kommen werden. Sie sind nicht allmächtig, aber sie werden ein definiertes Produkt sein und viele allgemeine Aufgaben bewältigen können. Es gibt aber auch einige Dinge, die sie nicht tun werden, wie z. B. ein Baby zu halten oder Wasser zu kochen.
Intelligent Emergence: Welche Aufgaben können Roboter im Haushalt erledigen? Können Sie einige Beispiele geben?
Xu Huazhe: Es gibt zwei Kategorien. Eine Kategorie sind die an sich schwierigen Aufgaben, wie z. B. feinere Reinigungsarbeiten, wie das Entfernen von Schimmelpilz in Ecken, das Wischen von getrocknetem Suppenrest, das Schälen von Orangen und Garnelen usw.
Die andere Kategorie sind langwierige, mehrstufige Aufgabenketten. Nehmen wir als Beispiel den gesamten Waschprozess: Der Roboter legt die dreckige Kleidung in die Waschmaschine, gibt Waschmittel rein, startet die Maschine und kann dann andere Dinge tun. Wenn er den Ton "Wäsche fertig" hört, nimmt er die Kleidung aus der Waschmaschine, legt sie in den Trockner, startet den Trockner und legt die getrocknete Kleidung schließlich gefaltet in den Schrank.
Aktuelle Roboter können einzelne Schritte ausführen, aber kein Roboter kann bisher wie ein Mensch den gesamten Prozess von Anfang bis Ende mit all den "Zwischenschritten" bewältigen. Ich glaube, dass Roboter in zwei Jahren diese Fähigkeit haben werden.
Intelligent Emergence: Was ist der größte Unterschied zwischen Haushalts - und Fabrikumgebungen?
Xu Huazhe: Sowohl Haushalte als auch Fabriken sind in gewisser Weise "ungeordnet", aber es ist ein wesentlicher Unterschied. Die Unordnung in Fabriken liegt eher in