Gespräch mit Qianxun Intelligence's Gao Yang: Das Unternehmertum von Wissenschaftlern ist nicht sehr "vertrauenswürdig", aber das Gründen eines Unternehmens ist wie ein Spiel.
Künstliche Intelligenz: Intelligentes Entstehen - Kartographie
Beim Unternehmertum im Bereich der Embodied AI sollte man sich an Apple orientieren, nicht an Android.
Text | Qiu Xiaofen
Redaktion | Su Jianxun
Ob auf der gerade beendeten WAIC (World Artificial Intelligence Conference) oder auf der in dieser Woche eröffnenden WRC (World Robot Conference): Wie erkennt man auf einer Messe die echte Stärke eines Roboters?
Gaoyang, Mitbegründer des Unternehmens "Qianxun Intelligence" im Bereich der Embodied AI, gibt folgende Tipps:
Bei einem Roboter, der angeblich Kleidung falten kann, können Sie versuchen, die Kleidung zusammenzurollen und willkürlich auf den Tisch zu werfen und beobachten, ob er weiterhin in der Lage ist, die Aufgabe zu erfüllen. Oder geben Sie ihm noch Hosen und Jacken und sehen Sie, ob er über die Fähigkeit zur Generalisierung über verschiedene Produktkategorien verfügt.
Während des Betriebs eines Roboters können Sie beobachten, ob seine Bewegungen reibungslos und flüssig sind, anstatt stockend. Dies spricht für die Koordination zwischen Gedanken und Bewegungen...
Gaoyang, der uns diese Tipps gibt, ist einer der angesagten Unternehmer im Bereich der Embodied AI. Nach seinem Doktorat an der University of California, Berkeley, kehrte er in China zurück und wurde Assistentprofessor am Institute for Interdisciplinary Information Sciences der Tsinghua University.
Im Jahr 2023 gründete er zusammen mit Han Fengtao, dem ehemaligen CTO von Luoshi Robotics, das Unternehmen Qianxun Intelligence im Bereich der Embodied AI. Han Fengtao verfügt über reiche Hardwareerfahrungen und hat in der Vergangenheit die Massenproduktion und den Vertrieb von Tausenden von Robotern betreut. Gaoyang hingegen hat eine solide Forschungslage in der KI. Die Kombination aus akademischer und industrieller Kompetenz macht Qianxun Intelligence zu einem angesagten Unternehmen in der Welle der Embodied AI.
Innerhalb von 19 Monaten nach der Gründung haben sie insgesamt über eine Milliarde Yuan an Kapital beschafft. Zu den Investoren gehören Huawei Hubble, JD.com, CATL, Shunwei Capital und andere.
Beim Übergang von der "Elfenbeinturm-Welt" der Hochschule in die Geschäftswelt muss Gaoyang auch die Vorurteile gegenüber "Wissenschaftlern als Unternehmern" in Kauf nehmen, aber er scheut sich nicht davor.
"Wissenschaftler als Unternehmer sind in gewisser Weise nicht zuverlässig", meint er. Wissenschaftler verfolgen die Wahrheit und werden von ihrer Leidenschaft angetrieben, während das Unternehmertum auf kommerziellen Erfolg abzielt. "Ich bin mir ständig meiner Grenzen bewusst und versuche, meine Schwächen auszugleichen."
Gaoyang vergleicht das Unternehmertum mit "einem Spiel". Der Austausch mit Investoren und Kunden ist wie das Bewältigen von Herausforderungen im Spiel. Er hat bereits über hundert Investoren getroffen. Anfangs hat er die Technologie so kompliziert erklärt, dass er einige "einschlafen ließ". Aber Gaoyang kann schnell auf Feedback reagieren und anpassen. "Jetzt bin ich beim Umgang mit Investoren viel routinierter. Dies ist ein Wachstumsprozess, den ich gerne mache."
In seinem Büro - auf seinem Computermonitor klebt ein kleiner Kapybara-Sammeltierchen - sprach Gaoyang mit "Intelligentes Entstehen" über seinen Werdegang vom Wissenschaftler zum Unternehmer sowie über seine Ansichten zu den technologischen Pfaden der Embodied AI. Im Folgenden finden Sie die Transkription des Gesprächs (leicht gekürzt):
Sei das Apple, nicht das Android im Bereich der Embodied AI
Intelligentes Entstehen: Im Bereich der Robotik bilden Sie und Herr Han ein gutes Team: Ein Wissenschaftler mit Softwarekompetenz und ein Unternehmer mit reichen Hardwareerfahrungen. Welche Kriterien haben Sie bei der Auswahl Ihres Geschäftspartners berücksichtigt?
Gaoyang: Ich habe lange darüber nachgedacht, wie man Embodied AI-Produkte an Kunden verkaufen kann. Bis heute bin ich zu dem Schluss gekommen, dass man sowohl Hardware als auch Software entwickeln muss. Man sollte das Apple im Bereich der Embodied AI sein, nicht das Android.
Zu Beginn einer Technologiephase ist die Fähigkeit zur Generalisierung über verschiedene Plattformen immer relativ schwach. Es ist daher wichtig, sowohl Hardware als auch Software gut zu entwickeln, wie es in vielen Branchen zu Beginn der Entwicklung der Fall war. Beispielsweise hat IBM zu Beginn der Entwicklung von PCs sowohl Hardware als auch Software entwickelt. Erst nach ein paar Jahrzehnten hat man begonnen, die Entwicklung von Hardware und Software zu trennen.
Ich habe viel Erfahrung in der Softwareentwicklung, aber kaum in der Hardwareentwicklung. Daher denke ich, dass es in den ersten 30 Jahren eines Unternehmens besonders wichtig ist, sowohl in der Hardware- als auch in der Softwareentwicklung stark zu sein.
Andererseits haben viele Menschen, die sich mit Hardware befassen, keine Offenheit für Veränderungen oder sind sich der Veränderungen nicht bewusst. Aber Herr Han hat diese Veränderungen sehr früh erkannt und ist mit mir auf die gleiche Wellenlänge gekommen.
Intelligentes Entstehen: Was haben Sie 2023 erkannt, dass Sie zu der Idee eines Robotik-Unternehmens gebracht hat?
Gaoyang: Hauptsächlich die Veränderung des Lernparadigmas durch ChatGPT. Vor der Entstehung von ChatGPT habe ich selbst nicht an die von OpenAI betriebenen Projekte geglaubt. Viele erfahrene Professoren an der Universität Berkeley haben ebenfalls gedacht, dass es Unsinn sei. Aber als sie GPT-3.5 entwickelt haben, haben wir uns darüber nachgedacht und gemerkt, dass wir uns geirrt haben. Wenn man diesen Gedanken weiterverfolgt, ist die Embodied AI ein unvermeidliches Phänomen, das nur noch Zeit braucht.
Intelligentes Entstehen: Sie haben 2023 entschieden, dass Roboter sowohl Hardware als auch Software integriert haben müssen. Aber es gibt auch führende Robotikunternehmen, die die "Kopfintelligenz" von Robotern immer noch vernachlässigen. Was halten Sie davon?
Gaoyang: Führende Unternehmen haben ihre eigene Logik. Ihre Stärke liegt in der Hardwareentwicklung. Sie können sich gut vom Verkauf an Bildungskunden ernähren und können sogar an die Börse gehen. Ihre beste Lösung besteht darin, zunächst den Bildungsmarkt zu stabilisieren, um ihn nicht an andere zu verlieren, da es viele andere Unternehmen gibt, die versuchen, diesen Markt zu erobern. Nach der Börsengänge können sie langsam andere Dinge tun. Es ist für ein Unternehmen schwierig, viele Dinge gleichzeitig zu tun, insbesondere wenn es auf dem Bildungsmarkt einen heftigen Wettbewerb gibt.
Intelligentes Entstehen: Wenn ich eine nicht-humanoid gestaltete Hardware entwickle, also eine neue Form eines Roboters, gibt es dann Raum für Unternehmen, die sich nur auf die Entwicklung der Hardware konzentrieren?
Gaoyang: Das Design der Hardware ist eng mit den Anforderungen der KI verbunden. Ich gebe Ihnen ein Beispiel: Wenn ich einen Roboterentwurf habe und die inverse Kinematik fehlschlägt, wenn er seinen Arm ausstreckt, kann er nicht das Objekt auf dem Tisch greifen. Solche Probleme sind sehr häufig. Wenn man die Hardware und die KI nicht zusammen entwickelt, wird man diese Probleme nicht erkennen.
Intelligentes Entstehen: Aus Sicht der Branche hat der Markt nicht genug Platz für ein zweites solches Unternehmen?
Gaoyang: Ich denke, es ist schwierig, dass der Markt Platz für ein zweites solches Unternehmen hat.
Der Übergang vom Wissenschaftler zum Manager ist wie ein "Spiel"
Intelligentes Entstehen: Als Herr Wu Yi Sie von Berkeley nach China zurückholte, hatten Sie bereits vor, ein Unternehmen zu gründen. Ich erinnere mich, dass Sie einmal gesagt haben, dass Sie der Meinung waren, dass die Rückkehr nach China für die Forschung eine größere Herausforderung sei?
Gaoyang: Damals wollte ich in China forschen. Damals gab es noch keine solche technologische Wende. Eine andere Option hätte für mich in den USA als Forschungsingenieur in einem großen Unternehmen gearbeitet zu werden. Aber dieser Weg wäre vorgegeben gewesen, und man hätte nur die ihm zugewiesenen Aufgaben erledigen müssen.
Als Professor muss man dagegen ein Labor von Grund auf aufbauen, wenn es am Anfang noch nichts gibt und keine Mitarbeiter. Es ist eine Herausforderung, etwas aus dem Nichts zu erschaffen. Ich habe also ungefähr ab der zweiten Jahreshälfte 2023 damit begonnen, ein Unternehmen zu gründen, was ungefähr drei Jahre nach meiner Rückkehr in China war.
Intelligentes Entstehen: Ich habe den Eindruck, dass Sie nicht nur aus wissenschaftlicher Sicht über die Dinge nachdenken, sondern auch aus geschäftlicher Perspektive.
Gaoyang: Ich interessiere mich sehr dafür, wie man Technologie so entwickelt, dass jeder sie nutzen kann. Deshalb habe ich begonnen, über die geschäftlichen Aspekte nachzudenken, wie man Roboter gut entwickeln kann. Daraus habe ich geschlossen, dass man sowohl Hardware als auch Software entwickeln muss und habe dann überlegt, mit wem ich zusammenarbeiten soll.
Intelligentes Entstehen: Warum halten Sie Management für eine Technologie? Technologie ist eher streng und rational, während Management auch einen gewissen emotionalen Anteil hat.
Gaoyang: Management ist streng genommen keine Technologie im herkömmlichen Sinne. Es liegt eher zwischen Technologie und Kunst. Es gibt Regeln und Muster, aber es erfordert auch Flexibilität und die Fähigkeit, auf Veränderungen zu reagieren.
Intelligentes Entstehen: Sie haben erwähnt, dass Wissenschaftler als Unternehmer nicht besonders zuverlässig seien. Wie haben Sie dann in der Praxis diese zusätzlichen Fähigkeiten erworben?
Gaoyang: Ich erkläre zunächst, warum ich das denke. Wissenschaftler verfolgen die Wahrheit und werden von ihrer Leidenschaft angetrieben. Beim Unternehmertum ist das wichtigste Ziel, ein Produkt zu entwickeln. Oft geht es nicht um die Wahrheit, sondern darum, die Kunden gut zu bedienen. Verschiedene Kunden haben unterschiedliche Anforderungen und Kriterien.
Um dieses Ziel zu erreichen, muss man ein Unternehmen gründen und aufbauen. Dies erfordert auch spezielle Fähigkeiten, wie das Aufbauen eines Teams und das Fördern des Wachstums des Unternehmens.
Ich kann nicht sagen, dass ich sicher erfolgreich sein werde. Ich bin mir ständig meiner Grenzen bewusst und versuche, meine Schwächen auszugleichen.
Intelligentes Entstehen: Wie haben Sie persönlich den Übergang vom Wissenschaftler zum Unternehmer geschafft?
Gaoyang: Ich bin mir meiner Grenzen bewusst und habe mich geöffnet, um das Unternehmertum zu lernen. Ich lasse mich von kommerziellem Erfolg ansprechen, nicht nur von der Erforschung der Wahrheit.
Intelligentes Entstehen: Genießen Sie diesen Prozess?
Gaoyang: Ich denke, ich genieße ihn. Es ist ein interessantes Spiel, aus dem man viel lernen kann. Beispielsweise habe ich am Anfang den Investoren die Fakten so genau wie möglich erklärt, aber sie waren gelangweilt. Dann habe ich gemerkt, dass ich es auf eine anschaulichere und lebendigere Weise erklären muss.
Intelligentes Entstehen: Genießen Sie auch diesen Lernprozess?
Gaoyang: Dies ist ein notwendiger Teil der Realität. Wenn ich mein Ziel erreichen will, muss ich diesen Prozess durchlaufen.
Intelligentes Entstehen: Wie viele Investoren haben Sie getroffen? Haben Sie das gezählt?
Gaoyang: Nein, ich habe es nicht gezählt. Vielleicht sind es ein oder zwei hundert. Und ich muss jedem von ihnen die Unternehmensidee erklären.
Intelligentes Entstehen: Wie passen Sie Ihren Umgang mit Investoren ständig an?
Gaoyang: Feedback ist sehr wichtig. Ohne Feedback weiß man nicht, was man besser machen kann. Jetzt bin ich beim Umgang mit Investoren viel routinierter. Dies ist ein Wachstumsprozess, den ich gerne mache.
Intelligentes Entstehen: Halten Sie dies für eine große Herausforderung?
Gaoyang: Ich denke, es ist nicht so schwierig. Es ist wie jede andere Technologie, nur eine besondere Art von Technologie.
Das Geheimnis zur Beurteilung der Qualität von VLA: Selber erleben
Intelligentes Entstehen: Im Moment ist es allgemein anerkannt, dass man Transformer für das Pre-Training verwendet. Aber weiß man nicht, ob es später in der industriellen Umsetzung deutliche Unterschiede in der Leistung geben wird?
Gaoyang: Ich denke, Sie können auf der WRC vor Ort vorbeischauen. Vielleicht gibt es viele Theorien, aber am Ende muss man es selber erleben. Beispielsweise können Sie mit dem Roboter interagieren. Würfeln Sie die Kleidung zusammen und werfen Sie sie ihm zu und sehen Sie, ob er sie wieder falten kann.
Intelligentes Entstehen: Dies kann uns als Anleitung beim Besuch einer Robotermesse dienen.
Gaoyang: Da ein Roboter ein sehr komplexes System ist, ist es schwierig, zu entscheiden, welcher Roboter besser ist. Ich denke, die beste Methode ist, es selber zu erleben und zu sehen, was die Modelle der verschiedenen Unternehmen können.
Intelligentes Entstehen: In diesem Jahr wird viel über VLA gesprochen. Wie beurteilt man die Qualität der VLA-Systeme verschiedener Unternehmen?
Gaoyang: Ein Aspekt ist der Algorithmus. Einige VLA-Systeme können Aufgaben nicht aufteilen. Das VLA-System von Qianxun hat ein Zwei-System (schnell und langsam), das die Bewegungen des Roboters reibungslos macht. Robotern ohne ein solches System haben eher stockende und unnatürliche Bewegungen.
Ein weiterer Aspekt ist die Daten. Große Modelle benötigen viele Daten für das Training. Unser eigenes Modell nutzt menschliche Videodaten aus dem Internet für das Pre-Training. Einige VLA-Systeme können nicht mit menschlichen Videodaten pre-trainen, was ihre Leistung beeinträchtigt.
Technisch gesehen hängt die Leistung von diesen beiden Faktoren ab: Die Eigenschaften des Algorithmus und die Art der Trainingsdaten, sowie die Datenaufbereitung und -mischung. All dies beeinflusst die Leistung.
Aus Sicht des Betrachters hängt es davon ab, wie komplexe Aufgaben der Roboter erledigen kann. Einige Modelle können nur einfache Aufgaben wie "greifen und platzieren" erledigen. Das Modell von Qianxun kann jedoch komplexe Aufgaben wie das Falten von Kleidung erledigen und kann auch mit Störungen umgehen.
Intelligentes Entstehen: Ist das VLA-Modell Spirit v1 von Qianxun auf Ihren beiden früheren Forschungen (ViLa und CoPa) basierend?
Gaoyang: Nein, es basiert nicht nur auf diesen beiden Forschungen, sondern auf vielen Studien. Auch das One Two VLA ist in unserem Modell industriell umgesetzt.
Intelligentes Entstehen: Was unterscheidet Ihr One Two VLA von anderen VLA-Systemen?
Gaoyang: Wenn Sie dem Roboter eine etwas komplexere Aufgabe