Humanoidroboter rennen eifrig auf den IPO zu.
In den letzten 30 Tagen hat sich das Kapitalmarktpanorama rasant verändert. Milliarden Yuan sind in die Branche der Embodied AI geflossen.
Yushu Technology hat am 18. Juli die Börsengangsvorbereitung offiziell begonnen und sich auf den Sprint zum IPO gemacht. Es sind erst zwei Monate seit der Kapitalstrukturumwandlung vergangen. Vor einem Monat, am 19. Juni, hat Yushu Technology die strategische Finanzierung der Runde C+ abgeschlossen. Laut Schätzungen von ITjuzi hat der Unternehmenswert von Yushu nach dieser Runde auf 13 Milliarden Yuan gestiegen.
ZhiYuan Robotics, ein Mitstreiter in der ersten Liga, hat am 8. Juli eine Bombe geworfen, indem es mindestens 2,1 Milliarden Yuan in die Übernahme von 63,62 % der Anteile von Shangwei New Materials, einem Unternehmen an der STAR Market, investiert hat. Obwohl ZhiYuan Robotics behauptet, dass diese Übernahme keine Reorganisation und Börsengang von Geschäftsaktivitäten und wichtigen Vermögenswerten beinhaltet, scheint es etwas wie das Verstopfen der Ohren beim Diebstahl des Glockenturms zu sein, wenn man behauptet, dass es hinter der Übernahme eines Unternehmens, das mit der Robotikbranche nichts zu tun hat, keine anderen Absichten gäbe. Wang Chao, Gründer von Lanqiao Capital, hat in einem Gespräch mit LatePost diese Aktion von ZhiYuan Robotics als "ähnlich einem Backdoor-Listing" bezeichnet, was die Ambitiose der Firma, sich näher an den Kapitalmarkt zu bringen, offensichtlich macht.
Das IPO-Rennen zwischen diesen beiden führenden Unternehmen zeigt die klare Absicht der Behörden, die Branche der humanoiden Roboter zu fördern. Die Öffnung der Schleusen hat auch die primären und sekundären Märkte in Bewegung gesetzt.
In den letzten Tagen hat Hangzhou Deep Robotics, eines der "Sechs Drachen von Hangzhou", eine neue Runde Finanzierung in Höhe von fast 500 Millionen Yuan abgeschlossen. Tash Robotics hat eine Angel+-Runde Finanzierung in Höhe von 122 Millionen US-Dollar mit der Beteiligung von Meituan abgeschlossen.
Es ist bemerkenswert, dass dies nicht die erste Beteiligung von Meituan an der Embodied AI-Branche ist. Laut unvollständigen Statistiken steht Meituan hinter vielen Embodied AI-Unternehmen wie Yushu, ZhiYuan, sowie XingHaiTu und ZiBianLiang Robotics, die später erwähnt werden. Man kann sagen, dass Meituan die Hälfte der Embodied AI-Branche stützt.
JD möchte die andere Hälfte übernehmen.
Am 21. Juli haben drei Robotikunternehmen, Zhongqing Robotics, Qianxun Intelligence und Zhujidongli, gleichzeitig eine neue Runde Finanzierung mit der Leitung von JD angekündigt. Die Finanzierungsbeträge der ersten beiden Unternehmen betragen jeweils fast 1 Milliarde Yuan und fast 600 Millionen Yuan. JD scheint sich mit Meituan anlegen zu wollen, und die Frontlinie zwischen den beiden Unternehmen hat sich von der "Lieferdienst-Krieg" auf die Embodied AI-Branche ausgeweitet.
Beijing Xiaoyu Zhizao hat eine Finanzierung in Milliardenhöhe in der Runde A+ mit der Leitung von Didi abgeschlossen. Dies ist Didis erste Investition in den Bereich der Embodied AI.
Darüber hinaus hat Xingdong Jiyuan, ein Embodied AI-Unternehmen aus der Tsinghua-Gruppe, eine Finanzierung in Höhe von fast 500 Millionen Yuan in der Runde A abgeschlossen. Geek+ Technology, das sich auf Lagerroboter und intelligente Logistik spezialisiert, ist an der Hauptbörse in Hongkong notiert und hat sich als "Erstes Unternehmen weltweit im Bereich der AMR-Lagerroboter" etabliert. XingHaiTu hat nacheinander strategische Finanzierungen in den Runden A4 und A5 abgeschlossen, wobei die Gesamtfinanzierung beider Runden über 100 Millionen US-Dollar beträgt. Auch viele andere Unternehmen wie Tuspeed Technology und Kuawei Intelligence haben in letzter Zeit Finanzierungen abgeschlossen. Wang Qian, Gründer und CEO von ZiBianLiang Robotics, hat offen zugegeben: "Wir haben im ersten Halbjahr drei Runden Finanzierung durchgeführt."
Die Vielzahl an Finanzierungen in den letzten 30 Tagen ist verblüffend und zeigt die Erwartungen des Kapitalmarktes an die zukünftige Branche der Embodied AI. Viele Unternehmen haben sich in diesen blauen Ozean gestürzt, um frühzeitig eine Strategie zu entwickeln. Aber selbst mit einer solchen Finanzierungsmenge ist die Geschwindigkeit und der Umfang nach Ansicht von Wang Qian noch nicht ausreichend. In einem Interview mit Jiemian hat er gesagt: "Embodied AI ist ein großer Wettlauf, in dem China auf Augenhöhe mit den USA starten kann. Im Vergleich zu amerikanischen Unternehmen gibt es jedoch eine Größenordnung an Unterschieden sowohl im Finanzierungsumfang als auch im Unternehmenswert von chinesischen Unternehmen."
Aber die Euphorie hat begonnen, und das ist ein guter Start.
01 Woher kommt das Vertrauen?
Embodied AI und Roboter sind keine neuen Phänomene. 1950 hat Turing in seiner Dissertation zwei Entwicklungspfade für Künstliche Intelligenz vorgeschlagen: Der eine ist die abstrakte Intelligenz, die auf Algorithmen und symbolischer Inferenz beruht; der andere ist die embodied Interaktion, bei der Maschinen mit Sensoren ausgestattet werden, um Fähigkeiten durch sensorische Erfahrungen und Interaktion mit der Umwelt zu erlernen.
Dennoch wird Embodied AI erst jetzt so häufig erwähnt, und viele Start-ups haben sich mutig in die Produktion von Robotern gewagt und erfolgreich die Aufmerksamkeit von Kapitalgebern erregt. Die Frage ist also: Warum hat eine Branche, die bisher wenig Beachtung fand, nach der PC- und Mobiltelefonära plötzlich so stark aufgeholt?
Dabei sind zwei Schlüsselparadigmenwechsel involviert.
Der erste Paradigmenwechsel betrifft die Roboter selbst. Es ist die Umstellung von der hydraulischen Antriebstechnik auf die elektrische Antriebstechnik.
Wang Xingxing, Gründer von Yushu, hat gesagt, dass er schon vor 2013 erkannte, dass die hydraulische Lösung nicht kommerziell tragfähig sei. Der Grund ist einfach: Es handelt sich um präzise mechanische Bauteile, und sobald es um solche geht, bleiben die Kosten hoch. Darüber hinaus lecken alle hydraulischen Systeme Öl, und selbst in Pkw werden hydraulische Systeme kaum noch eingesetzt.
Die alten Giganten, die sich Jahrzehnte lang auf die hydraulische Technologie spezialisiert hatten, haben nur geringe Fortschritte erzielt. 2018 hat Japan die Weiterentwicklung des Roboters ASIMO eingestellt, was die globale Branche der humanoiden Roboter in eine Phase des Abschwungs gestürzt hat. Es war erst Elon Musk, der die elektrische Antriebstechnik etablierte und damit einen entscheidenden technologischen Wendepunkt für die globale Robotikbranche markierte.
Die elektrische Antriebstechnik hat eine massive Reduzierung der Bauteile ermöglicht, was zu Skaleneffekten führt. Diejenigen, die sich auf die falsche Technologie festgelegt hatten, auch wenn sie ein halbes Jahrhundert lang an technologischen Barrieren gearbeitet hatten, wurden plötzlich von neuen Kleinunternehmen überholt. Boston Dynamics verkauft heute nur ein Zehntel so viele Roboter wie Yushu und könnte langsam aus dem Markt verschwinden.
Deshalb öffnet die elektrische Antriebstechnik für chinesische Unternehmen, von Start-ups bis hin zu Giganten der intelligenten Haushaltsgeräte, Automobilherstellern und Internetkonzernen, eine Chance, aufzuholen. Alle Akteure stehen auf gleicher Stufe.
Dies ist auch der Mangel an der reifen Industriekette der Elektromobilität zu verdanken. Die Motoren werden kleiner, die Drehmomente größer, und die Energiedichte der Batterien steigt stetig. Die Übertragung dieser Technologien auf die Robotikbranche kann die Bewegungsfähigkeit und die Laufzeit der Roboter verbessern. Wie ein Schneeball sammelt sich die Leistung Bauteil für Bauteil, und man nähert sich Schritt für Schritt dem Wendepunkt der Branche.
Der zweite Paradigmenwechsel betrifft das "Gehirn" der Roboter. Dies ist die Veränderung, die durch die Technologie der Large Language Models (LLMs) gebracht wurde.
Wu Changzheng, Präsident von Magic Atom, hat gesagt, dass die Jahre 2023 und 2024 für die Branche ein Sprung waren. Das Erscheinen von ChatGPT 3.5 war von entscheidender Bedeutung. Die Entwicklung der LLM-Technologie hat eine neue Paradigma für die Verbesserung der Intelligenz von Robotern gebracht. Die generative KI hat eine tausend- bis millionenfache Leistungssteigerung gezeigt, und wir haben erkannt, dass das Zusammenspiel von LLM und Robotern unendliche Potenziale in der Embodied AI birgt. In Bezug auf die Umweltwahrnehmung, das Verständnis, die Inferenz, die Entscheidungsfindung und die Aufgabenplanung werden neue Paradigmen entstehen. Unter dieser neuen Paradigma wird die Leistung der Roboter tausend- bis millionenfach steigen.
Das Erscheinen der LLM hat das Bild des traditionellen Roboters als "Fernsteuerungsspielzeug" umgeworfen. Die Fähigkeiten der LLM, komplexe Szenarien zu verstehen und lange Sequenzen von Aufgaben zu planen, waren bisher bei Robotern nicht vorhanden. Bisher wurden die Aufgabensequenzen von Robotern manuell programmiert, aber die LLM können durch kontinuierliches Training und Lernen die Umgebung verstehen und in der Lage sein, auf Basis der Umgebung und der Zielaufgabe eigenständig Aufgaben zu planen, als hätten die Roboter ein eigenes Gehirn.
Natürlich bedeutet dies nicht, dass man einfach die bestehenden LLM in die Roboter einbauen kann. Die LLM interagieren über Sprache, die als Medium für die Mensch-Maschine-Interaktion dienen kann, aber nicht als die Intelligenz der Roboter angesehen werden kann. Wang He, Gründer und CTO von Galaxy General, hat gesagt: "Das Wesen der Intelligenz ist die Fähigkeit, auf eine Situation angemessen zu reagieren". Für Roboter ist es von entscheidender Bedeutung, über das Sehen, Hören und Fühlen mit der Umgebung zu interagieren und die Fähigkeit zu haben, die aktuelle Umgebung zu verstehen und Handlungen zu unternehmen.
Deshalb hat sich die Verwendung von Embodied Large Language Models für Roboter als Branchenkonsens etabliert. Obwohl es noch technologische Herausforderungen zu meistern gibt, ist die Richtung klar, und der Weg ist geöffnet. Man wartet jetzt nur auf den GPT-4-Moment für die Roboterbranche.
Aber der Weg dorthin ist noch lang und holprig.
02 Die Hindernisse sind noch da
Zurzeit ist die Embodied AI noch weit von ihrem idealen Zustand entfernt. Derzeit ist der Markt für Embodied AI wie der Markt für Elektromobile in den 2010er Jahren, in der Anfangsphase eines wilden Wachstums, die Technologie ist noch nicht reif, und es ist noch weit bis zur kommerziellen Umsetzung.
Die Geschichte, die die Embodied AI erzählen möchte, steht im Widerspruch zur gegenwärtigen Realität.
Zunächst erfordert das Training von Embodied AI eine riesige Menge an Interaktionsdaten. Xie Junyuan, Leiter des Embodied AI-Projekts von Qianxun Intelligence, hat gesagt: "Die Daten sind derzeit das größte Problem. Viele Probleme lösen sich von alleine, wenn die Datenmenge steigt."
Derzeit werden die Daten hauptsächlich aus zwei Quellen gewonnen: Echten Daten und Simulationsdaten. Echte Daten werden durch die praktische Anwendung von Robotern gewonnen, um die Rückmeldung des Roboters bei der Interaktion mit der realen physischen Welt zu erhalten, hauptsächlich durch Fernsteuerung und Bewegungsaufzeichnung. Simulationsdaten werden durch die Rendering einer virtuellen Umgebung erzeugt, um die Interaktion des Roboters mit Objekten zu simulieren und Trainingsdaten zu generieren.
Da es sich um die Interaktion mit realen Maschinen handelt, haben die echten Daten die höchste Qualität, aber ihre Nachteile sind offensichtlich: Die Datenerhebung ist arbeitsintensiv und kostspielig. Tongji Zihaoxiong, Ökosystem-Partner von Gaoqing Electromechanical, hat erwähnt: "Ich habe mit einem Master-Slave-Manipulator versucht, einem Roboter zu beibringen, Krebs zu fangen. Nach hundert Wiederholungen war meine Hand schon sehr müde." Wang He hat auch darauf hingewiesen, dass die Kosten für die Fernsteuerung von Menschen zur Datenerhebung sehr hoch sind: "Die monatlichen Kosten für die Datenerhebung von zehntausenden von Robotern liegen zwischen hunderten von Millionen und einer Milliarde Yuan."
Simulationsdaten können tausende Male trainiert werden, aber es gibt eine Kluft zwischen der virtuellen Welt und der realen Welt. Die physikalischen Gesetze und die Wahrnehmung der Roboter in der Simulationsumgebung weichen von der realen Welt ab, und die Daten, die aus der Simulation gewonnen werden, können in der Realität wirkungslos sein. Zihaoxiong hat gesagt: "Derzeit ist das vorherrschende Verfahren die gemischte Datenerhebung aus Simulation und einer geringen Menge an realen Daten. Aber die Reduzierung der 'Simulations-Realitäts-Kluft' bleibt das Kernproblem."
Die mangelnde Generalisierbarkeit bedeutet eine niedrige Erfolgsrate bei den Aufgaben. Zusammen mit den hohen Preisen macht es es schwierig, dass humanoide Roboter in absehbarer Zeit in die Haushalte kommen und zu Konsumgütern werden.
Gao Yang, Mitbegründer von Qianxun Intelligence, hat in einem Gespräch mit LatePost die Phasen der Embodied AI in L0 - L5 eingeteilt: L0 sind industrielle Roboter ohne Intelligenz; L1 ist die Intelligenz für eine einzelne Aufgabe; L2 ist die Intelligenz für mehrere Aufgaben in einem einzigen Szenario; L3 ist die Fähigkeit, 70 - 80 % der menschlichen Aufgaben in einem einzigen Szenario zu erfüllen; L4 ist die Fähigkeit, alle Aufgaben in einem einzigen Szenario zu erfüllen; L5 ist die allumfassende Fähigkeit in verschiedenen Szenarien. "Die gesamte Branche befindet sich derzeit auf dem Weg von L1 nach L2." Es wird noch lange dauern, bis die Unternehmen für humanoide Roboter den Verbrauchermarkt erobern können.
Gao Yang hat gesagt: "Die größte Herausforderung bei der Steigerung von L2 zu L3 ist die Generalisierbarkeit. Es ist schwierig, alle Aufgaben zu erfassen, also braucht man Generalisierbarkeit, damit die Roboter sich auf neue Situationen einstellen können." Generalisierbarkeit bedeutet, dass ein intelligentes System in der realen, offenen und sich ständig ändernden physischen Welt