Bei der Schlacht um Embodied AI sind die großen Unternehmen ständig anwesend.
Der Schaum löst sich auf, die Großkonzerne treten ein
Es gibt kaum einen neuen Technologietrend, der so viel Aufmerksamkeit wie die Embodied Intelligence (eingebettete Intelligenz) erregt hat. Die Akteure drängen in die Branche, und die Plattformen für die Entwicklung von "Gehirnen" und "Körpern" erscheinen wie nach einem Schema. Auf den ersten Blick sieht das Ganze sehr aufregend aus, doch dahinter verbirgt sich auch Sorge. Handelt es sich um einen Wettlauf um langfristige Fähigkeiten oder um einen weiteren Konzept-Relaislauf?
Am 4. August interviewte die "China Hi-Tech Industry Guide" mehrere Experten, um die Investitionsmotivation und das Schaumphenomen im Bereich der Embodied Intelligence zu diskutieren.
Li Junlan, Forschungsmanagerin der International Data Corporation (IDC) in China, meint: "Es gibt derzeit tatsächlich einen gewissen strukturellen 'Schaum' im Bereich der Embodied Intelligence. Einige Projekte können möglicherweise hohe Bewertungen erhalten, bevor die Produkte reif sind und die Anwendungen nur begrenzt validiert wurden. Insgesamt befindet sich die Branche jedoch noch in einer Phase der geregelten Expansion, die von Technologieentwicklungen angetrieben wird."
Außerdem haben Lu Jiaqing, Senior-Partner von Guoke Jiahe, und Kang Lidong, Geschäftsführer von VC Capital, in den Interviews ebenfalls darauf hingewiesen, dass es derzeit einen gewissen Schaum in der Embodied Intelligence gibt.
Wenn die Großkonzerne gemeinsam ein Framework aufbauen, die Werkzeugketten vervollständigen, die Datenkreisläufe schließen und die Kooperationsökosysteme aufbauen, erhöhen sie im Wesentlichen die Zugangshürden für die Branche und verringern den Spekulationsraum. Sie schaffen auch bessere Wachstumsbedingungen für die vertikalen Akteure, die tatsächlich Ergebnisse liefern können.
Yuan Foyu, Vizepräsident der Baidu Group, sagte in einem Vortrag am 26. Juli, dass Baidu Smart Cloud basierend auf den gemeinsamen Bedürfnissen der Branche und den Herausforderungen bei der Umsetzung in vier Bereichen arbeitet: dem Embodied Brain (eingebettetes Gehirn), dem Motor Control Cerebellum (Bewegungssteuerungshirn), der Erstellung von Embodied Datasets (eingebetteten Datensätzen) und der Forschung und Entwicklung von Ganzkörperrobotern. Dies soll die Entwicklung von Schlüsseltechnologien und Produkten in der Embodied Intelligence für Unternehmen unterstützen.
Nach zusammengefassten Informationen von Tianyancha hat die Popularität der Embodied Intelligence längst die Bühne der Modelle in Präsentationen verlassen und ist in eine Phase eingetreten, in der es um die Umsetzungskraft, Systemfähigkeit und Organisationsfähigkeit geht. Die Embodied Intelligence - Technologieplattformen, die standardisierbar, plattformfähig und wiederverwendbar sind, sind der Schlüsselhebel, um den Schaum wie das ständige Neuerfinden des Rades und das Treiben nach kurzfristigem Erfolg zu bekämpfen und Kapital und Talente in effektive Innovationen zu lenken.
Wie Li Junlan in ihrer Studie "Embodied Intelligence 'bricht die Kreise' + Der Aufstieg der chinesischen Macht: Der Wettlauf um Roboter tritt in die 'chinesische Zeit'" feststellt, hat China sich zu einer wichtigen Macht auf dem globalen Robotermarkt entwickelt. Es verfügt über die Industriekette, Technologie und Anwendungsgrundlagen, um in die nächste Phase der Embodied Intelligence - Roboter voranzuschreiten, und zeigt insgesamt eine dynamische Entwicklung.
Nach ihrer Ansicht muss ein Unternehmen, um ein führender Anbieter von Embodied Intelligence - Robotern zu werden, nicht unbedingt die neuesten Technologien besitzen. Entscheidend ist es, sich mit den technologischen Trends zu verbinden und erfolgreiche kommerzielle Anwendungen zu realisieren. Nur so kann ein Unternehmen eine nachhaltige Wettbewerbsfähigkeit entwickeln und schließlich zum Branchenführer aufsteigen.
Daraus lässt sich schließen, dass die großen Internetunternehmen wie Baidu, Tencent und Alibaba gemeinsam ihre Aktivitäten auf die Infrastruktur und Kernbereiche der Embodied Intelligence ausweiten. Sie beschränken sich nicht mehr darauf, wer das größte oder schnellste Modell hat, sondern setzen sich für die Differenzierung in der Nutzung und Schließung des Kreislaufs ein.
"Das Gehirn erschaffen" bedeutet ständig anwesend zu sein
Das Wesen des Wettlaufs um die "Entwicklung des Gehirns" besteht nicht darin, dass die Großkonzerne selbst Roboter herstellen, sondern dass sie die wiederverwendbaren und einsetzbaren Grundlagenfähigkeiten, die nach der Reduzierung des Branchenschaums frei werden, an die gesamte Industriekette abgeben.
Nach zusammengefassten Daten von Tianyancha und der IDC - Studie "beschleunigen chinesische Hersteller die Aufbau der kompletten Industriekette für Embodied Intelligence - Roboter. Sie setzen die Technologie zunächst in verschiedenen Branchen um und bringen sie von der Validierung zur Masseneinsatz. Die vielfältigen Akteure schaffen gemeinsam ein offenes Ökosystem, das die Embodied Intelligence - Roboter beschleunigt aus dem Labor in die praktischen Produktions - und Lebensumgebungen zu bringen."
Von der reinen Rechenfähigkeit zur tatsächlichen Handlungsfähigkeit hat sich die Rolle verändert. Der Kernpunkt ist einfach: Man bringt das Large Language Model (LLM) aus der "Wolke" in den Roboter und macht es zu einem "mitnehmbaren Gehirn". Wahrnehmung, Kognition, Entscheidung und Ausführung werden zu einer Kette verbunden, und die virtuelle und reale Welt laufen synchron. Der Roboter kann denken und handeln.
Quelle: IDC
Die IDC prognostiziert, dass das globale Marktvolumen für Roboter bis 2029 über 400 Milliarden US - Dollar betragen wird. Dabei hat der chinesische Markt fast die Hälfte des Anteils und liegt mit einer zusammengesetzten Wachstumsrate von fast 15 % an der Spitze der Welt. China wird somit der Kernmotor für das Wachstum der globalen Roboterindustrie.
Allerdings wird dieser Sprung nicht nur von der Roboterindustrie getrieben, sondern auch von der ganzheitlichen Zusammenarbeit in der Embodied Intelligence. Algorithmen, Daten, Rechenleistung, Hardware und Anwendungsfälle werden gemeinsam vorangetrieben. Erst wenn alle Elemente dieser Kette zusammenwirken, kann die Technologie wirklich auf eine neue Stufe steigen. "Embodied Intelligence - Roboter sind eine wichtige Richtung für die Entwicklung von intelligenten Robotern. Ihre Umsetzung hängt von der Integration mehrerer Schlüsseltechnologien und komplexer Systeme ab, um den vielfältigen und komplexen Anwendungsanforderungen gerecht zu werden", so die IDC - Studie.
Die heutigen Embodied Intelligence - Roboter sind längst nicht mehr das "Morgen" im Labor. Um wirklich universell einsetzbar zu sein, muss ein Roboter nicht nur über Sprachverständnis verfügen, sondern auch direkt vor Ort einsatzbereit sein.
Yuan Foyu hat in seinem Vortrag offenbart, dass Baidu Smart Cloud in den Jahren in den Anwendungsbereichen eine Menge Erfahrungen in der Umsetzung und Replikation von Künstlicher Intelligenz in verschiedenen Branchen wie Bildung, Forschung, Gesundheit, Produktion, Logistik, Energie, Handel und Biowissenschaften gesammelt hat.
Es ist nicht einfach, diese Dinge umzusetzen. Jeder Schritt muss genau geplant werden: wie das System aufgebaut wird, wo die Daten herkommen, wie die Rechenleistung verteilt wird, wie die Simulation läuft, wie der reale Roboter getestet wird und wie die Massenproduktion und Lieferung organisiert wird. Im Grunde genommen geht es um die Fähigkeit, große Projekte zu organisieren.
Nach einer Meldung der "Shanghai Securities News" am 27. Juli haben das Tencent Robotics X Laboratory und das Futian Laboratory am selben Tag die Embodied Intelligence Open Platform Tairos "Titanium Screw" (Titaniumschraube) veröffentlicht. Dies ist die erste chinesische Softwareplattform für die Embodied Intelligence, die auf modulare Weise Large Language Models, Entwicklungswerkzeuge und Datenbanken anbietet und für die Roboterindustrie auf Plug - and - Play - Basis geöffnet wird.
Zhang Zhengyou, Chefwissenschaftler von Tencent, Leiter des Robotics X Laboratory und des Futian Laboratory, sagte, dass die Tairos Embodied Intelligence Platform darauf abzielt, die Softwarefähigkeiten für Roboterhersteller und Anwendungsentwickler zu verbessern, als würde man jedem Roboter ein "Gehirn" geben.
Tatsächlich ist die Embodied Intelligence nicht nur die Bühne für Großkonzerne. Start - ups, Lösungsprovider, Open - Source - Communitys, Forschungsinstitute und Systemintegratoren tragen alle zur Verbesserung der Industriekette bei. Wer die Kette fein abarbeitet und die Lieferung stabilisiert, hat mehr Einfluss.
Natürlich gibt es auch Hürden. Dies ist kein Weg wie bei den leichten Anwendungen und der schnellen Expansion. Es geht um die Integration von verschiedenen Komponenten. Ein Unternehmen muss nicht nur die Rechenleistung und Algorithmen für die Large Language Models bereitstellen, sondern auch die Fähigkeiten in verschiedene Hardwarekomponenten integrieren und in realen Szenarien immer wieder testen, bis die Lösung einsetzbar, praktisch und zuverlässig ist.
Die reale Welt ist das ultimative Prüfungsfeld
Wenn man die Perspektive erweitert, geht es in diesem Wettlauf um die "Entwicklung des Gehirns" nicht darum, dass ein einzelner Roboter ins Rampenlicht tritt, sondern um den Zugang zu den Vorteilen der nächsten Plattform. Nach dem PC kam das Mobile, nach dem Mobile die Cloud, und jetzt ist es an der Zeit für das Betriebssystem, das von der Embodied Intelligence abhängt.
Es ist nicht einfach, Sprache zu verstehen, und es ist noch schwieriger, die reale Welt zu verstehen und damit umzugehen. Am Ende werden es wahrscheinlich nicht diejenigen sein, die am lautesten rufen, sondern diejenigen, die das Gehirn, den Körper und die Anwendungsumgebung miteinander verbinden, die gesamte Kette schließen und langfristig wiederverwendbare und stabile Lösungen anbieten.
Die großen Unternehmen zeigen unterschiedliche Strategien bei der "Entwicklung des Gehirns". Von Baidus VLA - Anpassung bis hin zu Tencents Tairos - Plattform versuchen sie, einen Verbindungspunkt zwischen der Generalisierung von Technologien und der Entwickler - Ökosystem zu finden. Sie setzen nicht auf Einzelprodukte, sondern auf die Integration des gesamten Technologiestapels für das Training, die Validierung, die Inferenz und die Bereitstellung von Modellen, um eine Basis für die gesamte Branche zu schaffen.
Daraus folgt, dass die Cloud Computing nicht nur ein Anbieter von Rechenleistung ist, sondern auch das "Steuerzentrum" für die Modellfähigkeiten. Es entscheidet, wer am schnellsten von der Algorithmenentwicklung zur kommerziellen Umsetzung kommt.
Bei der Forschung und Entwicklung von Embodied Brain - Modellen ist Baidu Smart Cloud als erster Cloud - Anbieter vollständig an die drei wichtigsten Open - Source - Embodied VLA - Modelle RDT, π0 und GR00TN1.5 angepasst, unterstützt durch Baidus Baige GPU Cloud Platform. Dies hilft Unternehmensalgorithmus - Engineern, schnell die VLA - Technologie zu erkunden.
Quelle: Baidu Smart Cloud
Nach einer Mitteilung des Tencent Robotics X Laboratory am 1. August basiert die Tairos - Plattform auf den technologischen Fähigkeiten, die Tencent Robotics X und das Futian Laboratory in den vergangenen Jahren im Bereich der Roboterforschung gesammelt haben. Sie kombiniert weitgehend die Anforderungen der Industrie.
Dabei sind die Planning Large Model (Planungsmodell), das Multimodal Perception Model (mehrmodales Wahrnehmungsmodell) und das Perception Action Joint Large Model (Wahrnehmungs - Aktions - Verbundmodell) enthalten und werden über standardisierte Schnittstellen und Software Development Kits (SDK) angeboten. Dies erleichtert es Entwicklern, kostengünstig auf die Embodied Intelligence - Modelle zuzugreifen.
Darüber hinaus unterstützt die Plattform die Einrichtung einer Simulationsumgebung in der Cloud mit einem Klick, um die Planungs - und Wahrnehmungsmodelle zu validieren. Es sind mehrere Roboter, Szenarien und Aufgaben voreingestellt, damit mehr Entwickler schnell die Modellfähigkeiten testen und verstehen können.
Quelle: Tencent Robotics X Laboratory
Im Vergleich zu den Strategien von Baidu und Tencent, so eine Meldung der "China Fund News" am 11. März, "ist Lingbo Technology eine Tochtergesellschaft von Alibaba, die sich auf den Dienstleistungsbereich konzentriert und branchenführende Roboterprodukte entwickeln will, um Roboter in das tägliche Leben zu bringen und jeder Person zu helfen." Als ein Unternehmen im Alibaba - Konzern könnte Lingbo Technology möglicherweise noch größere Umsetzungskraft entfalten, wenn es die Fähigkeiten des Alibaba Tongyi Large Model integriert.
Der Wettlauf zwischen den Plattformen ist im Wesentlichen ein Wettlauf um die Geschwindigkeit des Kreislaufs, die Fähigkeit zur Szenariotransfer und die Penetration der Entwickler. Dies ist nicht nur ein Kampf um die Werkzeuge der Large Language Models, sondern auch ein Wettlauf darum, wer das nächste Betriebssystem definieren kann.
Letztendlich können die Großkonzerne nach der Reduzierung des Schaums zu den "Top - Akteuren" aufsteigen, nicht weil sie die schönsten Geschichten erzählen, sondern weil sie die Fähigkeit haben, die Technologie zu vertiefen und die Ökosysteme zu erweitern.
Das Wesen dieser Fähigkeit besteht darin, sich nicht zu sehr um die Schnelligkeit zu kümmern, sondern sich auf die Industrie zu konzentrieren und jeden scheinbar unbedeutenden Schritt so zu optimieren, dass er langfristig funktionieren kann.
Abschluss
Die Entwicklung der Embodied Intelligence folgt nicht mehr dem bekannten Muster. Außenstehende können nur die Zunahme der Projekte und die Bewegung von Kapital beobachten, aber die tiefgreifenden Anpassungen bleiben ihnen verborgen.
Wenn sich verschiedene Kräfte hinter den Kulissen bewegen und ständig anpassen, wird die bisherige Wettbewerbsweise neu definiert. Die kommende Entwicklung wird möglicherweise nicht in die Richtung des gegenwärtigen Hypes gehen, sondern auf einem längeren und engeren Weg verlaufen, auf dem die Kräfte, die langfristig Wert schaffen können, durch die Zeit selektiert werden.
Welche Teilnehmer werden bis zum Ende kommen? Welche werden an den kritischen Punkten langsamer werden? Wenn der Lärm vorüber ist, gibt es keine klare Antwort und keinen zwangsl