Rasantes Grenzüberschreiten: Die heimlichen Pläne der Internetriesen für Embodied Intelligence
Heute stehen die großen Tech-Unternehmen an einer Weggabelung: Sollten sie weiterhin an intelligenteren Softwarelösungen arbeiten oder sich nun mit Materialien, Mechanik, Lieferketten und Fabriken auseinandersetzen? Sollten sie weiterhin als Ökosystem-Enabler agieren oder werden zu wirklichen Branchenformern? Das Erste ist vernünftig, das Zweite schwierig, aber letzteres birgt vielleicht die Vorstellungskraft, um die nächsten zehn Jahre neu zu gestalten.
Die kommerzielle Rationalität der Internetriesen drängt die Attraktivität des Embodied Computing-Sektors in den Hintergrund.
Ob im Bereich des Metaversums, bei großen Modellen oder kurzzeitig beliebten Bildungsgeräten und VR - in den letzten Jahren gab es in den beliebten Tech-Sektoren kaum einen Bereich, in dem man die großen Internetunternehmen nicht sah. Die Unternehmen mit großen Bargeldreserven gehen bei neuen Möglichkeiten immer aggressiv vor und setzen alles daran.
Bei dem bisher noch nie so heiß diskutierten Bereich des Embodied Computing ist jedoch ein unerwartetes Schauspiel gespielt worden. Die großen Internetunternehmen tauchen in einer sehr subtilen Rolle auf. Sie sind zwar nicht abwesend, aber auch nicht wirklich aktiv beteiligt.
Mit anderen Worten, sie haben es nie wirklich gewagt, die Schwelle des "ganzheitlichen Einsatzes" zu überschreiten.
Dies ist ein typisches "Randgebietseingreifen". Sie entwickeln große Modelle, bauen Plattformen und tätigen Risikokapitalinvestitionen, aber nur wenige sind bereit, sich in Fabriken zu begeben und an der Hardware von Humanoiden zu arbeiten. Diese Tendenz hin zu "weicher" Technologie ist ein Merkmal der Internet-Genealogie der großen Unternehmen und zeigt auch ihre rationale Geschäftlogik. Wenn ihre Kernaktivitäten relativ stabil sind, ist es für sie sinnlos und uninteressant, Ressourcen in ein unbekanntes und begrenztes Hardwaregebiet zu investieren, dessen Ende man nicht absehen kann.
Zweifellos ist für die großen Unternehmen der Außenangriff die kostengünstigste Art, Fehler auszumachen, da man mit minimalem Einsatz möglicherweise hohe Gewinne erzielen kann.
Aber Embodied Computing ist ein Bereich, in dem Software und Hardware stark miteinander verzahnt sind. Die Anwendung von Embodied Modellen hängt von der Hardwareanpassung und dem daraus resultierenden Datendrehrad ab. Es ist kein Geschäftskonzept, das einfach mit einem großen Modell und einer Vermittlungsplattform funktioniert. In einem Bereich, der so sehr an Vorstellungskraft und Leidenschaft bedarf, bleiben die Internetriesen zu konservativ.
Ob es sich um Konservatismus oder um ein abwartendes Vorgehen handelt, lässt sich noch nicht sagen. Aber ich mag es lieber, wenn sie wild und freiherzig agieren.
Die Fähigkeitsgrenzen und Interessenabwägungen der großen Unternehmen
Die großen Internetunternehmen bleiben immer etwas distanziert. Ihre Strategien im Bereich des Embodied Computing haben eine deutliche Gemeinsamkeit: Sie konzentrieren sich auf Software und Plattformen und vermeiden einen großen Einsatz in die Hardware (es gab ja schon viele Misserfolge).
Tencent hat die offene Plattform Tairos für Embodied Computing vorgestellt und betont, dass es "als Partner aller Robotermanufacturer agieren möchte, anstatt die Hardwareproduktion zu übernehmen". Alibaba hat seine Investitionen im Bereich des Embodied Computing hauptsächlich auf Softwareebenen wie Robotersimulationstraining, multimodale Wahrnehmung und allgemeine Robotergehirne konzentriert. JD.com hat zwar mehrere Robotermanufacturer investiert, hat aber seine eigene Marke JoyInside für Embodied Computing entwickelt, die sich auf die Bereitstellung von Interaktionslösungen für Roboter konzentriert. ByteDance hat das GR-Serien Maschinenmodell entwickelt, aber seine Hardwarefähigkeiten durch Investitionen ergänzt. (Allerdings macht Ant Group tatsächlich Hardware.)
Bildquelle: Tencent
Die vorsichtige Haltung der Internetriesen ist im Wesentlichen das Ergebnis der Kombination von technologischen Fähigkeiten und kommerzieller Rationalität.
Einerseits sind die großen Internetunternehmen aufgrund ihrer Genealogie besser in der "Softwareseite" versiert. Ihre Kernkompetenzen liegen in Algorithmen, verteilten Systemen, Modelltrainingsframeworks und Datenbetriebssystemen. Diese Fähigkeiten sind in der Ära der großen Modelle von großer Bedeutung und machen sie natürlicherweise zu "Enablern" anstatt zu "Herstellern".
Nehmen wir ByteDance als Beispiel. Letztes Jahr hat ByteDance offiziell sein zweites Generation Maschinenmodell GR - 2 veröffentlicht. In diesem Jahr beschleunigt das Cloud - und Künstliche - Intelligenz - Plattform Volcano Engine der ByteDance die Forschung und Entwicklung im Bereich des "Embodied Computing" und von Humanoiden. Es hat jetzt stillschweigend Stellen mit einem Jahresgehalt von einer Million Yuan ausgeschrieben und sucht erfahrene Experten für Humanoid - Roboter. Der monatliche Gehalt beträgt bis zu 120.000 Yuan. Diese Stelle erfordert die Leitung der Forschung und Entwicklung von Betriebsalgorithmen für Humanoid - Roboter, einschließlich der Design von Algorithmusarchitekturen, Greifalgorithmen und der Forschung und Entwicklung von VLA - Modellen.
Derzeit hat ByteDance bereits einige Erfolge im Bereich des Embodied Computing erzielt: Im Juli dieses Jahres hat es das allgemeine Robotermodell GR - 3 vorgestellt, das lange Aufgaben abwickeln und feine Manipulationen durchführen kann. Im September hat es das "Robotergehirn" Robix veröffentlicht, das Fähigkeiten in der Inferenz, Aufgabenplanung und Mensch - Maschine - Interaktion integriert. Die ByteDexter feine Hand kann 20 Freiheitsgrade von feinen Bewegungen bei ferngesteuerten Operationen realisieren.
Andererseits kommt die Rationalität von den hohen Kosten und Unsicherheiten bei der Hardwareinvestition. Die Herstellung von Roboterkörpern erfordert die Konstruktion von mechanischen Strukturen, Motoren, Sensoren, die Entwicklung und das Testen von Ganztieren sowie die Integration der Lieferkette. Dies erfordert einen großen Kapitalaufwand und eine langfristige technologische Akkumulation. Die Internetriesen haben wenig Erfahrung im Hardwarebereich und müssen mit hohen Fehlertestkosten rechnen. Diese Logik zeigt sich auch bei der Automobilproduktion der Internetriesen. JD.com und Huawei sind stark in die Automobilbranche involviert, aber haben dennoch nicht beschlossen, eine eigene Werkstatt zu eröffnen.
Im Gegensatz dazu "begeben" sich Automobilhersteller und Hardwarehersteller direkt in den Bereich. Xiaomi hat das Projekt CyberOne frühzeitig ins Leben gerufen. Die Guangqi Group hat festgelegt, dass sie ab 2027 die Massenproduktion von Embodied Computing - Robotern starten wird. XPeng Motors hat kürzlich mit seinem sogenannten "am meisten menschenähnlichen" Humanoiden IRON eine breite Diskussion ausgelöst. Wenn man sich die schlanke Gestalt von IRON ansieht, erkennt man die wiederholte Optimierung des Ingenieursdesigns und die Innovation in der Gelenkmotortechnologie, die es möglich machen, dass seine Konstruktion so kompakt ist. Die Fertigungsindustrie - Genetik fehlt den großen Internetunternehmen.
Die in den letzten zwanzig Jahren akkumulierten "Softwarefähigkeiten" der großen Internetunternehmen bilden zwar einen Vorteil für den Eintritt in den Bereich des Embodied Computing, aber auch eine Pfadabhängigkeit, die kurzfristig schwer zu überwinden ist. Aber im Weiteren betrachtet ist das "Wissensdefizit" im Hardwarebereich nicht der einzige Faktor, der den Eintritt behindert. Die großen Internetunternehmen haben sich bereits eine "klare Rechnung" gemacht.
Das aktuelle Stadium der Embodied Computing - Branche bestimmt, dass das "Randgebietseingreifen" der großen Unternehmen eine rationale Interessenwahl ist.
Nehmen wir Humanoid - Roboter als Beispiel. In Bezug auf den Marktumfang zeigt eine Forschungsstudie, dass der Gesamtumfang der chinesischen Humanoid - Roboter - Branche im Jahr 2024 etwa 2,76 Milliarden Yuan betrug. Laut einem kürzlich von KPMG veröffentlichten Bericht belief sich der weltweite Marktumfang der Humanoid - Roboter im Jahr 2024 nur auf 2,03 Milliarden US - Dollar. Obwohl der Bericht weiter prognostiziert, dass der Marktumfang bis 2029 auf 13,25 Milliarden US - Dollar steigen wird, was einer durchschnittlichen jährlichen Wachstumsrate von etwa 45,5 % entspricht. Im Gegensatz dazu haben die großen Internetunternehmen bereits einen Jahresumsatz im Bereich von hunderten von Milliarden erreicht. Mit anderen Worten, das Embodied Computing ist noch kein "neuer Wachstumskurve", der den Umsatzaufbau der großen Unternehmen beeinflussen kann.
Noch wichtiger ist, dass die "Grundlage" der Kernaktivitäten der großen Unternehmen immer noch sehr stabil ist: Alibabas E - Commerce und Cloud - Computing, Tencents Sozialmedia und Spiele, ByteDances Kurzvideos und Live - Streams können weiterhin stabile Bargeldflüsse und Gewinne generieren. In einer solchen Situation ist die Rendite eines großen Investitions in die Embodied Computing - Hardware sehr gering. Denn sie müssen nicht nur das Risiko eines Scheiterns der Forschung und Entwicklung tragen, sondern auch möglicherweise mit "hohem Einsatz und langsamer Rückkehr" rechnen und in eine Situation geraten, in der die Sache "nicht schmeckt, aber auch nicht weggeworfen werden kann".
Genau wie die führenden Batteriehersteller nicht bereit sind, spezielle Batterien für Roboter zu entwickeln. Der bestehende Markt für Traktionsbatterien ist bereits ausreichend, um die Geschäftsergebnisse zu stützen, und es ist kurzfristig kein neuer Wachstumspotenzial durch spezielle Batterien für Roboter in Sicht. Deshalb halten sich die Internetriesen auch an die Strategie "solange die Technologie nicht hinterherbleibt", beobachten die Branchenentwicklung ständig, um sicherzustellen, dass es keine Generationsebene gibt, und können bei einem reifen Markt jederzeit durch Investitionen und Kooperationen beschleunigen.
Es kann hinter der rationalen Wahl noch sexier werden
Die Wahl der großen Unternehmen, sich am Rande zu halten, entspricht zwar ihren eigenen Interessen, aber sie wirkt konservativ. Man merkt sogar, dass die gegenwärtige Vorgehensweise im Widerspruch zur grundlegenden Logik der Entwicklung des Embodied Computing steht.
Der offensichtlichste Widerspruch liegt in der Unterbrechung des Datendrehrads. Dies umfasst zwei Ebenen: Einerseits hat das Datendrehrad der Hardwarebereitstellung noch nicht angefangen, sich zu drehen. Andererseits werden die von den großen Internetunternehmen gesammelten Daten nicht voll ausgeschöpft.
Die Kernmotivation für das Wachstum im Bereich des Embodied Computing ist das "Datendrehrad". Roboter interagieren mit der physischen Welt durch die Bereitstellung von echten Maschinen und generieren geschlossene Schleifen von "Wahrnehmung - Entscheidung - Ausführung". Diese Daten werden für die Iteration des Modells verwendet, um die Intelligenz stetig zu verbessern. Da die großen Unternehmen keine Roboter - Hardware herstellen, können sie die Skala der Bereitstellung, die Art der Aufgaben und die Vielfalt der Umgebungen nicht kontrollieren. Dies führt zur Unterbrechung der Datenerfassungskette und macht es schwierig, das Datendrehrad zu beschleunigen.
Es ist ebenfalls bedauerlich, dass die riesigen Mengen an Internetdaten, die von den großen Unternehmen gesammelt wurden, nicht voll ausgeschöpft werden. Alibaba, ByteDance und Tencent verfügen über riesige Mengen an Daten aus Mensch - Maschine - Interaktion, AI - Anwendungen, Logistik und Händlerdaten. Diese Daten könnten voll genutzt werden, um die Interaktionsfähigkeit der Produkte zu verbessern und die präzise Vermarktung der Produkte voranzutreiben.
Bildbeschreibung: JD.com Embodied Service System
Was jedoch positiv überrascht, ist, dass einige große Unternehmen die Potenziale dieser Daten erkannt haben. JDs Vorgehen im Bereich des Embodied Computing (insbesondere JoyInside) ist ein typisches Beispiel: Es nutzt die E - Commerce - Lieferkette, das Logistiksystem, die Daten aus der Benutzerinteraktion und die Szenariodaten, um Unternehmen im Bereich des Embodied Computing bei der Umsetzung ihrer Anwendungen auf vielfältige Weise zu unterstützen. Dadurch hat JD.com auch die Ökosystemposition "Kaufe Roboter auf JD.com" gewonnen.
Ein weiterer, weniger offensichtlicher Widerspruch betrifft die Fehlvorstellung über die Software - und Hardwaremärkte.
Die Tatsache, dass die großen Unternehmen sich nur auf die Entwicklung von Modellen und Lösungen konzentrieren, beruht auf der Fehlvorstellung, dass "nur Software hochwertig und Hardware nur einfache Fertigung" sei. Sie halten sich an die traditionelle Branchenaufteilung, bei der "Software das Herzstück und Hardware nur die Ergänzung" ist. Diese Strategie scheint sicher zu sein, aber sie könnte die Branche in eine extreme, überkonkurrierte Situation bringen.
Derzeit entwickeln die meisten Internetriesen Softwarelösungen für Embodied Computing und bieten allgemeine Modellfähigkeiten. Aber dieses Vorgehen hat ein gravierendes Problem: Der Markt für Softwarelösungen ist von Natur aus ein "Gewinner gewinnt alles" - Markt. Wenn man sich die Situation in der intelligenten Fahrassistenzbranche anschaut, wird am Ende nur eine kleine Anzahl von Anbietern übrig bleiben.
Derzeit zeigt sich bei den Modellen der großen Unternehmen ein tendenziell homogenes Wettbewerbsbild. Ihre Kernfunktionen sind "natürliche Sprachinteraktion + Aufgabenplanung", und der Unterschied liegt nur in der Anzahl der Schnittstellen und der Art der kompatiblen Hardware. In dieser Wettbewerbssituation ist weder die Möglichkeit eines "Einheitsherrschers" noch die Faszination einer technologischen Ausbreitung zu erkennen.
Somit kommt es zu einem tieferen Problem. Wenn die großen Unternehmen nur Modelle im Stillen entwickeln, werden diese Modelle "Pfeile ohne Ziel", da sie nicht an die Hardware angepasst sind. Das Wesen des Embodied Computing ist die Symbiose von einem "Hardwareträger + intelligentes Modell". Ohne passende Hardware kann kein fortschrittliches Modell seine Wirkung entfalten. Da die Plattformen keine eigenen Roboter herstellen, müssen sie sich an externe Hardwarehersteller wenden, und die Algorithmenvorteile der Modelle können nicht tiefgehend mit der mechanischen Leistung der Hardware kompatibel sein.
Deshalb könnte ein Unternehmen, das sowohl Software als auch Hardware in den Griff bekommt, tatsächlich mehr kommerziellen Wert haben.
Der Erfolg von Tesla beweist genau die Überlegenheit der "Integration von Software und Hardware". Tesla hat mit seiner Model - Serie die Verkaufslisten der Elektromobile dominiert und mit seinem FSD - System eine so genannte "generationsübergreifende Führung" erreicht. Ein ähnliches Beispiel ist das Optimus - Projekt, bei dem die Hardware ständig optimiert und die Software gleichzeitig verbessert wird. Genau wegen des großen kommerziellen Werts dieser Integration von Software und Hardware wurde auch das "Billionen - Dollar - Gehaltsplan" von Musk genehmigt.
Abschluss
Aus kommerzieller Sicht ist die "Randschleich - Strategie" der großen Unternehmen unangreifbar: Sie bietet eine höhere Rendite, geringere Risiken und einen vertrauten Weg. Sie vermeidet die langwier