Nvidia's neues "Gehirn" ist da. Warum sind die großen Unternehmen beeifert darum bemüht, Roboter mit einem "Gehirn" auszustatten?
Top-Spatenseller verkaufen nicht nur Produkte, sondern setzen auch Branchenstandards und bauen Ökosysteme auf. Sie locken Drittanbieter-Entwickler und -Dienstleister an, um ihre „Spaten“ herum zu entwickeln und schaffen so einen starken Synergieeffekt. Beispielsweise sind Microsofts Windows-Betriebssystem und Apples App Store Paradebeispiele für Ökosystemaufbau.
Nachdem ein humanoider Roboter mit Nvidias neuem Roboterrechnungsplattform Jetson Thor ausgestattet ist, würde er wahrscheinlich sagen: „Ich habe es verstanden.“
Nach einem prahlerischen Ankündigungsvorgang hat Nvidia endlich mit dem neuen Gehirn für humanoider Roboter auftaucht. Die KI-Leistung ist um das 7,5-fache gestiegen, die Rechenleistung auf 2.070 TFLOPS gestiegen. Die beeindruckenden Daten lassen viele Leute ausrufen, dass dies der „iPhone-Moment“ für humanoider Roboter ist.
Bildquelle: Nvidia
Lasst uns die genauen Daten beiseite lassen. Aus den Ergebnissen zu urteilen, hat Nvidias neues Gehirn Jetson Thor die physische Intelligenz überwunden. Humanoider Roboter können direkt durch generative Inferenz die Konsequenzen ihrer Handlungen vorhersagen und komplexe Aufgaben ausführen. Einfach ausgedrückt, verstehen humanoider Roboter die physische Welt und den Arbeitsablauf. Wenn man ihnen ein Werkzeug und Material gibt, wissen sie, was als nächstes zu tun ist.
Außer dass sie verstehen, schließen und autonom arbeiten können, wird die Arbeitsgeschwindigkeit von humanoiden Robotern unter der Unterstützung dieses Gehirns noch reibungsloser. Wang He, CTO von Galaxy Universal, hat einmal erwähnt, dass die Bewegungsgeschwindigkeit und die Bewegungsflüssigkeit seines G1 Premium-Roboters nach der Verwendung von Thor deutlich verbessert wurden.
Das Embodied Learning Club hat in nächster Nähe erlebt, dass ein Roboter mit Thor die „Drift“-Fähigkeit erworben hat und seine Bewegungsgeschwindigkeit wie beschleunigt war. Beim Transport von Kisten konnte er auch die Position der verschobenen Kisten präzise erkennen, auch wenn er von dem Embodied Learning Club gestört wurde.
Dies ist der Wendepunkt für die „Einsicht“ von humanoiden Robotern.
Nvidias aktive Einrichtung in der Embodied Intelligence passt nicht nur zu Huang Renxuns Optimismus gegenüber der zukünftigen physischen KI und Nvidias Rolle als „Spatenseller“, sondern trifft auch genau auf eine andere Hauptlinie: Große Unternehmen kämpfen darum, Gehirne für Roboter zu entwickeln.
Ob es sich um Tencents allgemeines externes Gehirn, das unter dem Slogan „Keine Hardwareberührung“ entwickelt wurde, oder um Jingdoms Fähigkeit, Robotern die „Konversationsfähigkeit“ zu verleihen, geht es bei den großen Unternehmen um das Gehirn. Hinter diesem liegt sowohl eine strategische Einrichtung, um die Schwächen der Branche mit ihren Stärken auszugleichen, als auch eine defensive Strategie, um das Risiko großer Investitionen zu vermeiden.
Das Siegerrecht in diesem „Gehirnwettbewerb“ für humanoider Roboter ist vielleicht für die großen Unternehmen reserviert.
Nvidias Beides-Wollen
Schauen wir uns zunächst eine etwas unverständliche Datenreihe an, um zu sehen, wie Nvidia sowohl die Leistungsvorteile der Hardware als auch die systemische Verbesserung der Software erzielen will.
Jetson Thor ist speziell für generative Inferenzmodelle entwickelt und basiert auf der neuesten Blackwell-GPU-Architektur. Es bietet eine Rechenleistung von bis zu 2.070 FP4 TFLOPS, was 7,5-mal höher ist als die des Vorgängers Jetson Orin. Die CPU-Leistung ist um das 3,1-fache, die Energieeffizienz um das 3,5-fache und die Speicherkapazität um das 2-fache verbessert. Im Vergleich zu vor 10 Jahren ist die KI-Leistung um ganze 7.000-fache gestiegen.
Bildquelle: Nvidia
Diese Roboterrechnungsplattform kann hochfrequente Sensordaten in Echtzeit auf der Edge verarbeiten und visuelle Inferenz ausführen. Sie kann mehrere generative KI-Modelle gleichzeitig auf Edge-Geräten ausführen und löst eines der größten Herausforderungen in der Robotik: das Ausführen von mehreren KI-Arbeitsabläufen, damit Roboter in Echtzeit und intelligent mit Menschen und der physischen Welt interagieren können.
Darüber hinaus kann Thor innerhalb von 200 Millisekunden die erste Token-Antwort geben und mehr als 25 Tokens pro Sekunde generieren. Diese Geschwindigkeit kann fast die Echtzeitkonversation zwischen Robotern und Menschen unterstützen.
Das bedeutet, dass humanoider Roboter möglicherweise nicht mehr ausschließlich auf die Cloud angewiesen sind und komplexe Aufgaben auf der Edge bewältigen können.
Jetson Thor hat auch viel an der Software gearbeitet, um die Anforderungen von Echtzeitanwendungen an geringe Latenz und hohe Leistung zu erfüllen und alle gängigen generativen KI-Frameworks und KI-Inferenzmodelle zu unterstützen, einschließlich Cosmos Reason, DeepSeek, Llama, Gemini, Qwen usw.
Einfach ausgedrückt, durch die gleichzeitige Verbesserung von Hardware und Software gibt Nvidia nicht einfach nur einen Chip in den Roboter, sondern gibt ihm ein Gehirn, das in Echtzeit interagieren und schließen kann, und das schnell und stabil funktioniert.
Der US-Startspreis für dieses Gehirn, das sich lohnt, zu genießen, beträgt 3.499 US-Dollar. Der Stückpreis für die Massenproduktionsmodule bei einem Kauf von über 1.000 Stück beträgt 2.999 US-Dollar. Ab sofort wird es worldwide, einschließlich China, an Kunden verkauft. Der chinesische Preis ist noch nicht bekannt.
Aber chinesische Unternehmen wie Ubtech, Galaxy Universal, Unitree, Zhongqing Robotics und Zhipu Robotics haben bereits Jetson Thor eingesetzt. Außer Galaxy Universal, wie oben erwähnt, hat auch Ubtech angegeben, dass sein neuester industrieller humanoider Roboter Walker S2 bereits NVIDIA Isaac Sim und Jetson AGX Thor integriert hat.
Bildquelle: Ubtech
Dieses Gehirn ist nicht ausschließlich für humanoider Roboter entwickelt. Nvidia hat angegeben, dass Jetson Thor die Geschwindigkeit aller Arten von Roboteranwendungen beschleunigen kann, einschließlich Operationsassistenzrobotern, intelligenten Zugfahrzeugen, Lieferrobotern, industriellen Roboterarmen und visuellen KI-Agenten.
Und dies bestätigt erneut Huang Renxuns Wort: In der Zukunft werden alle beweglichen Objekte Roboter sein.
Nur Große Unternehmen können Gehirne entwickeln?
Das Gehirn wird immer als der Spitzenwettbewerb in der Embodied Intelligence angesehen.
Ohne die Unterstützung der Gehirnfähigkeit kann die beste Roboterstruktur nicht wirklich in die physische Welt integriert werden und keine direkte Interaktion mit Menschen, Produktion und Leben haben. Es ist nicht einmal ein Spielzeug, sondern eher ein „Figurine“. Aber die Bedeutung des Spitzenwettbewerbs repräsentiert nicht nur seinen Wert, sondern auch die Schwierigkeit.
Nach all der Mühe können die Komponenten eines Roboters von Hand hergestellt werden, aber die Schwierigkeit, ein Gehirn von Hand zu bauen, ist um ein Vielfaches höher.
Und dies setzt natürlich eine hohe Schwelle für den Eintritt in den Gehirnwettbewerb. Es braucht nicht nur Technologie, sondern auch finanzielle Unterstützung. Dies bedeutet, dass der Gehirnmarkt derzeit zu einem „Spielplatz für Giganten“ geworden ist. Früher hat ein Gründer eines Roboterherstellers während eines Gesprächs mit dem Embodied Learning Club erwähnt, dass diejenigen, die in Zukunft überleben können, Gehirnunternehmen sind, die viel Geld eingeflossen haben. Ein anderer Gründer hat ähnliche Ansichten. Am Ende werden die großen Unternehmen die Macht haben, denn derzeit reichen die finanziellen Mittel der Roboterhersteller nicht aus, um in die Gehirnentwicklung zu investieren.
Einerseits wird das Gehirn aufgrund der hohen Eintrittsschwelle zu einem Blauocean in einem Blauocean. Andererseits kann man nicht nur die brutale Konkurrenz auf der Roboterstrukturebene umgehen, sondern auch die gemeinsame Entwicklung der Branche fördern und die Macht in der Zukunft erobern, wenn man ein gutes Gehirn entwickelt. Deshalb machen die großen Unternehmen, die bereits über eine technologische Basis verfügen, natürlich gerne Gehirnlieferanten.
Während der Welt-Künstliche-Intelligenz-Konferenz 2025 hat Tencents Robotics X Laboratory und das Futian Laboratory gemeinsam die Embodied Intelligence-Plattform Tairos (Titanium Screw) veröffentlicht. Diese Plattform setzt auf „Plug-and-Play“ und senkt die Einstiegsschwelle für Benutzer. Sie besteht aus einem Modellalgorithmus und einem Cloud-Service. Die Modellschicht umfasst multimodale Wahrnehmungsmodelle, Planungsgroßmodelle und kombinierte Wahrnehmungs-Aktions-Großmodelle. Die Cloud-Service-Plattform umfasst eine Simulationsplattform, eine Datenplattform und Entwicklungstools usw.
Bildquelle: Tencent
Ein Unitree-Roboter mit Tairos kann den Befehl „Komm zu mir“ verstehen und ausführen. Er kann auch die Gegenstände auf dem Tisch sehen und beschreiben. Er hat sogar die Fähigkeit der raumzeitlichen Erinnerung und kann sich daran erinnern, was er gestern gemacht hat.
Jingdong bietet hauptsächlich das Gehirn und die IO-Eingabe-Ausgabe-Interaktionsfähigkeit. Die IO-Fähigkeit umfasst die Sprachverständnis in einem komplexen Lärmumfeld und die genaue Verständnis von Kinderns Sprachausdrücken. Zu den Robotern, die JoyInside integriert haben, gehören Shangtang Yuanluobo AI-Schachroboter, Lingtong Nian NIA-F01 humanoider Roboter und Zhongqing PM01 usw. Unter der Unterstützung von JoyInside können die Roboter natürlich mehrfach mit Menschen konversieren.
Es ist bemerkenswert, dass Tencent und Jingdong, die in den Gehirnmarkt eingetreten sind, nicht die „Händler“-Farbe zeigen. Eines spricht von Nicht-Kommerzialisierung, das andere kümmert sich nicht um den Umsatz. Dies unterscheidet sich wesentlich von Nvidia.
Ob es sich um Tencents und Jingdoms strategische Einrichtung oder Nvidias fast alles-in-Roboter-Haltung handelt, ist das Tun der großen Unternehmen, Gehirne zu entwickeln, nicht nur eine Reaktion auf die Zeit, sondern auch eine Gelegenheit, die Aufmerksamkeit der Menschen zu erobern und die Rolle als „Spatenseller“ zu festigen. Denn das Potenzial in diesem Bereich ist viel größer als das eines Roboters.
Top-Spatenseller verkaufen nicht nur Produkte, sondern setzen auch Branchenstandards und bauen Ökosysteme auf. Sie locken Drittanbieter-Entwickler und -Dienstleister an, um ihre „Spaten“ herum zu entwickeln und schaffen so einen starken Synergieeffekt. Beispielsweise sind Microsofts Windows-Betriebssystem und Apples App Store Paradebeispiele für Ökosystemaufbau.
Aber dies bedeutet auch höhere technologische Anforderungen. Ein qualifizierter Spatenseller muss über eine Kerntechnologie verfügen, die es für die Konkurrenten in kurzer Zeit schwer ist, zu kopieren. Dies kann ein Patent, ein komplexer Algorithmus oder ein einzigartiges Herstellungsverfahren sein. Und er muss auch vorausschauend in die Forschung und Entwicklung investieren. Er muss weiter sehen als die „Goldsucher“ und die nächste Generation von „Spaten“ im Voraus planen. Wenn die Goldsucher noch mit Schaufeln arbeiten, entwickeln sie bereits Bagger. Die kontinuierliche Forschung und Entwicklung ist die Lebensader, um die Spitzenstellung zu halten.
Aus der Branchenperspektive brauchen die Roboterhersteller die Fähigkeiten der großen Unternehmen, um die Entwicklung der Roboter als Produktivkraft zu beschleunigen. Dies ist eine Entwicklungsmöglichkeit, in der sich beide Seiten gegenseitig helfen. Durch die Anstrengungen verschiedener Akteure in verschiedenen Rollen sind wir vielleicht schon einen Schritt näher an der Allgemeinheit.
Dieser Artikel stammt aus dem WeChat-Account „Embodied Learning Club“. Autor: Lü Xinyi, Redakteur: Di Xintong. Veröffentlicht von 36Kr mit Genehmigung.