Wie wird die physikalische Künstliche Intelligenz die Robotikindustrie transformieren? Die vollständige Aufzeichnung der abgesperrten Sitzung von NVIDIA mit den Gründern von Unitree und Galaxy Universal
Jensen Huang hat in mehreren Vorträgen dieses Jahres erwähnt, dass NVIDIA sich aktiv für die "Physikalische KI" positioniert.
Die Physikalische KI wird autonomen Maschinen wie Robotern und selbstfahrenden Autos motorische Fähigkeiten verleihen, sodass sie die reale Welt verstehen und mit ihr interagieren können. Huang betonte, dass die Physikalische KI einen revolutionären Durchbruch im Bereich der Robotik bringen wird und sagte direkt: "Wir sind bereits in die Ära der KI-Inferenz eingetreten, die nächste Welle wird die Physikalische KI sein."
Auf der Weltrobotertagung 2025 erklärte Rev Lebaredian, Vizepräsident von NVIDIA für Omniverse und Simulations- und Modellierungstechnologien, dass die Physikalische KI die realwirtschaftliche Branche im Wert von Billionen von Dollar ankurbeln wird. Im Vergleich zur Größe der IT-Branche von etwa 5 Billionen Dollar ist die Summe der physikalischen Branchen wie Fertigung, Logistik und Medizin mehr als hundertmal so groß. Wenn Roboter die Rechenleistung mit diesen Branchen verbinden können, wird dies die Produktivität enorm steigern und exponentielle Veränderungen bringen.
Nach der Tagung führte Rev Lebaredian von NVIDIA eine geschlossene Austauschrunde mit den Gründern Wang He und Wang Xingxing der Robotik-Ekosystem-Partner Galaxy Universal und Unitree Technology sowie mehreren Medien durch, um erneut die zukünftige Entwicklungspfade der Physikalischen KI eingehend zu diskutieren.
Während der Runde zeigte Rev Lebaredian hohe Anerkennung für die Entwicklung des chinesischen Marktes im Bereich der Physikalischen KI. Er sagte gegenüber Tencent Technology: "China hat in den Bereichen Physikalische KI und Robotik einzigartige Vorteile in Bezug auf Skala und Talentpool, was ein unvergleichliches Ökosystem geschaffen hat. China verfügt nicht nur über tiefgreifende Fachkenntnisse in der Herstellung von elektronischen Hardware und Schlüsselkomponenten für Roboter, sondern auch über die weltweit führende Fertigungsgröße. Diese Vorteile legen eine solide Grundlage für die schnelle Entwicklung der Branchen Physikalische KI und Robotik."
Im Folgenden der vollständige Transkript der Austauschrunde:
Rev Lebaredian, Vizepräsident von NVIDIA für Omniverse und Simulations- und Modellierungstechnologien
Rev Lebaredian, Vizepräsident von NVIDIA: Die Physikalische KI bringt die Berechnung in die intelligente Revolution der realen Welt
In den letzten drei- bis vierzig Jahren haben wir die Computer- und IT-Branche aufgebaut, die die Fähigkeiten aller Branchen erweitert hat. Doch die Auswirkungen der Berechnung beschränken sich größtenteils noch auf den "Informationsraum" - also auf Inhalte, die digitalisiert werden können, wie Sprache und alle codierbaren Informationen.
Mit der Entstehung des Internets ist die Rechentechnologie tatsächlich in das Leben jeder einzelnen Person eingegangen, alle Menschen miteinander verbunden und Jahrzehnte lang Wachstum gebracht. Betrachtet man die weltweite Marktgröße, so ist die IT-Branche mit einem Gesamtwert von etwa 5 Billionen Dollar zwar riesig, aber im Vergleich zum Gesamtwert aller Weltbranchen von über 100 Billionen Dollar nur ein kleiner Teil. Die anderen Branchen sind wertvoller, weil sie mit den "Atomen" der realen Welt umgehen - Verkehr, Fertigung, Lieferkette, Logistik, Medizin, Pharmazie und andere Bereiche, die die physikalische Welt betreffen.
Heute haben wir mit der Entstehung der Künstlichen Intelligenz endlich die Fähigkeit, Maschinen mit "physikalischer Intelligenz" auszustatten und die physikalische Welt wirklich mit der Informationswelt zu verbinden. Mit anderen Worten, die Macht der Berechnung ist nicht länger auf den Informationsmarkt von 5 Billionen Dollar beschränkt, sondern kann in den physikalischen Weltmarkt von 100 Billionen Dollar eindringen. Und diese Brücke ist der Roboter. Mit Robotern können wir die Berechnung und die Künstliche Intelligenz in die reale Welt bringen und intelligente Agenten schaffen, die die physikalische Umwelt verstehen und verändern können.
China ist der beste Ort, um diesen Sprung zu schaffen, weil es hier einzigartige Bedingungen gibt:
- Spitzen-KI-Talente: Fast die Hälfte aller weltweit tätigen KI-Forscher und -Entwickler befindet sich in China, darunter die besten Talente aus Spitzenuniversitäten.
- Fähigkeiten in Elektronik und Rechentechnologie: China verfügt nicht nur über Fähigkeiten in der Technologieentwicklung, sondern auch über eine weltweit unübertroffene Elektronikfertigungsindustrie, was im Bereich der Physikalischen KI und der Robotik von entscheidender Bedeutung ist.
- Großer Fertigungsgrundstock: Hier gibt es reale Szenarien für die Massenimplementierung und -testung von Robotern, um schnell Daten zu sammeln und Algorithmen zu verbessern, damit die Roboter ständig evolvieren können.
Es ist daher nicht verwunderlich, auf der Weltrobotertagung so viel Energie, Fähigkeiten und Enthusiasmus zu sehen.
NVIDIA hat auch einen einzigartigen Beitrag zu diesem Puzzle geleistet. Wir haben lange Zeit davon geträumt, an der Lösung dieses Problems beteiligt zu sein und uns seit langem darum bemüht. Im Bereich der Robotik haben wir drei Computer entwickelt:
- Roboter-Computersystem: Eingebaut in den Roboter selbst, wie in einem selbstfahrenden Auto oder einem humanoiden Roboter. Der speziell für humanoide Roboter entwickelte Jetson Thor gehört zu dieser Kategorie. Auf der WRC-Messe konnten sie dieses Jahr auf Galbot und anderen ausstellten Robotern zu sehen.
- KI-Fabrikcomputer: Bevor man das "Gehirn" des Roboters entwickeln kann, muss man sich auf das DGX- und HGX-System verlassen, um riesige Mengen an Rohdaten zu verarbeiten, physikalische KI-Algorithmen, physikalische KI-Modelle und neuronale Netzwerke zu generieren und sie dann auf den Roboter zu deployen.
- Simulationscomputer: Daten aus der physikalischen Welt können nicht direkt aus dem Internet abgerufen werden, sondern nur auf zwei Arten: durch die Erfassung von Sensoren in der realen Welt oder durch die Generierung von Computersimulationen auf der Grundlage physikalischer Gesetze und Weltregeln. Simulationen können nicht nur Daten generieren, sondern auch Roboter vor der Implementierung testen, um sicherzustellen, dass sie in der realen Umgebung sicher funktionieren, und die Testgeschwindigkeit kann schneller als die reale Zeit sein.
Im Bereich der Robotik verfügt NVIDIA über die vollständige Isaac-Plattform, die Hardware und die erforderlichen Softwarestacks für die drei Computer kombiniert, einschließlich Laufzeitumgebung, Rechenumgebung, Simulationswerkzeuge und Trainingsframework. Der NVIDIA Jetson Thor ist ein Supercomputer, der speziell für intelligente Inferenzagenten in der realen Welt (insbesondere Roboter) entwickelt wurde. Jensen Huang bezeichnet ihn als "Echtzeit-Inferenzmaschine".
Highlights der Leistung des Jetson Thor:
- Die Rechenleistung ist 7,5-mal so hoch wie die des Vorgängers Jetson Orin, fast 10-mal so hoch;
- Die Leistung pro Watt ist um 3,5-mal verbessert;
- Die CPU-Leistung ist um 3,1-mal verbessert;
- Der I/O-Durchsatz ist um 10-mal erhöht, um die Anforderungen an die Hochbandbreitenerkennung zu erfüllen.
- Die Isaac-Plattform umfasst auch NVIDIA's Simulator und Simulationsframework:
- Isaac Sim: Umgebungs- und Sensor-Simulation, Roboter-Test, Generierung von synthetischen Daten.
- Isaac Lab: Simulationsplattform für verstärktes Lernen.
- NVIDIA Cosmos: Weltgrundmodell und Framework, das die Erstellung von KI, die die physikalische Welt versteht, unterstützt und mit Simulatoren wie Omniverse kombiniert werden kann, um genauere und umfangreichere Daten zu generieren.
Das Weltgrundmodell ist zwar noch in den Anfängen und kann die Welt noch nicht vollständig verstehen, aber es ist bereits sehr nützlich und bringt neue Fähigkeiten für die Roboterentwicklung.
Wang Xingxing von Unitree Technology: Die kooperative Evolution von KI und Robotern führt in die nächste Technologieära
Wang Xingxing, CEO von Unitree Technology
In den letzten Jahren haben wir großen Wert auf die Richtung der humanoiden Roboter gelegt. In gewisser Weise betrachte ich den humanoiden Roboter als wichtigen Träger für allgemeine Roboter. Wie bekannt ist, ist die allgemeine KI derzeit die weltweit vorherrschende Entwicklungsrichtung, und eine echte allgemeine KI kann bei der Ausführung von Aufgaben nicht auf Roboter, insbesondere auf allgemeine Roboter, verzichten.
Im Vergleich ist der humanoide Roboter derzeit die idealste Form eines professionellen Roboters. Obwohl er auf den ersten Blick komplex erscheint, ist seine tatsächliche Struktur nicht so kompliziert wie man denkt. Im Wesentlichen besteht er aus einer Reihe von Gelenkmotoren. Daher ist die Struktur relativ einfach, im Gegensatz zu Raupenfahrzeugen oder anderen Formen von Robotern, die eher komplexer sind.
Ich glaube immer, dass jeder leicht einen humanoiden Roboter bauen kann, wenn die allgemeine KI weitgehend ausgereift ist, ähnlich wie heute jeder Computerkomponenten kaufen und einen Computer zusammenbauen kann. Wenn die KI in Zukunft stark genug ist, werden die Anforderungen an die Hardware immer geringer.
Wir haben im Mai letzten Jahres einen Roboter vorgestellt, der damals für etwa 99.000 Yuan verkauft wurde und bis heute starken Wettbewerbsvorteil hat. Seine Anzahl an Gelenken und seine Beweglichkeit sind ausgezeichnet, und seit seiner Veröffentlichung ist sein Aufbau zu einer der weltweit vorherrschenden Designkonfigurationen geworden.
Im zweiten Halbjahr des vergangenen Jahres und in diesem Jahr ähneln die neuen Produkte vieler aufstrebender Robotikunternehmen in ihrem Aufbau diesem Roboter, unterscheiden sich aber nur in der Optik. Unser Design ist fließend und einfach, während andere Modelle möglicherweise komplizierter und weniger schön gestaltet sind. Daher hat dieses Produkt einen starken Wettbewerbsvorteil auf dem Markt.
Kürzlich haben wir eine neue Version vorgestellt. Obwohl die Lackierung etwas aufdringlich erscheint, möchten wir, dass die Kunden die Optik frei anpassen und lackieren können, z. B. die Farbe ändern oder individuelle Dekorationen hinzufügen. Viele Kunden kleiden die Roboter beim Live-Streaming im Freien an, setzen ihnen Hüte oder Perücken auf und kreieren so verschiedene Looks. Die Anpassbarkeit der Optik und des Designs ist für die Kundenerfahrung von entscheidender Bedeutung. Dieser neue Versionspreis liegt bei etwa 39.000 Yuan, hat weltweit starken Wettbewerbsvorteil und zeigt hervorragende Leistung. Derzeit ist der Artikel auf Lager, und die Massenproduktion soll bis Ende des Jahres abgeschlossen sein.
Außerdem haben wir kürzlich den A2-Roboterhund vorgestellt, dessen größte Stärke darin besteht, dass er bei kompakter und leichter Bauweise eine hohe Tragfähigkeit erreicht. Er wiegt etwa 37 kg und kann ständig eine Last von 30 kg tragen. Bei leerem Zustand kann er 20 km weit fahren. Seine Optik zieht von früheren Designs Erfahrungen und ist futuristischer. Außerdem ist er staub- und wasserdicht. Wir hoffen immer, dass Roboter in der Industrie schwer, gefährlich oder repetitive Arbeiten für Menschen übernehmen können. Unser Roboterhund hat in einigen gemeinnützigen Projekten 24 Stunden am Tag betrieben werden können und verfügt über die Funktionen des automatischen Aufladens und der Patrouillenüberprüfung.
Ende letzten Jahres haben wir unseren Radroboter verbessert. Dieser Roboter ist relativ groß und wiegt etwa 70 - 80 kg, was ihn in einigen Szenarien unpraktisch macht. Deshalb haben wir eine kleinere, staub- und wasserdichte Version entwickelt, die für verschiedene Innen- und Außenanwendungen geeignet ist. Obwohl er groß ist, hat er dennoch eine ausgezeichnete Beweglichkeit. Normalerweise sind kleinere Roboter beweglicher, während größere Roboter weniger beweglich sind. Aber wir haben auch bei größerer Größe eine gute Bewegungsleistung gewährleistet.
Im Januar dieses Jahres waren unsere Roboter auf der CCTV-Neujahrsfeier zu sehen. Der größte Hingucker war ihre automatische Gruppen-Tanzperformance. Sie sind mit drei Laserscannern am Kopf ausgestattet, können automatisch Karten erstellen und die Formation ändern. Um sich an die Bühnenaufführung anzupassen, haben wir die Kontrolle an die Bühnensteuerung übergeben, damit Musik und Bewegungen millisekundengenau synchronisiert sind. Insgesamt waren 16 Roboter an der Show beteiligt, die alle an unseren Backend-Server angeschlossen und dann an das Bühnen-System angebunden waren. Die größte Herausforderung bei diesem Projekt war die Zusammenarbeit mehrerer Roboter und die komplexe Programmierung und Wartung. Derzeit geben diese Roboter täglich in der MGM Macau Shows.
Beim Lernen von Bewegungen trainieren wir die Roboter, indem wir menschliche Bewegungsdaten sammeln und verstärktes Lernen anwenden. Im Gegensatz zur Sprachmodell-Trainierung benötigt die Bewegungstraining nur wenige reale Daten, der Rest wird durch verstärktes Lernen abgedeckt. Wir verwenden hauptsächlich NVIDIA's Isaac Sim-Plattform für das Training und haben bereits viele Bewegungen wie Tanzen, Springen und Salto beherrscht. Derzeit ist der größte Faktor, der die Ausführung komplexerer Bewegungen durch Roboter einschränkt, nicht der Algorithmus, sondern die physischen Grenzen der Hardware. Beispielsweise erfordert die Erhöhung der Laufgeschwindigkeit von 3 - 4 Metern pro Sekunde auf 10 Meter eine erhebliche Verbesserung der Hardware.
Wir legen auch großen Wert auf die Entwicklung von Roboter-Armen und -Händen. Derzeit haben wir eine eigene Hand mit etwa 20 Freiheitsgraden entwickelt. Unser Ziel ist, dass Roboter tatsächlich alltägliche Aufgaben ausführen können, nicht nur Präsentationsbewegungen. Wir hoffen, in ein bis zwei Jahren natürliche Interaktionen zu ermöglichen, z. B. dass ein Roboter direkt angewiesen werden kann, jemandem Wasser einzuschenken, ohne dass vorher eine Anpassung erforderlich ist.
Ende Mai dieses Jahres haben wir mit der CCTV ein Roboterkampfturnier veranstaltet, das etwa 1,5 Stunden dauerte und von 4 Teams bespielt wurde. Die Algorithmen des Kampfspiels sind komplexer als bei Tanz- oder Kungfu-Aufführungen, da die Bewegungsfolgen zufällig und stark gestört sind und es erfordert, dass die Bewegungen reibungslos aneinander gereiht und frei kombiniert werden können. Unser Ziel ist es, in Zukunft "die beliebige Echtzeitgenerierung beliebiger Bewegungen" zu erreichen.
Außerdem haben wir den R1-Roboter vorgestellt, der etwa 25 kg wiegt, leicht und sicher ist. Obwohl er klein ist, hat er eine starke Leistung und ist hauptsächlich für industrielle Anwendungen konzipiert. Seine Algorithmen sind ähnlich denen der humanoiden Roboter, aber aufgrund der besseren Stabilität der Vierbeiner können sie heftigere Bewegungen ausführen, ohne beschädigt zu werden, und haben eine starke Hindernis