StartseiteArtikel

Jensen Huang hat die Alpamayo 2 Super vorgestellt: Die Black Box der automatisierten Fahrweise ist endlich geöffnet.

赛博汽车2026-06-02 08:35
32 Milliarden Parameter, um eine "transparent" Fahrentscheidung zu erzielen.

„Alpamayo markiert den Übergang des Autos von der 'reinen Fahrt' in die Ära des 'sicheren Schließens'.“

So sprach Jensen Huang live auf der NVIDIA GTC Taipeh 2026-Konferenz.

Während seines fast zweistündigen Vortrags stellte er nicht nur Produkte wie die für Agenten konzipierte Vera CPU, die Praxisanleitung DSX-Plattform für die KI-Fabrik und den Superchip RTX Spark vor, sondern führte auch im Bereich der Autonomisierung, der am meisten von der Automobilbranche interessiert ist, ein offenes Schließmodell ein: NVIDIA Alpamayo 2 Super.

Dies ist ein offenes visuell-sprachlich-aktionsbasiertes Schließmodell (Reasoning VLA) mit 32 Milliarden Parametern, das in einem vollständigen Fahrstapel schließen, planen und handeln kann und so die Entwicklung sichererer und skalierbarerer L4-Autonomisierung unterstützt.

Natürlich ist dies kein einfacher Modell-Upgrade, sondern ein grundlegender Paradigmenwechsel von der 'nachahmenden Fahrt' zum 'sicheren Schließen'.

Auf der Konferenz stellte Jensen Huang Produkte vor, die von den untersten Chips bis hin zu den obersten Infrastrukturen, von den Rechenzentren bis zu den persönlichen PCs, von der Cloud-KI bis zu den physischen Robotern reichen. Dies markiert die grundlegende Umwandlung von NVIDIA von einem 'GPU-Lieferanten' zu einem 'KI-Infrastrukturbetreiber'.

Alphamale 2: Der Autonomisierungseinsatz tritt in eine neue Schließphase ein

Der Kernpunkt des Alphamale 2 liegt in seiner 'Erklärbarkeit'.

Traditionelle End-to-End-Autonomiemodelle sind wie stille alte Fahrer, und man weiß nicht, wie sie ihre Entscheidungen treffen. Alphamale 2 hingegen ist wie ein 'gesprächiger Fahrer'. Das Fahrzeug kann in Echtzeit jede Entscheidung in natürlicher Sprache erklären, wie z. B. 'Aufgrund eines stehenden Fahrzeugs vorne blockiert die Fahrspur, leichte Linkskorrektur', 'Recht vorbei anfahrendem Fahrzeug links geben', 'An Haltestelle anhalten, um Verkehr zu überqueren'. Diese Fähigkeit, die 'Denkprozesse' sichtbar zu machen, erleichtert es offensichtlich, das Vertrauen der Menschen zu gewinnen.

Technisch gesehen hat Alphamale 2 drei Schlüssel-Upgrades erreicht: 360-Grad-Panoramawahrnehmung (von der Frontkamera auf Front, Seite und Heck erweitert), die vollständige Szeneninformationen für Fahrspurwechsel, Auffahren und Kreuzungsdurchfahrten liefert; die neue Ausgabe von 'Meta-Aktionen', einschließlich makroskopischer Entscheidungen wie Rechts vorbei geben, Fahrspurwechsel und Anhalten, wodurch das Modell hochwertige Fahrbefehle für die nachgelagerte Planung liefern kann; und die automatische Markierung der Schließung mit 2D-Positionierung, die den Markierungszyklus von Monaten auf Tage verkürzt und die Kostenstruktur der Assistenzfahrtdatenpipeline neu gestaltet.

Besonders bemerkenswert ist seine 'Lehrer-Schüler'-Destillationsarchitektur. Das 32-Milliarden-Parameter-Alphamale 2 Super als Lehrermodell kann zu einem kompakten Modell destilliert werden, das auf der NVIDIA DRIVE AGX Thor-Bordrechnerplattform läuft. Dies bedeutet, dass Automobilhersteller keine großen Modelle von Grund auf aufbauen müssen, sondern die 'plug-and-play'-Schließfähigkeit über NVIDIAs offene Ökosystem erhalten können.

Seit seiner Veröffentlichung wurden die Alphamale-Serien fast 400.000 Mal heruntergeladen und haben den COMPUTEX Best Choice Award in der Kategorie Fahrzeugtechnik und intelligentes Cockpit gewonnen.

Jensen Huangs Einschätzung der großen Modelle lautet: 'Alphamale markiert den Übergang des Autos von der 'reinen Fahrt' zum 'sicheren Schließen'. Nur NVIDIA kann offene Modelle, Simulationsumgebungen, reale Welt-Daten und Agentenfähigkeiten bieten, um die globale Ökosystementwicklung von Fahrernlos-Taxis zu unterstützen, die in der Lage sind, Randfälle zu verstehen, ihre Entscheidungen zu erklären, das Vertrauen der Öffentlichkeit zu gewinnen und L4-Fähigkeiten sicher auf Millionen von Fahrzeugen zu skalieren.'

'Virtuelles Fahrschule': AlpaGym und OmniDreams

Wenn Alphamale 2 ein 'denkender Fahrer' ist, dann sind die von NVIDIA gleichzeitig vorgestellten AlpaGym und OmniDreams seine 'virtuelle Fahrschule'.

Genauer gesagt ist AlpaGym ein quelloffenes, hochleistungsfähiges Rahmenwerk für geschlossene Schleifen der Verstärkungslearning. Im Gegensatz zu der traditionellen offenen Schleifen-Trainingsmethode, die 'basierend auf aufgezeichneten Daten das Modell bewertet und eine einzelne Aktion generiert', lässt AlpaGym das Modell in der NVIDIA AlpaSim-Simulationsumgebung einer kontinuierlichen Entscheidungs-Beobachtungs-Schleife unterziehen - jede Bremspedalbetätigung, jede Lenkung und jede Navigationswahl hat eine reale Auswirkung auf die Umgebung, wodurch komplexe Fehler und Randfälle, die von statischen Datensätzen ignoriert werden, aufgedeckt werden. Dies entspricht der Situation, dass ein KI-Fahrer in einem 'Paralleluniversum' Millionen von extremen Straßenbedingungen durchmacht und die Fehlerkosten auf Null reduziert.

OmniDreams ist ein neues generatives Weltmodell, das realistische geschlossene Schleifen von Assistenzfahrtszenen generieren kann und Entwicklern die Möglichkeit bietet, seltene Ausreißerfahrtszenen in großem Maßstab zu simulieren. In Kombination mit der NVIDIA Omniverse NuRec-Neuronalen Rekonstruktionstechnologie können Entwickler reale Flottendaten in realistische 3D-Szenen rekonstruieren und an verschiedene Fahrzeugsensor-Konfigurationen anpassen. NVIDIA hat sogar die automatische Markierungs-Pipeline für Kausalketten in quelloffener Form auf GitHub veröffentlicht, die aus ursprünglichen Fahrsegmenten automatisch kausalitätsbasierte Markierungen generieren kann, ohne dass manuelle Markierung erforderlich ist.

Die Bedeutung dieser 'Simulations-Trainings-Deployment'-Schleife besteht darin, dass die Entwicklung der Autonomisierung von der 'Straßentestgesteuerten' zur 'Simulationsgesteuerten' wird. Automobilhersteller müssen nicht mehr Tausende von Testfahrzeugen auf realen Straßen einsetzen, um Hunderttausende von Kilometern an Daten zu sammeln, sondern können über 90 % der Randfälle in einer digitalen Zwillingsumgebung validieren. Dies kann den Automobilherstellern helfen, die Forschungs- und Entwicklungskosten zu senken und die Markteinführungszeit zu verkürzen.

'Superhirn': Vera Rubin und Vera CPU

Auf der Konferenz erinnerte Jensen Huang auch an Vera Rubin.

Jensen Huang sagte, dass Vera Rubin, das weltweit erste Multirack-Pod-Supercomputersystem, das speziell für Agenten-KI entwickelt wurde, nun in vollem Umfang in die Serienproduktion gegangen ist.

Vera Rubin hat die Latenzzeit zwischen 'Schließen' und 'Tool-Aufruf' auf ein empfindliches Nanosekunden-Niveau reduziert - dies ist die Grundlage für die Echtzeitfähigkeit, die Agenten-Entscheidungen erfordern. Der am stärksten revolutionäre Bestandteil ist die speziell für Agenten entwickelte Vera CPU.

Jensen Huang beschrieb diese CPU wie folgt: 'KI-Agenten werden die größten Verbraucher von Rechenressourcen sein. Vera ist die erste CPU, die speziell auf diese Zukunft zugeschnitten ist - sie verfügt über hervorragende Leistung, Energieeffizienz und Programmierbarkeit und ist speziell für die Ausführung von Agenten-KI in sehr großem Maßstab entwickelt.'

Die Vera CPU ist mit 88 Olympus-Kernen ausgestattet, nutzt die Raum-Multithreading-Technologie und verfügt über ein LPDDR5X-Speichersubsystem mit einer Bandbreite von bis zu 1,2 TB/s. Ihre Designphilosophie unterscheidet sich grundlegend von der traditionellen CPU: Traditionelle CPUs sind für Menschen konzipiert, die auf Sekundenlatenzzeiten nicht empfindlich sind; Agenten sind extrem empfindlich gegenüber Latenzzeiten und erfordern eine Nanosekunden-Reaktion. Daher muss eine völlig neue CPU-Architektur von Grund auf neu entworfen werden.

Die Leistungsdaten dieses Prozessors sind natürlich sehr gut - die Vera CPU ist bei SQL-Abfragen drei Mal schneller als die besten x86-Prozessoren, bei der Echtzeitverarbeitung von Daten der New Yorker Börse sechs Mal schneller und bei der Agenten-Sandbox-Leistung 1,8 Mal so leistungsstark wie x86. Sie ermöglicht über die zweite Generation der NVLink-C2C-Interkonnektionstechnologie eine kohärente Bandbreite von bis zu 1,8 TB/s zwischen CPU und GPU und erweitert die NVIDIA-Geheimnisrechnung auf die gesamte Rack-Skala.

Der Vera BlueField-4 STX-Prozessor integriert die Vera CPU mit Hochleistungsnetzwerken, Speicherbeschleunigung und Chip-Sicherheit, um eine AI-native Datenplattform zu schaffen, die 'sicher von der Konzeption an' ist.

DSX: Das Bauplan für die KI-Fabrik

Wie kann man diese Hardware in tatsächliche Gewinne für die Kunden umwandeln? NVIDIAs Antwort ist DSX - ein Referenzdesign für die Erstellung einer KI-Fabrik.

Die DSX (Data Center Scale eXtended)-Plattform ist ein umfassender Praxisleitfaden von NVIDIA für die Erstellung einer KI-Fabrik von Grund auf. Genauer gesagt integriert DSX quelloffene modulare Softwarebibliotheken, APIs, Referenzdesigns, NVIDIAs Rechenplattformen und die Technologien von Partnern, um eine allgemeine kooperative Entwurfplattform zu schaffen, die speziell für das Design, die Implementierung und den Betrieb von KI-Fabriken entwickelt wurde.

Die Kernkomponente DSX MaxLPS (Lowest Power per Token System) zielt direkt auf die Probleme der Autonomiebranche ab: Wie kann man die Token-Ausgabe pro Megawatt bei einem festgelegten Strombudget maximieren? Indem man die 45°C-Flüssigkeitskühlungstechnologie mit einer rackbasierten Technologie zur Optimierung der Leistung pro Watt kombiniert, ermöglicht DSX MaxLPS es den Betreibern, die GPUs nahezu ohne Beeinträchtigung der Workload-Leistung an ihrem höchsten Energieeffizienzpunkt zu betreiben und so bis zu 40 % mehr GPUs zu installieren. Für Automobilhersteller-Rechenzentren mit begrenzten Stromressourcen und kostensensitiven Rechenkapazitäten bedeutet dies, dass die gleichen Stromrechnungen für mehr Simulations-Trainingskilometer verwendet werden können.

DSX Sim bietet eine hochpräzise Simulationsschicht für den gesamten Lebenszyklus der KI-Fabrik, die NVIDIA, Partnern und Kunden hilft, Infrastrukturentscheidungen zu modellieren, zu validieren und zu optimieren, von der Planung und dem Design bis zur Implementierung und zum Betrieb. Jensen Huang betonte in seinem Vortrag: 'Mit der DSX-Plattform können Sie sogar eine ganze Fabrik vollständig simulieren, bevor Sie einen Cent ausgeben, und die Leistung überprüfen, bevor Sie ein einziges Rack installieren.'

DSX Flex verbindet die KI-Fabrik mit dem Stromnetzdienst, sodass sie die Workload dynamisch anhand von Netzsignalen wie Lastreduzierung, Bedarfsantwort und Strompreisfluktuationen anpassen kann. Dies steht in einem interessanten Zusammenhang mit der Vision der 'V2G (Vehicle-to-Grid)'-Autonomisierung: Zukünftige Autonomie-Rechenzentren sind nicht nur Verbraucher von Rechenleistung, sondern auch 'flexible Lasten' des Stromnetzes, die im Stromspitzenzeitraum Strom in das Netz zurückspeisen und im Spitzenlastzeitraum Modelle trainieren.

Physikalische KI und Roboter: Cosmos 3, Alphamale 2 und Isaac GR0K

Der letzte Teil des Vortrags ging auf den entscheidenden Sprung der Agenten von der digitalen in die physische Welt ein.

Jensen Huang erwähnte, dass das zentrale Problem der physikalischen KI die Daten sind. Internettexte sind meist aus der 'dritten Person' geschrieben, während Roboter Daten aus der 'ersten Person' der physischen Welt benötigen. NVIDIAs Lösung ist Cosmos 3 - ein offenes Basis-Modell der physischen Welt, das als visuell-sprachliches Modell physische Szenen verstehen, physisch genaue synthetische Videos generieren und als Simulator den Trainingszyklus der Strategie abschließen kann. Es ist auch die Grundlage der Omniverse-Digitalen Zwillingsplattform. Es unterstützt die Entwicklung aller Arten von Robotern und physikalischen Systemen, ist vollständig offen und lässt sich vom Benutzer anpassen.

Im Bereich der Autonomisierung hat NVIDIA Alphamale 2 vorgestellt - das weltweit erste offene, schließfähige Autonom