NVIDIA AI Supercomputer wird ab 3999 Yuan verkauft. Mit ihm können alle Open-Source-Modelle mit großen Parametern "in der Handfläche" bereitgestellt werden.
Das persönliche AI-Supercomputer-System DGX Spark von NVIDIA ist jetzt auf dem Markt! Es verfügt über 128 GB einheitlichen Arbeitsspeicher (regulärer Systemspeicher + GPU-Speicher). Darüber hinaus können zwei DGX Spark-Systeme miteinander verbunden werden, um direkt ein 405-Milliarden-Parameter-Großmodell (FP4-Präzision) auszuführen. Dies kommt bereits dem derzeit größten Open-Source-Modell sehr nahe! Mit einer so beeindruckenden Leistung ist es dennoch erstaunlich ruhig und elegant. Es ist etwa so groß wie ein Mac mini und kostet nur 3.999 US-Dollar!
Für nur 3.999 US-Dollar können Sie einen Mini-AI-Supercomputer-Desktopcomputer nach Hause nehmen!
Das nur so groß wie die Hand von Jensen Huang messende NVIDIA DGX Spark ist offiziell auf den Markt gekommen!
NVIDIA wird am Mittwoch, dem 15. Oktober, über Nvidia.com und dritte Händler mit dem Verkauf beginnen.
Dies ist kein herkömmlicher Desktopcomputer für Privatpersonen, sondern ein Mini-PC für AI-Entwickler, der endlich für den Markt bereit ist!
Schauen wir uns zunächst die technischen Spezifikationen an:
Es ist mit einem NVIDIA GB10 Grace Blackwell Super-Chip ausgestattet.
Dieser Mini-Computer, der etwa so groß wie ein Mac mini ist, wiegt 2,6 Pfund (etwa 1,18 kg).
Es bietet 1 PFLOPS an FP4-AI-Leistung.
128 GB konsistenter, einheitlicher Systemspeicher.
ConnectX-7 intelligente Netzwerkkarte.
Speicherplatz von bis zu 4 TB.
Maße: 150 mm Länge x 150 mm Breite x 50,5 mm Höhe.
Es ist eher ein Computer für AI-Training als ein universeller Rechner.
Das DGX Spark läuft mit NVIDIA DGX OS, einer maßgeschneiderten Version von Ubuntu Linux, statt Windows und ist bereits mit AI-Software konfiguriert.
Jensen Huang hält sein Versprechen vom GTC ein
Die Zeit der persönlichen AI-Supercomputer ist angebrochen
Bei der NVIDIA GTC-Konferenz im März dieses Jahres hat Jensen Huang gleichzeitig zwei persönliche AI-Supercomputer, den DGX Spark und den DGX Station, vorgestellt.
Der Spark war zuvor unter dem Namen "Digits" bekannt und ist der "weltkleinste AI-Supercomputer", der etwa so groß wie ein Mac mini ist!
Der Preis für den größeren Station-Modell ist bisher noch nicht bekannt. Er richtet sich hauptsächlich an "AI-Entwickler, Forscher, Data-Scientisten und Studenten für die Prototypentwicklung, Feineinstellung und Inferenz von Großmodellen direkt auf dem Desktop".
Zur Feier der globalen Lieferung des DGX Spark ist Jensen Huang nach Texas in die Starship-Basis gereist, um die ersten DGX Spark-Systeme persönlich an Elon Musk, den Chefingenieur von SpaceX, zu übergeben.
Aus dem Bild kann man auch sehen, dass Musk persönlich eine Nachricht an Jensen Huang geschrieben hat.
From a single spark, A world of intelligence!
To Jensen, Ad astra!
Von einem einzigen Funken entzündet sich eine Welt der Intelligenz!
An Jensen Huang, Zum Sternenhimmel!
Die Unterschrift "J. H." in der Mitte ist die persönliche Unterschrift von Jensen Huang.
Das lateinische Wort "ad astra" bedeutet "zum Sternenhimmel" oder "hin zu den Sternen" und wird oft verwendet, um den Geist der Exploration und des Strebs nach Exzellenz auszudrücken.
Im Jahr 2016 hat Jensen Huang Musk die erste für AI optimierte GPU übergeben.
Fast 10 Jahre später, im Jahr 2025, hat Jensen Huang Musk den kleinsten künstlichen Intelligenz-Supercomputer der Welt gezeigt.
Jensen Huang hat wirklich eine besondere Zuneigung zu Musk! (Man kann nur spekulieren, was Greg Brockman dazu denken mag.)
Die Internet-Community hat auch einen Witz gemacht: Sie stellten sich vor, dass Musk nach dem Empfang des Spark aus der Box ein "MacroHard" (eine Spielerei mit "Microsoft") genommen und es an Jensen Huang geschenkt hat. Das ist wirklich sehr sinnreich.
Tiefgehende Testung des NVIDIA DGX Spark
Ein neuer Maßstab für Desktop-AI-Supercomputing
NVIDIA hat es bisher selten versucht, Supercomputer-Leistung in einen Desktop-Arbeitsplatz zu packen. Der DGX Spark ist eine bahnbrechende Neuerung.
Er bringt die Rechenleistung eines Rechenzentrums auf den Desktop, sodass Entwickler und Forscher einen persönlichen AI-Supercomputer mit einer Billion Floating-Point-Operationen pro Sekunde direkt an ihrem Schreibtisch haben können.
Im vergangenen Jahr hat sich der SGLang-Inferenz-Frameworks in der Rechenzentrum-Branche durch seine herausragende Leistung einen Namen gemacht. Dieser Frameworks hat nicht nur hervorragende Testresultate in der Inferenz-Community erzielt, sondern auch komplexe Modelle wie DeepSeek erfolgreich in großen Clustern implementiert. Mit Techniken wie der Entkopplung von Prefill-Decode (PD) und Expert Parallelism (EP) hat er die Leistung bei der Masseninferenz und die Effizienz der Entwickler auf ein neues Niveau gehoben.
Der DGX Spark bietet dem SGLang-Frameworks die Möglichkeit, vom Rechenzentrummarkt in den Markt für private Entwickler vorzudringen - indem er sein bewährtes Inferenz-Frameworks direkt an mehr Entwickler und Forscher bringt.
Design und Optik
Der DGX Spark hat ein gesamtes Metallgehäuse in Champagner-Gold. Die Vorder- und Rückseite bestehen aus einem porösen Metallschaum, der ein unverwechselbares Gefühl vermittelt und gleichzeitig die Kühlung verbessert.
Dieses Design lässt an die größeren DGX A100- und H100-Server denken.
Das gesamte Gerät ist kompakt und elegant. Wie in der Abbildung zu sehen, ist es etwa so groß wie ein Apple-Desktopcomputer, aber es verbirgt eine enorme Rechenleistung.
An der Rückseite bietet der DGX Spark eine beeindruckende Anzahl von Anschlüssen: Ein Netzschalter, vier USB-C-Anschlüsse (der linke Anschluss unterstützt eine Stromversorgung von bis zu 240 W), ein HDMI-Videoausgang, ein 10GbE RJ-45-Gigabit-Ethernet-Anschluss und zwei QSFP-Netzwerkschnittstellen (angesteuert von einer NVIDIA ConnectX-7-Netzwerkkarte mit einer Gesamtbandbreite von 200 Gb/s).
Diese Vielzahl an Hochgeschwindigkeitsanschlüssen ermöglicht es sogar, zwei Spark-Systeme direkt miteinander zu verbinden, um einen kleinen Zwei-Knoten-Cluster zu bilden, der noch größere AI-Modelle ausführen kann.
Es ist erwähnenswert, dass der Spark eine USB-C-Stromversorgung verwendet, was bei Desktopcomputern bisher noch nie gesehen wurde. Die NVIDIA hat vermutlich die Stromversorgungseinheit außerhalb des Gehäuses platziert, um den wertvollen Innenraum für das Kühlsystem freizumachen.
Dieses Design ermöglicht ein extrem kompaktes Gehäuse, aber der Nachteil ist, dass der Stromkabel nicht verrastet ist und daher leichter versehentlich herausgezogen werden kann. Deshalb muss man beim täglichen Gebrauch besonders vorsichtig sein, um es nicht versehentlich zu berühren.
Hardware-Konfiguration
Der kleine DGX Spark verbirgt eine erstaunliche Hardware-Leistung.
Im Kern befindet sich ein speziell für diesen Computer entwickelter NVIDIA GB10 Grace Blackwell Super-Chip, der 10 Cortex-X925-Hochleistungs-Kerne und 10 Cortex-A725-Energieeffiziente-Kerne vereint, insgesamt also 20 Kerne.
Dieser Chip bietet sowohl allgemeine Rechenleistung als auch eine integrierte, leistungsstarke GPU.
Bei der AI-Berechnung kann die Blackwell-GPU des GB10-Chips bei einer dünn besetzten FP4-Präzision eine Leistung von 1 PFLOPS (eine Billion Floating-Point-Operationen pro Sekunde) erreichen. Die AI-Inferenz-Leistung liegt ungefähr zwischen der des Desktop-RTX 5070 und des 5070 Ti.
Der größte Vorteil des DGX Spark ist der 128-GB-konsistente, einheitliche Arbeitsspeicher. Dies bedeutet, dass CPU und GPU denselben physischen Arbeitsspeicher nutzen und aufeinander direkt zugreifen können.
In dieser einheitlichen Architektur kann der Spark direkt ultra-große Modelle laden und ausführen, ohne Daten zwischen Systemspeicher und GPU-Speicher kopieren zu müssen. Dies reduziert die Kosten für die Datenverschiebung erheblich.
Wir können Modelle mit Hunderten von Milliarden von Parametern direkt in diesen 128-GB-Speicher laden und ausführen.
Was noch beeindruckender ist: Der Spark ist erweiterbar. Mit den beiden QSFP-Netzwerkschnittstellen (200 Gb/s Bandbreite) an der Rückseite können zwei Spark-Systeme direkt zu einem Zwei-Computer-Cluster verbunden werden.
Laut NVIDIA kann ein Doppel-Spark-Cluster Modelle mit bis zu 405 Milliarden Parametern (FP4-Präzision) verarbeiten, was bereits dem derzeit größten Open-Source-Modell sehr nahe kommt.
Der DGX Spark hat die Kombination aus "großem Arbeitsspeicher + Hochgeschwindigkeitsverbindung + Spitzen-GPU" eines Rechenzentrums in einem Gerät von weniger als 2 Kilogramm Gewicht verpackt - ein echtes Engineering-Wunder.
Natürlich hat alles seine Vor- und Nachteile.
Die Bandbreite des einheitlichen Arbeitsspeichers des Spark ist relativ begrenzt. Der verwendete LPDDR5x-Spe