Nach 9 Jahren liefert Jensen Huang erneut persönlich an Elon Musk aus. Die AI-Persönliche Superrechner, die über ein halbes Jahr hinaus hinausverlegt waren, sind endlich da.
Heute endete der elfte Flug des Starships erfolgreich. Niemand hätte gedacht, dass Jensen Huang auch vor Ort erschien.
Tatsächlich flog Jensen Huang persönlich zum Starbase in Texas. Neben dem aufstrebenden Starship wollte er Musk einen frisch gebackenen neuen "Nuklearbombe" in die Hände drücken.
Das ist es, worauf man seit Anfang des Jahres gewartet hat - NVIDIA DGX Spark, ein persönlicher AI-Supercomputer.
Dieser Moment ließ die DNA aller alten Techfans aufspringen und kehrte sie ins Jahr 2016 zurück.
Damals war Musk noch Mitbegründer von OpenAI und hatte sich nicht mit Altman zerstreitet. Huang brachte persönlich den weltweit ersten DGX-1-Supercomputer in das Büro ihrer Startup-Firma.
Huang sagte damals scherzend:
Wenn dies das einzige ausgelieferte Produkt wäre, würde das Projekt 2 Milliarden US-Dollar kosten.
Dieser "2-Milliarden-Dollar-Riese" markierte den Beginn der ganzen Ära der großen Modelle.
Im nächsten Jahr veröffentlichte Google eine neue Architektur für das Training von neuronalen Netzen, den Transformer.
Dieser neue Durchbruch wurde von Sutskever genutzt, um OpenAI zu leiten und das erste GPT-Modell zu entwickeln. Alles basierte auf Nvidias Supercomputern.
9 Jahre vergingen. Musk gehört inzwischen regelmäßig zu den reichsten Menschen der Welt, und Huang leitet eine Firma, die einst die höchste Marktkapitalisierung weltweit hatte.
Das von NVIDIA gelieferte DGX ist diesmal kein riesiger Gegenstand, sondern ein "Leistungskünstler", der auf Ihrem Schreibtisch Platz findet. Es kündigt erneut auf die coolste Art an: Eine Ära der AI-Supercomputer für jeden beginnt hier.
Ein Spoiler: APPSOs DGX Spark ist unterwegs. Wir werden Ihnen später weitere Erfahrungsberichte liefern. Bleiben Sie dran!
Ehrlich gesagt war es nicht einfach, dass dieses DGX Spark endlich in Musks Hände kam.
Seit seiner beeindruckenden Premiere auf der CES im Januar dieses Jahres unter dem Namen "Project Digits" hat NVIDIA die ursprünglich geplanten Veröffentlichungsdaten im Mai und im Sommer verpasst und bisher keine Auslieferungen vorgenommen. Dieses halbe Jahr Wartezeit ließ viele Menschen unsicher werden. Viele Entwickler glaubten sogar, dass das Projekt komplett ausgefallen wäre.
Obwohl die Firma stillschweigend blieb, deuten die Spekulationen in der Branche auf seinen Kern - den Grace Blackwell GB10-Chip - hin. Dieser Chip ist ein "Kombikrieger". Der Blackwell-GPU-Teil (dieselbe Architektur wie in der bekannten Grafikkarte 5090) war bereits fertig, aber der gemeinsam mit MediaTek entwickelte Grace-CPU-Teil konnte in der Produktion nicht mithalten und verhinderte so den Fortschritt des gesamten Projekts.
Die Geschichte von "Alles ist bereit, nur der CPU fehlt" hat sich unerwartet bei NVIDIA ereignet.
Während Wettbewerber wie der M3 Ultra Mac Studio mit hoher Speicherbandbreite die Aufmerksamkeit auf sich ziehen, lohnt es sich noch immer, auf diesen verspäteten DGX Spark zu warten, der auch 1000 US-Dollar teurer ist als ursprünglich vermutet?
Die Antwort ist: Absolut! Denn es geht seinen eigenen Weg und trifft die Probleme direkt auf den Kopf.
Nach einem halben Jahr Wartezeit, wo liegt der "Charme" des DGX Spark? APPSO führt Sie durch die Highlights.
Das Herzstück des gesamten Computers ist der Grace Blackwell GB10-Superchip.
Er kombiniert einen 20-Kern-ARM-Architektur-Grace-CPU und eine leistungsstarke Blackwell-GPU in einem einzigen Superchip.
Er bietet eine AI-Berechnungsleistung von bis zu 1 Petaflop (Billionen von Floating-Point-Operationen pro Sekunde) und ermöglicht es Ihnen, die Leistung eines Rechenzentrums direkt an Ihrem Schreibtisch zu erleben.
Der DGX Spark hat noch einen Trumpf: Der CPU und der GPU sind über die NVIDIA NVLink™-C2C-Technologie nahtlos verbunden und teilen einen riesigen gemeinsamen Arbeitsspeicher von 128 GB.
Die Bandbreite dieser Verbindungstechnologie ist fünfmal höher als die herkömmlichen PCIe-Generierung 5, was eine nahezu verzögerungsfreie Hochgeschwindigkeitsdatenübertragung zwischen CPU und GPU gewährleistet.
Obwohl seine Speicherbandbreite (273 GB/s) auf Papier weit hinter der des Mac Studio M3 Ultra (819 GB/s) zurückbleibt, verfolgt NVIDIA die Strategie "Macht bringt Erfolg".
Bei AI-Aufgaben, insbesondere beim Training großer Modelle, ist die Fähigkeit, das gesamte Modell auf einmal in den Arbeitsspeicher zu laden, strategisch wertvoller als reine Bandbreitenzahlen. Das bedeutet, dass Sie direkt an Ihrem Schreibtisch ein riesiges Sprachmodell mit bis zu 200 Milliarden Parametern reibungslos ausführen können, ohne komplexe Modellpartitionierung vornehmen zu müssen. Eine solche Erfahrung gibt es sonst nirgendwo.
Der Blackwell-GPU ist mit fünften Generation Tensor Cores ausgestattet und unterstützt ultra-niedrige Genauigkeitsformate wie FP4/FP8. Die Leistung ist im Vergleich zur vorherigen FP8-Generation um das Fünffache gesteigert.
Das ist wie ein "Turbo-Modus" für die AI-Berechnung, der die Inferenzgeschwindigkeit sprunghaft steigert und gleichzeitig ein beispielloses Energieeffizienzverhältnis aufweist.
Benötigen Sie mehr Leistung? Der DGX Spark verfügt über einen eingebauten NVIDIA ConnectX®-7 200 Gb/s Netzwerkschnittstelle. Sie können problemlos zwei Geräte verbinden und einen Mikrocluster mit 256 GB gemeinsam genutztem Arbeitsspeicher erstellen.
NVIDIA behauptet, dass eine solche Kombination ausreichend ist, um gigantische Modelle mit bis zu 400 Milliarden Parametern zu verarbeiten, was weit über das Vorstellungsvermögen eines einzelnen Entwicklers hinausgeht.
Abgesehen von der Hardware sollten Sie nicht vergessen, dass NVIDIA mit seiner Software-Ökosystem seinen stärksten Wettbewerbsvorteil hat. Der DGX Spark kommt mit einem kompletten NVIDIA AI-Software-Stack, einschließlich CUDA-Bibliothek, TensorRT und verschiedenen NVIDIA NIM™ Microservices, vorinstalliert. Alles ist in einem maßgeschneiderten DGXOS (basierend auf Ubuntu) integriert und für Sie optimiert.
Das bedeutet, dass Sie keine Zeit mit Kompatibilitätsproblemen verschwenden müssen und direkt nach dem Auspacken loslegen können. Für Entwickler ist die Zeitersparnis unschätzbar.
Diese " Jahrhundertübergabe" am Starbase ist nur der Anfang.
Ab dem 15. Oktober wird der DGX Spark über die NVIDIA-Website und globale Partner offiziell verkauft. Der Preis beträgt 3999 US-Dollar. Fast alle PC-Riesen wie Acer, Asus, Dell und Lenovo haben umgehend reagiert.
Ehrlich gesagt, ist dieser Preis 1000 US-Dollar höher als ursprünglich zugesagt und liegt in der gleichen Größenordnung wie der des topmodellierten Mac Studio M3 Ultra. Aber ihre Zielgruppen sind völlig unterschiedlich: Der DGX Spark kommt mit DGXOS (basierend auf Ubuntu) vorinstalliert und kann kein Windows oder macOS ausführen. Es ist ein reines "Kampfmaschine" für AI-Entwickler und Hardcore-Fans.
Sein Reiz liegt darin, dass Sie für 4000 US-Dollar die Fähigkeit erwerben, ein 200-Milliarden-Parameter-Modell lokal zu trainieren, sowie die volle Unterstützung der gesamten CUDA-Ökosystem. Für Fachleute, die sensible Daten lokal verarbeiten müssen, die maximale Leistung anstreben oder ihre eigene AI-Arbeitsabläufe vollständig kontrollieren möchten, ist dieser Preis tatsächlich sehr konkurrenzfähig.
Wenn Sie weitere Details über diesen "Einseitigen" wissen möchten, geben Sie uns bitte in den Kommentaren bescheid.
Dieser Artikel stammt aus dem WeChat-Account "APPSO", geschrieben von jemand, der zukünftige Produkte entdeckt. 36Kr hat die Veröffentlichung mit Genehmigung übernommen.