StartseiteArtikel

Wall Street ist nicht von der NVIDIA GTC-Präsentation überzeugt. Kann Jensen Huang keine neuen Geschichten erzählen? | Krypton Gold - Große Ereignisse

宋婉心2025-03-20 11:27
Nach der Sitzung fiel der Anteil von NVIDIA um mehr als 3 Prozent.

Autor | Song Wanxin

Redakteur | Zheng Huaizhou

Am frühen Morgen des 19. März Ortszeit in Peking trat Jensen Huang, CEO von NVIDIA, auf der GTC 2025 zur Rede.

Nach der Einführung von DeepSeek Anfang dieses Jahres hat die Strategie des günstigen Preises in gewissem Maße die Erwartungen des Marktes an das Wachstumspotenzial von NVIDIA bei hohem Rechenleistungswachstum beeinflusst. Die Aktienkurse von NVIDIA sind sogar schwankend gefallen. Daher ist diese GTC von entscheidender Bedeutung für die Wiederherstellung des Marktkredits.

Obwohl die Strategie des günstigen Preises langfristig das Wachstum der Gesamtrechenleistungserwartungen fördern wird, ist NVIDIA kurzfristig in eine "Produktübergangsphase" geraten.

Unter der großen Umstellung, dass die Kunden auf Kosteneffizienz bedacht sind, hat NVIDIA die Wahl, entweder die Geschichte des günstigen Preises bis ins Extreme zu treiben oder eine völlig neue Geschichte zu erzählen.

Aus dem Vortrag geht hervor, dass Jensen Huang sich für ersteres entschieden hat. Die Reaktion von Wall Street auf die Veröffentlichungen war eher nüchtern. Am Dienstag schloss NVIDIA mit einem Rückgang von über 3 % und nach Börsenschluss fiel es noch um weitere 0,56 %.

Was die Reaktion des Sekundärmarktes betrifft, meinen einige Analysten, dass der Inhalt von Jensens Vortrag größtenteils altbekannt ist und nicht über die Markt-Erwartungen hinausgeht, was die Anleger nicht begeistern konnte. Die aufkommenden Bereiche wie Robotik und Quantencomputing, die Jensen Huang erwähnt hat, haben zwar ein großes Potenzial, aber es wird noch eine lange Zeit dauern, bis sie tatsächliche Einnahmen generieren können und kurzfristig keine neuen Einnahmequellen werden können.

01 Höchste Kosteneffizienz

Einer der am meisten beachteten Schwerpunkte der Pressekonferenz war der CPO-Switch.

NVIDIA hat die neue Siliziumphotonik-Technologie NVDIA Photonics vorgestellt. Laut Angaben ersetzt diese Technologie die herkömmlichen steckbaren optischen Transceiver durch gemeinsam verpackte Optik (CPO), so dass die Glasfasern direkt an den Switch angeschlossen werden können, was den Stromverbrauch im Rechenzentrum erheblich reduziert.

Nach Schätzungen von NVIDIA kann diese Technologie den Stromverbrauch um 40 MW senken und die Netzwerkübertragungseffizienz von AI-Rechenclustern verbessern, was die Grundlage für zukünftige Super-Rechenzentren für Künstliche Intelligenz legt.

Basierend darauf hat NVIDIA die Siliziumphotonik-Netzwerkswitches Spectrum-X und Quantum-X vorgestellt, die als "die fortschrittlichsten Netzwerk-Lösungen der Welt" bezeichnet werden und es ermöglichen, die AI-Fabriken auf Millionen von GPUs auszuweiten.

Dass CPO von NVIDIA in die Planung genommen wird, war innerhalb der Markt-Erwartungen.

Zunächst im Übergang von der Trainingsphase zur Inferenzphase beginnen die Kunden, über Kostensenkung und Effizienzsteigerung nachzudenken. NVIDIA muss daher noch präziser arbeiten, was auch die Verbesserung der gesamten Leistung und Effizienz durch die Innovation in den oberen und unteren Teilen der Chip-Industrie beinhaltet.

Jensen Huang sagte live auf der Konferenz, dass die Anwendung dieses Systems in einem einzelnen Rechenzentrum Dutzende von Megawatt Energie sparen kann, und 60 Megawatt entsprechen der Energieverbrauch von 10 Rubin Ultra-Racks.

Außerdem war auch das Problem, das NVIDIA mit dem GB200 hatte, ein Faktor. Früher hatte der GB200 eine Reihe von Problemen wie zu langsamer Lieferung, schlechter Wärmeableitung und niedriger Ausbeute. Eine Lösung von NVIDIA war es, die Komplexität der Projektlieferung durch CPO-Switches und andere untere Teile der Wertschöpfungskette zu verringern.

Aufgrund der deutlichen Kostensenkung und Effizienzsteigerung von CPO setzen die führenden Hersteller alles daran, sich in diesem Bereich zu positionieren.

Neben NVIDIA hat kürzlich TSMC in Zusammenarbeit mit Broadcom einen Mikroring-Modulator entwickelt, der die 3-nm-Produktionstests bestanden hat und die Grundlage für die Integration von Spitzen-AI-Chips in CPO-Module legt. Marvell hat angekündigt, dass seine nächste Generation von benutzerdefinierten XPU-Architekturen die CPO-Technologie verwenden wird. IBM hat ebenfalls angekündigt, dass seine Forscher ein neues CPO-Verfahren entwickelt haben.

Die Branchenanalysesoftware Lightcounting hat festgestellt, dass selbst Inferenzcluster in den nächsten drei Jahren möglicherweise bis zu 1.000 GPUs benötigen könnten, um größere Modelle zu unterstützen. CPO (Commonly Packaged Optics) könnte die einzige Option sein, um Tausende von Hochgeschwindigkeits-Verbindungen in einem 4- bis 8-Rack-System bereitzustellen.

Außerdem hat NVIDIA aufgrund der schlechten Rückmeldungen über den GB200 den GB300 auf die höchste Priorität gesetzt. Der Markt hofft auch, dass der neu veröffentlichte GB300 die Probleme des früheren GB200 lösen kann.

Nach den Informationen aus der Pressekonferenz hat die Leistung des Blackwell Ultra GPU (GB300) im Vergleich zum Vorgänger GB200 um 50 % zugenommen, etwa 15 P FLOPS (basierend auf dem niedrigpräzisen Vier-Bit-Fließkommaformat FP4-Standard). Im Hinblick auf den Arbeitsspeicher ist es mit dem fortschrittlichsten HBM3E im Bereich ausgestattet, das von 192 GB auf 288 GB erhöht wurde.

Dieser neue GPU, der nach der DeepSeek-Ära veröffentlicht wurde, ist von NVIDIA auch eindeutig als "speziell für die Inferenz von AI-Modellen entwickelt" positioniert und berücksichtigt gleichzeitig die "Effizienz bei der Trainingsphase und in verschiedenen Szenarien von AI-Anwendungen".

Nach Angaben von Jensen Huang ist die Blackwell-Serie jetzt vollständig in Produktion. "Die Produktion ist erstaunlich, und die Nachfrage der Kunden ist ebenfalls erstaunlich, denn in der Künstlichen Intelligenz hat ein Wendepunkt erreicht. Aufgrund der Inferenz-Künstlichen Intelligenz sowie der Inferenz-Künstlichen Intelligenz-Systeme und der Training von Agentensystemen hat die Rechenleistung, die in der Künstlichen Intelligenz-Branche erbracht werden muss, erheblich zugenommen."

02 Die NVIDIA-Geschichte nach der DeepSeek-Ära

Das unerwartete Auftauchen von DeepSeek dieses Jahr hat die Aktienkurse von NVIDIA schwer getroffen, und die Verlustrate innerhalb des Jahres hat bereits über 9 % erreicht.

Und aus der neuesten Geschäftsbericht geht hervor, dass die Leistung von NVIDIA nicht mehr so beeindruckend ist. Im vierten Quartal des Geschäftsjahres 2025 betrug die Bruttomarge (GAAP) von NVIDIA 73 %, was unter der Markt-Erwartung von 73,4 % liegt, und die Bruttomarge fällt weiter.

Selbst ohne DeepSeek war es vorhersehbar, dass die Wachstumsrate von NVIDIA verlangsamen würde. Hinzu kommen noch viele Faktoren, die die Entwicklung von NVIDIA bedrohen - die Konkurrenten führen einen Preiskampf, der größte Kunde von NVIDIA entwickelt seine eigenen AI-Chips, und der Handelskrieg macht die Dinge in vielen Aspekten komplizierter.

Laut einer früheren Meldung von Bloomberg hat Jensen Huang kürzlich Unmut über die Branchenentwicklung geäußert. Nach Jahren der Infrastrukturentwicklung in der Künstlichen Intelligenz möchte er nun so bald wie möglich wichtige AI-Anwendungen außerhalb der Technologiebranche sehen.

Offensichtlich ist es schwer, die Zweifel des Marktes an der Nachfrage nach Rechenleistung zu beseitigen, bevor weit verbreitete AI-Anwendungen auftauchen. Jetzt, wenn Jensen Huang auf der Bühne erneut ruft: "Je mehr Sie kaufen, desto mehr sparen Sie", bringt es auch kaum noch Ergebnisse.

Vor der GTC-Konferenz war es daher von der Meinung, dass NVIDIA dringend eine "neue Geschichte" braucht. Aber die Pressekonferenz hat nicht den Erwartungen des Marktes entsprochen. Jensen Huang hat sich entschieden, den Markt weiterhin davon zu überzeugen, dass die von ihm vertretene Logik - das Skalierungsgesetz - stimmt.

Jensen Huang hat darauf hingewiesen, dass das Skalierungsgesetz in der Inferenzphase erst begonnen hat. Je mehr man vor der Beantwortung einer Frage nachdenkt, desto besser ist das Inferenz-Ergebnis. Dies ist ein rechenintensiver Prozess.

Am Beispiel des Platzierens von Gästen bei einer Hochzeitsfeier durch KI wurde gezeigt, dass der von dem Inferenz-Modell DeepSeek R1 verbrauchte Rechenaufwand 150-mal höher ist als der eines herkömmlichen großen Modells, und der Token-Verbrauch ist auch 20-mal höher.

Jensen Huang hat sogar eine Prognose aufgestellt: "Die letzten zwei Jahre waren nur der Anfang der KI-Welle. Mit dem sprunghaften Anstieg der Anforderungen an große KI-Modelle und Inferenzrechnungen wird die Kapitalausgaben in Rechenzentren sprunghaft steigen. Bis 2028 wird der gesamte Marktvolumen auf über 1 Billion US-Dollar ansteigen. Und NVIDIA ist der Marktführer und der Kernlieferant dieses Marktes."

Langfristig gesehen ist Jensens Prognose richtig, aber ob die Aktienkurse von NVIDIA kurzfristig gestärkt werden können, hängt von den Fortschritten des Blackwell Ultra im zweiten Halbjahr dieses Jahres ab. Es ist vorhersehbar, dass die Aktienkurse von NVIDIA in der kurzen Produktübergangsphase unter Druck stehen werden.

Abonnieren Sie uns für mehr Neuigkeiten