StartseiteArtikel

Der leitende Analyst von Bernstein: Dies ist der erste echte „Chip-Superzyklus“ in meiner Karriere, und die „Engpässe“ sind der wahre Wohlstandsbringer.

36氪的朋友们2026-06-23 08:45
Stacy Rasgon, Staranalyst bei Bernstein, ist der Ansicht, dass die Halbleiterindustrie vor einem beispiellosen echten "Superzyklus" steht, da die Investitionen in die KI-Infrastruktur sich rasch 4,4 % des US-BIP nähern.

Der Star-Analyst von Bernstein, Stacy Rasgon, ist der Ansicht, dass die Halbleiterindustrie angesichts des rasanten Wachstums der Investitionen in die KI-Infrastruktur, die fast 4,4 % des US-BIP erreichen, einen echten, beispiellosen „Superzyklus“ erlebt.

Am 21. Juni veröffentlichte das auf neueste Technologien fokussierte Podcast Tech Surge Deep Tech Podcast die neuesten Interviewaufzeichnungen. Michael Marks, Gründungs-Managing Partner von Celesta Capital, führte ein tiefgreifendes Gespräch mit Stacy Rasgon, dem bekannten Halbleiteranalysten von Bernstein, durch.

In dem fast einstündigen Gespräch diskutierten beide Seiten eingehend über das Umsatzwachstum der Halbleiterbranche, das Übergehen von der KI-Trainingsphase zur Inferenzphase, die Kapazitätsengpässe in allen Teilen der Lieferkette sowie die nachhaltige Wachstumsmöglichkeit der Branche in Zukunft.

(Links: Michael Marks; Rechts: Stacy Rasgon)

Im Gegensatz zu den meisten Wall-Street-Analysten hat Rasgon einen Doktorgrad von der Massachusetts Institute of Technology und ist ein reiner Ingenieur. Dies macht ihn auf die etablierten physikalischen Gesetze und die Kapitalflüsse besonders bedacht.

Rasgon hat klar darauf hingewiesen, dass die Halbleiterindustrie derzeit eine Nachfrageexplosion erlebt, wie er sie in seiner Karriere noch nie gesehen hat. Im vergangenen Jahr hat der Gesamtumsatz der Halbleiterbranche die 800 Milliarden US-Dollar-Marke überschritten, und in diesem Jahr strebt er auf eine Größe von 1,3 Billionen US-Dollar zu.

Rasgon hat in dem Interview gesagt:

Im Laufe meines gesamten Berufslebens habe ich ständig das Wort „Superzyklus“ gehört. Und dies könnte der erste sein, den ich wirklich gesehen habe. Der einzige Ton, den wir jetzt hören, ist, dass niemand über genügend Rechenleistung verfügt.

Rasgon hat betont, dass der Fokus des Marktes derzeit von der „Modelltrainingsphase“ zur „KI-Inferenzphase“ verschoben wird, was der Kern für die kommerzielle Monetarisierung ist. Gleichzeitig breiten sich die Kapazitätsengpässe von den GPUs auf die HBM-Speicher, die Halbleitergeräte und sogar die Stromversorgung aus.

In Zukunft werden die kundenspezifischen Chips (ASIC), repräsentiert durch Broadcom, und die GPUs von NVIDIA in dem sich ständig ausdehnenden Inkrementmarkt langfristig nebeneinander existieren und diese fast unendliche Rechenleistungsnachfrage gemeinsam bewältigen.

01

Das „Maulwurfschlagen“ in der Lieferkette: Die gesamte Branche wird von der KI zwangsweise vorangetrieben

Mit der Öffnung des unerschöpflichen Bedarfs an KI-Rechenleistung zeigt der Markt einen eigenartigen „Maulwurfschlag-Effekt“ – die Kapazitätsengpässe brechen nacheinander in der Lieferkette aus.

Rasgon hat dieses Phänomen detailliert analysiert:

Alles wird von dieser unersättlichen Nachfrage nach KI-Rechenleistung vorangetrieben. In meiner Karriere habe ich noch nie so etwas in dieser Größe gesehen. Die Lage hat sich von den Beschleunigern auf die Speicher, dann auf die Halbleiterherstellungsgeräte, das Netzwerk und die optischen Bauteile, die Leistungshalbleiter und jetzt sogar auf die CPUs ausgeweitet, die ebenfalls knapp sind.

Nehmen wir die Speicherindustrie als Beispiel. Sie erlebt derzeit den stärksten Aufwärtstrend aller Zeiten, und die Preise verdoppeln sich jedes Quartal. Der zentrale Treiber dahinter ist der HBM (High-Bandwidth Memory). Rasgon hat ein wichtiges Daten-detail preisgegeben:

In der Siliziumfläche eines KI-Chips kann mehr als 85 % HBM sein.

Noch wichtiger ist das Problem des „Trade-Ratios“. Er hat gesagt:

Aufgrund des Ausbeuteverlusts bei der Stapeltechnik und der Belegung des Logik-Die-Speichers benötigt die Herstellung von 1 GB High-Bandwidth-Speicher etwa vier Mal so viel Siliziumfläche wie ein Standard-DRAM.

Dies bedeutet, dass selbst wenn die Waferfabriken wild Kapazitäten erweitern, die tatsächliche Zunahme der Speicherkapazität (in Bits) immer noch sehr begrenzt ist.

Diese extreme Nachfrage hat sogar Unternehmen, die in einer schwachen Position sind, überraschend profitieren lassen. Bei der Diskussion über das Server-CPU-Geschäft von Intel hat Rasgon unverblümt darauf hingewiesen, dass die aktuelle Servernachfrage so stark ist, dass Intel sogar einen Anstieg der Gewinnspanne erzielt hat:

Die Nachfrage ist so stark, dass sie sogar die Bestände verkauft haben, die sie früher abgeschrieben und wie Müll in der Ecke des Lagerraums liegen gelassen haben. Die Kunden sagen jetzt: „Es ist uns egal, wir nehmen es, bitte verkaufen Sie es uns.“

02

Der Wendepunkt ist gekommen: „Man kann kein Geld mit dem Trainieren von Modellen verdienen“

Obwohl Milliarden von US-Dollar in die Branche fließen, ist die größte Sorge auf dem Markt, ob dieses Wachstum nachhaltig ist und wo sich der Vorstellungsraum befindet.

Rasgon hat den Ausweg direkt auf die „Inferenz“ gerichtet. Er hat betont, dass zuvor eine Menge Geld für das Training von großen Modellen ausgegeben wurde, aber dies ist nicht das Ende der Kommerzialisierung. Rasgon hat gesagt:

Man kann kein Geld mit dem Trainieren von Modellen verdienen … Man muss in der Lage sein, die Modelle anzuwenden, und das ist die Inferenz.

Dieser Wandel hat sich bereits in den erstaunlichen Daten von Start-ups niedergeschlagen. Rasgon hat in dem Interview Daten zitiert und gesagt, dass bei Unternehmen wie Anthropic die Laufrate des Jahresumsatzes vertikal ansteigt:

Im Dezember vergangenen Jahres betrug sie 9 Milliarden US-Dollar, im Januar dieses Jahres stieg sie auf 14 Milliarden US-Dollar, und in jüngster Zeit (April) hat sie bereits 30 Milliarden US-Dollar erreicht.

Darüber hinaus hat sich mit der jüngsten Übernahme von Groq durch NVIDIA die segmentierte Nachfrage auf dem Inferenzmarkt hervorgetan. Rasgon hat darauf hingewiesen, dass nicht alle Daten-„Token“ den gleichen Wert haben.

Für bestimmte Inferenztasks, die eine sehr geringe Latenz und eine sehr schnelle Reaktion erfordern, haben kundenspezifische Chips oder spezielle Inferenzarchitekturen oft eine bessere Wirtschaftlichkeit als allgemeine GPUs.

03

Die kundenspezifischen ASICs und die GPUs sind kein Nullsummenspiel

Angesichts der explodierenden Inferenznachfrage stößt die Tendenz der kundenspezifischen Chips (ASIC) auf das absolute Monopol der GPUs. Broadcom ist der größte Benefizient dieser Tendenz.

Rasgon hat bei der Erwähnung von Broadcom gesagt:

Vor dem Beginn all dies hat Broadcom gesagt, dass die Halbleiterbranche eine reife Branche ist, die nur ein mittelmäßiges einstelliges Wachstum hat. Aber jetzt hat alles explodiert. (Broadcom) Sie sagen, dass sie im nächsten Jahr einen KI-Umsatz von 100 Milliarden US-Dollar erzielen können.

Warum sind die großen Cloud-Dienstleister so an der Eigenentwicklung von ASICs interessiert? Rasgon ist der Ansicht, dass dies nicht nur aus Gründen der Leistungsoberfläche, sondern auch um Verhandlungsmacht gegenüber NVIDIA mit seiner hohen Gewinnspanne von 75 % zu haben. Rasgon hat gesagt:

Zumindest wenn Sie am Verhandlungstisch sitzen und mit Jensen Huang über das nächste Jahrvertrag verhandeln, möchten Sie etwas auf der Hand haben.

Aber Rasgon hat betont, dass dies kein Spiel ist, bei dem einer den anderen ersetzt. Wenn die ASICs einen größeren Anteil einnehmen, ist das, weil der gesamte Kuchen größer geworden ist.

Für große, stabile und intern entwickelte Workloads können die ASICs eine niedrigere Gesamtbetriebskosten bieten. Aber wenn sich die Modellstruktur ändert, ist der Vorteil der Programmierbarkeit der GPUs unersetzlich. Rasgon ist der Ansicht:

Das eigentliche Problem ist: Wächst die Chance, die uns vorliegt, noch? Wenn sie groß genug ist, werden beide gedeihen; wenn nicht, sind alle verloren.

04

Die endgültige Obergrenze der Zukunft: Das Stromnetz kann es möglicherweise nicht mehr aushalten

Als er gefragt wurde, welche Risiken der Markt möglicherweise übersehen könnte, hat Rasgon den Fokus von Code und Silizium auf die physische Infrastruktur der realen Welt – die Stromversorgung – gelegt.

Der Kapitalausgaben der Cloud-Riesen haben in diesem Jahr bereits 600 Milliarden US-Dollar erreicht. Wenn die Infrastrukturausgaben in Zukunft gemäß der Vorhersage von NVIDIA im Bereich von 3 bis 4 Billionen US-Dollar pro Jahr liegen, wird das bestehende Energiesystem der Menschheit zusammenbrechen.

Rasgon hat ein von ihm zuvor erstelltes Berechnungsmodell geteilt:

Haben wir überhaupt genug Strom, um dies zu tun? Das Stromnetz kann es möglicherweise nicht aushalten. Die Stromkapazität in den USA muss in den nächsten zehn Jahren jährlich um etwa 5 % wachsen. Und in den Augen der Stromgeräteanalysten ist ein jährliches Wachstum von 5 % überhaupt nicht erreichbar.

Dies bedeutet, dass der nächste Schritt der KI-Innovation und die Lösung der Engpässe unweigerlich in den Bereichen der Energieerzeugung, der Kühlung und der Kernenergie liegen werden. Wie er immer glaubt:

Unterschätzen Sie nie die Intelligenz der Menschen. Wenn es profitabel ist, werden die Ingenieure immer einen Weg finden.

Insgesamt wird solange die KI-Nachfrage nicht plötzlich zusammenbricht, der „Superzyklus“ der gesamten Halbleiterlieferkette weiterhin andauern. Und die Kapitalmärkte müssen sich an diese ständig wandernden „Kapazitätsengpässe“ in allen Teilen der Kette halten.

Dieser Artikel stammt aus dem WeChat-Account „Wall Street News Max“. Autor: Bao Yilong. 36Kr hat die Veröffentlichung mit Genehmigung durchgeführt.