OpenAI und Broadcom stellen gemeinsamen Chip vor: Kann Jensen Huang weiterhin entspannt bleiben?

Heute ist Jensen Huang in einer Situation, in der vor ihm Wölfe lauern und hinter ihm Tiger drohen.

Die Veränderungen bei Jensen Huang in den letzten Jahren bestehen darin, dass sein Haar grauer geworden ist als früher.

Manche sagen, dass graues Haar auf Genetik und Alter zurückzuführen ist, während ein Teil der Menschen der Meinung ist, dass es auf Angst und Stress zurückzuführen ist.

Im Mai 2026 sagte Jensen Huang bei einer öffentlichen Rede an der Stanford University vor Studierenden: "90 % meiner Arbeit erledige ich nur mit Mühe, aber ich gebe mein Bestes, um jede Arbeit so gut wie möglich zu erledigen."

Tatsächlich hat Jensen Huang bereits vor 33 Jahren in einem Interview über seinen Stress gesprochen. Er sagte: "Nvidia ist nur 30 Tage von der Insolvenz entfernt."

Jetzt hat Jensen Huang einen weiteren Grund für sein graues Haar, nämlich die gemeinsame Veröffentlichung des Jalapeño - Chips durch OpenAI und Broadcom.

Dies ist der erste selbst entwickelte Inference - Chip von OpenAI. Von der Entwicklung bis zur Fertigung dauerte es nur neun Monate. Das Ziel ist die Bereitstellung von 10 GW, und dieser Chip kann bereits GPT - 5.3 ausführen.

OpenAI unterscheidet sich von Anthropic. Letztere hat sowohl die Google TPU als auch die Amazon Trainium. OpenAI war bisher ein fester Nvidia - Kunde. Jetzt reicht es nicht aus, dass es Cerebras hat, sondern es arbeitet auch mit Broadcom zusammen.

01 Nvidia rasteiert weiter, aber Nvidia hat Feinde

Am 20. Mai gab Nvidia die Ergebnisse des neuesten Quartals bekannt. Der monatliche Umsatz betrug 81,6 Milliarden US - Dollar, die Bruttomarge lag bei 74,9 %, und die freie Cashflow betrug fast 49 Milliarden US - Dollar. Der Umsatz aus dem Data - Center - Geschäft belief sich auf 75,2 Milliarden US - Dollar, was einem Anstieg von 92 % gegenüber dem Vorjahr entspricht.

Offensichtlich hat Nvidia weiterhin Glück.

Aber die gegenwärtige Situation ist, dass Nvidia umzingelt wird.

Nehmen wir mal Broadcom als Beispiel. Ihre jüngsten Quartalsergebnisse waren sehr beeindruckend. Im neuesten Quartal belief sich der Umsatz aus dem AI - Halbleitergeschäft der Firma auf 10,8 Milliarden US - Dollar, was einem Anstieg von 143 % gegenüber dem Vorjahr entspricht.

Broadcom schätzt, dass der Umsatz aus diesem Geschäft im Geschäftsjahr 2026 auf etwa 56 Milliarden US - Dollar steigen wird, während er im vergangenen Geschäftsjahr etwa 20 Milliarden US - Dollar betrug.

Broadcom unterscheidet sich von Nvidia. Broadcom entwickelt ASICs, also "AI - Chips, die auf die Bedürfnisse der Kunden zugeschnitten sind". Wenn ein Kunde einen bestimmten Chip benötigt, entwickelt Broadcom diesen speziell für ihn.

Bei der heutigen AI - Rechenleistung arbeiten nicht nur einzelne Chips, sondern Tausende oder Hunderttausende von Chips bilden ein Cluster und arbeiten zusammen. Beim Training von Modellen müssen die Chips ständig Parameter austauschen; bei der Inferenz, insbesondere bei Expertenmodellen und Aufgaben mit langer Kontextlänge, müssen die Chips auch häufig Daten übertragen.

Das heißt, selbst wenn Ihre Chips extrem schnell rechnen können, wird das gesamte Rechenleistungskluster von der langsamsten Kommunikationsstrecke behindert, wenn das Netzwerk nicht mitkommt.

Das ist der Vorteil von Broadcom. Im Grunde ist Broadcom ein Kommunikationsunternehmen. Neben der Entwicklung von ASICs entwickelt es auch Hochgeschwindigkeits - Ethernet - Switch - Chips, um diese Chips zu verbinden.

Beispielsweise hat der neueste Tomahawk 6 - Switch - Chip von Broadcom eine einzelne Switch - Kapazität von 102,4 Tbps und ist für ultra - große AI - Cluster konzipiert. In der 10 - GW - Kooperationsankündigung zwischen OpenAI und Broadcom steht explizit, dass die Kooperation nicht nur die Entwicklung von maßgeschneiderten AI - Beschleunigern umfasst, sondern auch die dazugehörige Ethernet - Netzwerk - Lösung.

Außerdem ist Broadcom "neutral".

Dies ist ein Aspekt, den viele Menschen übersehen. Weder OpenAI noch Anthropic möchten ihre Kern - Chip - Projekte an eine andere Firma geben, die auch an großen Modellen und Cloud - Diensten arbeitet.

Broadcom hingegen entwickelt keine Modelle und verkauft keine Cloud - Dienste. Es konkurriert nicht mit seinen Kunden um Endkunden. Aus diesem Grund wählen sowohl OpenAI als auch Anthropic es.

Nvidia hat nicht nur Broadcom als Konkurrenten, sondern auch Amazon.

Obwohl AWS den Umsatz aus Trainium nicht separat offenlegt, hat Amazon - CEO Andy Jassy in einem Brief an die Aktionäre im April dieses Jahres angegeben, dass das selbst entwickelte Chip - Geschäft von Amazon, einschließlich Trainium, Graviton und Nitro, einen Jahresumsatz von über 20 Milliarden US - Dollar erreicht hat.

Wichtig ist, dass er dann noch hinzufügte, dass, wenn man diese Chip - Abteilung als unabhängige Firma betrachtet und alle von Amazon im Jahr 2026 hergestellten Chips zu Marktpreisen an AWS und externe Kunden verkauft, der Jahresumsatz etwa 50 Milliarden US - Dollar betragen würde.

Eigentlich wird der Trainium - Chip von Amazon zu Amazon's zweitgrößtem Geschäft.

Das Gleiche gilt für Google.

Anthropic hat im Oktober letzten Jahres die Nutzung von bis zu 1 Million Google TPU - Chips erhalten. Über 1 GW Rechenleistungskapazität wird im Jahr 2026 in Betrieb genommen. Im April dieses Jahres hat Anthropic ein neues Abkommen mit Google und Broadcom unterzeichnet, das die Nutzung von etwa 3,5 GW Rechenleistung der nächsten Generation von TPU - Chips bis 2027 sichert.

Zur gleichen Zeit hat der monatliche Umsatz von Google Cloud im ersten Quartal 2026 erstmals die Marke von 20 Milliarden US - Dollar überschritten, was einem Anstieg von 63 % gegenüber dem Vorjahr entspricht. Google hat auch angegeben, dass der Umsatz aus AI - Agent - verwandten Aktivitäten um 800 % gegenüber dem Vorjahr gestiegen ist.

02 OpenAI und Anthropic entziehen sich der Kontrolle von Nvidia

Nvidia muss nicht nur mit den umliegenden Wettbewerbern fertig werden, sondern auch mit OpenAI und Anthropic.

OpenAI hat jetzt die Rechenleistung auf zwei Wege aufgeteilt. Der eine Weg führt weiterhin über Nvidia, der andere über Cerebras und Broadcom.

Das von Cerebras Entwickelte unterscheidet sich von allen anderen AI - Chips auf dem Markt. Es verwendet Wafer - Scale - Chips, bei denen ein ganzer Wafer ein Prozessor ist, auf dem Hunderttausende von Rechenkernen sitzen. Der Hauptvorteil dieser Architektur ist, dass die Datenbewegung minimal und die Latenz extrem niedrig ist.

Für die Inferenz bedeutet eine niedrige Latenz, dass das Modell schneller antwortet.

Im Januar dieses Jahres hat OpenAI ein mehrjähriges Abkommen mit Cerebras unterzeichnet, das einen Wert von über 20 Milliarden US - Dollar hat. OpenAI hat sich verpflichtet, 750 MW Cerebras - Inferenz - Rechenleistung bereitzustellen, und die Lieferung erstreckt sich bis 2028.

Basierend auf diesem Vertrag hat Cerebras ein Betriebskapitaldarlehen von 1 Milliarde US - Dollar von OpenAI erhalten und im Mai eine IPO im Wert von 6,4 Milliarden US - Dollar abgeschlossen.

Die Jahresumsatzprognose von Cerebras liegt noch unter 900 Millionen US - Dollar, aber ein Vertrag mit OpenAI bringt dieser Firma einen Umsatz von über 20 Milliarden US - Dollar.

Ich kann sogar behaupten, dass Cerebras jetzt die Hardwareabteilung von OpenAI ist.

Der Unterschied zwischen Broadcom und Cerebras besteht darin, dass letzterer einen Rechenleistungskontrakt unterzeichnet hat. Es muss OpenAI innerhalb eines bestimmten Zeitraums eine bestimmte Menge an Inferenzdiensten bereitstellen.

Beim ersteren ist der Auftrag so gestaltet, dass OpenAI selbst die Chipentwicklung leitet. OpenAI weiß am besten, wo die Engpässe bei der Inferenz seines eigenen Modells in Bezug auf Rechenleistung, Speicher, KV - Cache und Netzwerkkommunikation liegen.

Das ist wie beim Auto kaufen. Wenn Sie nur auf der Straße fahren, brauchen Sie keine Allradantriebsreifen, Allradantrieb und Unterbodenschutz. Diese Ausstattungen sind nur beim Geländefahren nützlich und auf der Straße völlig überflüssig. So können Sie das Geld sparen und es für andere Upgrades verwenden.

Dies ist der erste selbst entwickelte Inference - Chip von OpenAI. Von der Architekturentwicklung bis zur Fertigung dauerte es nur neun Monate.

Broadcom sagt, dass dies der schnellste ASIC - Entwicklungsprozess in der Geschichte der fortschrittlichen Halbleiterindustrie ist. Der Jalapeño - Chip wurde von Grund auf neu entwickelt und speziell für die Inferenz von ChatGPT konzipiert.

GPT - 5.3 - Codex - Spark läuft bereits in der Laborumgebung auf dem Prototyp des Jalapeño - Chips mit der Ziel - Frequenz und dem Ziel - Stromverbrauch der Produktionsumgebung. Laut OpenAI ist die Leistung pro Watt "weit über dem derzeitigen Stand der Technik".

Das Ziel der Bereitstellung des Jalapeño - Chips ist 10 GW, was der Leistung von 10 großen Kernkraftwerken entspricht.

Obwohl OpenAI auf der Trainingsseite immer noch auf Nvidia - GPUs angewiesen ist. Denn das Training von fortschrittlichen großen Modellen erfordert eine sehr hohe Rechenleistung und Interkonnektivitätsbandbreite, und derzeit können nur die GPUs von Nvidia die Standards von OpenAI erfüllen.

Aber die Inferenz ist anders. Die Inferenz ist eine stabile, massenhafte und wiederholte Arbeitslast. Jeden Tag stellen hundert Millionen Menschen ChatGPT die gleichen Fragen, die Modellstruktur ändert sich nicht, und das Rechenmuster ist hochgradig vorhersehbar.

Diese Art von Arbeitslast eignet sich am besten für die Spezialisierung. Man kann alle unbenutzten Schaltungen in einem allgemeinen GPU entfernen und nur die für die Inferenz von großen Modellen benötigten Teile behalten. So wird es billig und effizient.

Anthropic geht einen anderen Weg.

Es setzt sowohl bei der Inferenz als auch beim Training auf die AWS Trainium. Die Trainium ist ein eigener AI - Chip von AWS, der sowohl für das Training als auch für die Inferenz geeignet ist.

Im April dieses Jahres hat Amazon Anthropic erneut 5 Milliarden US - Dollar investiert, so dass die Gesamtinvestition auf 13 Milliarden US - Dollar gestiegen ist, und behält sich das Recht vor, bis zu 20 Milliarden US - Dollar zusätzlich zu investieren.

Anthropic hat sich in Gegenzug verpflichtet, in den nächsten zehn Jahren mehr als 100 Milliarden US - Dollar bei AWS auszugeben und 5 GW Trainium - Rechenleistung zu reservieren, die die drei Generationen von Trainium - Chips von Trainium2 bis Trainium4 sowie Tausende von Graviton - CPUs abdeckt.

Um diesen riesigen Vertrag herum hat Amazon in Indiana zwei riesige Datencenter - Parks gebaut, das sogenannte "Rainier - Projekt", mit einer geplanten Gesamtkapazität von etwa 4,7 GW.

Ich habe einfach mal gerechnet. Wenn die beiden großen Parks von OpenAI und Anthropic rund um die Uhr betrieben werden, verbrauchen sie im Jahr 128,8 Milliarden Kilowattstunden Strom, was der Leistung von 15 großen Kernkraftwerken entspricht.

Diese Zahl mag vielleicht etwas ungreifbar erscheinen. Wenn ich sie in Wärme umrechne, verstehen Sie es besser. Bei einer Leistung von 14,7 GW verbraucht es jede Sekunde 14,7 Milliarden Joule (14,7 × 10⁹ J), was pro Tag 1,27 × 10¹⁵ Joule entspricht. Das entspricht 304.000 Tonnen TNT.

Dennoch hat dieser riesige Auftrag überhaupt nichts mit Nvidia zu tun.

03 Broadcom rückt plötzlich in den Vordergrund

Schauen wir uns abschließend Broadcom an.

Haben Sie sich jemals gefragt, warum die "Nvidia - Entfernung" - Strategien von OpenAI und Anthropic beide über Broadcom gehen müssen?

Nehmen wir OpenAI als Beispiel. Es könnte sich eigentlich auf Microsoft verlassen, schließlich bezieht OpenAI einen großen Teil seiner Rechenleistung von Microsoft Azure. Aber in der Realität entfernt sich OpenAI von Microsoft.

Die Kernlogik dahinter ist, dass sowohl OpenAI als auch Anthropic die "Definierungsrechte" für die Chips haben möchten.

Es scheint, dass OpenAI bei der Entwicklung des Jalapeño - Chips mit Broadcom viel investiert hat und den gesamten Chip entworfen hat. Aber wenn Sie sich mit der Chip - Branche auskennen, wissen Sie, dass das Entwerfen eines Chips eigentlich der einfachste Teil der Branche ist. Die schwierigen Teile sind die anschließende Engineering - Arbeit, die Massenproduktion und das Netzwerksystem. Und all diese Teile liegen in der Hand von Broadcom.

Die eigentlichen Rechenlogiken eines AI - Chips, die direkt mit der Modellinferenz verbunden sind, machen vielleicht weniger als die Hälfte der gesamten Chipfläche aus.

Die übrigen Module zur Datenübertragung, seriellen Schnittstelle und Host - Kommunikation sind alle extrem komplex. Das Neuentwerfen eines dieser Module würde von mehreren Dutzend Ingenieuren mehrere Monate dauern.

Broadcom hat bereits seit Jahrzehnten an Kommunikationschips gearbeitet, und all diese IPs sind bereits vorhanden. Der Grund, warum der Jalapeño - Chip in neun Monaten von der Zeichnung bis zur Fertigung gebracht werden konnte, hat eigentlich wenig mit der von OpenAI verwendeten AI - Chip - Entwicklung zu tun, sondern hängt hauptsächlich von der reichen Infrastruktur von Broadcom ab.

Als die AI - Branche 2023 erst aufkam, waren alle Augen auf Nvidia gerichtet. GPUs waren rar, und der H100 war kaum zu bekommen. Der Marktwert von Nvidia stieg von Milliarden auf Billionen. Broadcom war zu dieser Zeit eher stumm.

Mit der Entwicklung der Branche hat Broadcom festgestellt, dass immer mehr AI - Unternehmen ihre eigenen Chips entwickeln möchten. Aber niemand möchte von Grund auf mit der Chipforschung beginnen, es ist zu anstrengend und zeitaufwendig.

Deshalb ist ein neues Wort entstanden: "Outsourcing der Chip - Autonomie".

Broadcom passt genau in diese Lücke. Es kann Ihnen helfen, den Chip zu entwerfen, die Fert

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

OpenAI und Broadcom haben gemeinsam einen Chip vorgestellt – kann Jensen Huang weiterhin entspannt bleiben?

01

Nvidia rasteiert weiter, aber Nvidia hat Feinde

02

OpenAI und Anthropic entziehen sich der Kontrolle von Nvidia

03

Broadcom rückt plötzlich in den Vordergrund