OpenAI attackiert seinen Verbündeten NVIDIA mit einer „Chili“, aber die größten Gewinner sind Unternehmen wie Micron Technology?
OpenAIs Chip ist endlich der Öffentlichkeit vorgestellt worden, nur war die Auftretensweise etwas überraschend: Sam Altman hielt zusammen mit Chen Fuyang, Präsident und CEO von Broadcom, einen Standard-12-Zoll-Wafer in den Händen, auf dessen Sockel der Name des Chips zu lesen war: Jalapeño.
Jalapeño bedeutet ursprünglich Jalapeno-Pfeffer. Lei Technology (ID: leitech) hat zunächst nicht viel über diesen Namen nachgedacht, bis es plötzlich beim Anschauen eines Analysevideos aufkam: Der Name klingt irgendwie bekannt.
Nach einigem Nachdenken erinnerte ich mich, dass ich das erste Mal diesen Namen gehörte, als ich als Mitglied der Lei Technology MWC-Reportageteam in Barcelona auf einem Imbissstand auf dem MWC-Gelände ein Taco gekauft habe. Aufgrund des sauren und pikanten Geschmacks habe ich den Verkäufer gefragt, um welchen Pfeffer es sich handele, und die Antwort war – Jalapeño.
Das Besondere am Jalapeño-Pfeffer ist, dass er zwar pikant, aber auch unkompliziert ist (das ist auch der Grund, warum er mit der spanischen Kultur weltweit beliebt geworden ist). Vielleicht repräsentiert dies auch die Eigenschaften von OpenAIs Chip: Er hat eine starke Leistung und ein ausgezeichnetes Preis-Leistungs-Verhältnis.
Nun, genug Smalltalk. Lassen Sie uns uns diesen Chip genauer ansehen.
Jalapeño: OpenAI warnt NVIDIA
Ehrlich gesagt behält OpenAI die tatsächlichen Parameter, den Fertigungsprozess und andere Informationen über den Jalapeño noch streng geheim. Es wird nur sehr vage gesagt, dass er der stärkste Chip in seiner Klasse ist und dass GPT-5.3-Codex-Spark im Labor erfolgreich getestet wurde.
Vielleicht haben viele von uns noch nicht viel mit diesem Modell zu tun gehabt. Tatsächlich ist es ein kleiner Codex-Modell, das von OpenAI speziell für Echtzeit-Programmieranforderungen trainiert wurde. Die Anforderungen an den Chip sind „geringer Latenz und hohe Parallelität“, nicht unbedingt die absolute Leistung. Wenn man die ASIC-Architektur des Jalapeño berücksichtigt, kann man vermuten, dass seine Leistung in der Nähe von Googles achten Generation TPU-Chip liegt.
Wenn man die maximale Leistung des TPU 8t (12,6 PFLOPS) aus der achten Generation TPU nimmt, könnte die theoretische Rechenleistung des Jalapeño bei etwa 13 PFLOPS liegen (nur eine Vermutung). Aus Sicht der Inferenzanwendung des Jalapeño schätzt Lei Technology, dass seine Rechenleistung eher bei etwa 10 PFLOPS liegt, da Effizienz und Energieverbrauch berücksichtigt werden müssen.
Quelle: Google
Angesichts der Tatsache, dass es OpenAI nur neun Monate von der Ankündigung der Entwicklung bis zum erfolgreichen Tape-out gedauert hat, ist diese Geschwindigkeit und das Ergebnis wirklich erstaunlich. Wenn man sich aber Chen Fuyang neben Altman ansieht, ist dieses „Wunder“ nicht so schwer zu verstehen. Broadcom ist ja einer der Giganten im Bereich ASIC, was OpenAI das Gefühl gibt, „auf den Schultern von Riesen zu stehen“.
Was Lei Technology aber noch interessanter macht als die Entwicklungsgeschwindigkeit, ist die Frage: Ist OpenAI wirklich bereit für die Massenproduktion? Laut den bisher verfügbaren Informationen wird der Jalapeño wahrscheinlich von TSMC hergestellt.
Es ist bekannt, dass TSMC derzeit nicht viel freie Kapazität hat. Es ist zumindest kurzfristig unmöglich, ein Rechenzentrum aufzubauen, das OpenAIs Rechenleistungserfordernisse decken kann. Deshalb sollte man die Äußerungen einiger Medien, dass der Jalapeño NVIDIA in den Wahnsinn treiben werde, mit einem Körnchen Salz nehmen.
Selbst nach OpenAIs Plan wird die Implementierung des Jalapeño bis 2029 dauern, und das Endziel ist die Errichtung eines Rechenzentrums mit einer Leistung von 10 GW.
Von Microsofts Azure Maia 200 bis zu Googles achter Generation TPU, von Amazons Trainium3 bis zu Alibaba Clouds Zhenwu M890 – hinter diesen Produkten stehen die Cloud-Dienstleister, die einst hinter NVIDIA herliefen und sich um eine Grafikkarte bemüht haben. Heute entwickeln sie alle ihre eigenen Chips, und jetzt hat sogar OpenAI, NVIDIAs „intimster Verbündeter“, den Jalapeño vorgestellt.
Quelle: Alibaba Cloud
Verraten? Noch nicht wirklich, aber man fühlt sich sicherlich ein wenig verloren.
Das bringt uns zu der Frage: Warum möchten alle aus NVIDIAs Hardware-Ökosystem ausbrechen und ihr eigenes Rechenleistung-Ökosystem aufbauen? Die Antwort ist natürlich die Kosten.
Eine detaillierte Analyse habe ich in meinem Artikel „Google verkauft TPU, Großkonzerne wollen mit KI-Chips „günstige Token“ produzieren“ geschrieben. Interessierte Leser können sich diesen Artikel ansehen.
Wer sich nicht durch den Artikel lesen möchte, kann sich diesen Satz merken: NVIDIA bedient sich seiner Dominanz (GPU + CUDA), um andere zu beherrschen. Die KI-Riesen „leiden unter NVIDIA schon lange“.
Nach NVIDIAs zwiespältiger Investition zeigt OpenAI seine Karten
Tatsächlich war der Konflikt zwischen OpenAI und NVIDIA nicht erst jetzt sichtbar. Wenn man sich erinnert, war es im vergangenen September, als es Gerüchte gab, dass NVIDIA OpenAI mit einer riesigen strategischen Investition von möglicherweise bis zu 100 Milliarden US-Dollar unterstützen würde.
Rechnet man mal nach, war das genau vor neun Monaten. Das heißt, dass der Jalapeño möglicherweise schon in die Phase der tatsächlichen Umsetzung eingetreten war. Aus dieser Perspektive ist die Einschätzung der ehemaligen OpenAI-Mitarbeiter über Altman nicht unbegründet: Er ist ein geschickter Politiker, der das Geschäftsergebnis als oberstes Ziel hat und an der absoluten Kontrolle festhält.
Quelle: Wikipedia
Während man über das größte Investitionsplan der Geschichte verhandelt, plant man gleichzeitig, dem anderen einen Stich in den Rücken zu geben. Obwohl es schwierig ist, solches Geschäftshandeln aus moralischer Sicht zu beurteilen, wird NVIDIA sich sicherlich im Gefühl der Verratung befinden, was auch der Grund dafür ist, dass der Milliarden-Investitionsplan nach Monaten der Verhandlungen noch nicht viel vorangekommen ist.
Als der Markt aufgrund der Krisen in der Zusammenarbeit zwischen den beiden Parteien besorgt über die Zukunft der KI-Branche wurde, haben beide Seiten aus Rücksicht auf den zukünftigen Markt beschlossen, eine Investition von 30 Milliarden US-Dollar zu tätigen. NVIDIA ist nur einer von drei Investoren und nicht einmal derjenige, der am meisten Geld investiert (Amazon hat 50 Milliarden US-Dollar investiert).
Nach der Festlegung dieser Investition hat Huang Renxun auch öffentlich gesagt: „Dies könnte das letzte Mal sein.“ Offensichtlich hat NVIDIA möglicherweise von der Lieferkette erfahren, dass OpenAI den Jalapeño entwickelt und sich dem Tape-out nähert oder bereits in diesem Stadium ist.
Es kann sicherlich nicht angenehm sein zu wissen, dass das eigene Geld möglicherweise in Zukunft als Waffe gegen sich selbst eingesetzt wird. Aber die Bindung zwischen NVIDIA und OpenAI ist zu stark, und beide Seiten brauchen sich, um die „KI“-Show weiterzuführen. Deshalb befinden sich beide in einer Situation, in der sie voneinander nicht getrennt werden können.
Das gilt auch dann, wenn OpenAI den Jalapeño hat. Man kann sogar sagen, dass solange KI-Modelle wie Claude, DeepSeek und Gemini existieren, OpenAI auf NVIDIA angewiesen ist, denn es braucht weiterhin die stärksten Rechenleistungskarten, um die stärkste Rechenleistungsmatrix aufzubauen, um das „stärkste“ Modell zu trainieren.
Aber alle Cloud-Dienstleister werden bewusst ihren Verbrauch an NVIDIAs Rechenleistungskarten reduzieren. Dies kann sowohl als Interesse als auch als Absicht verstanden werden, um sicherzustellen, dass die Zukunft der KI nicht in den Händen eines einzigen Anbieters liegt.
ASIC bringt Flash-Speicherherstellern eine „zweite Jugend“
Von OpenAI bis Alibaba Cloud beschäftigen sich alle mit ASIC-Chips. Vielleicht fragen manche Leser sich: Was genau ist ein ASIC? Will die KI-Branche die GPU verlassen?
Einfach ausgedrückt ist ASIC die Abkürzung für „Application-Specific Integrated Circuit“ und keine feste Architektur. Das Ziel der Entwicklung eines ASIC-Chips ist es, einen Chip vollständig nach den Anforderungen eines Unternehmens zu gestalten, der nur für bestimmte Anwendungsfälle geeignet ist. Deshalb ist die Flexibilität eines ASIC-Chips weit geringer als die von allgemeinen Chips wie GPU und CPU. Wenn sich die Modellarchitektur stark ändert, muss ein Unternehmen oft einen neuen ASIC-Chip entwickeln, um die Effizienz aufrechtzuerhalten.
Dies ist auch der Grund, warum alle auf NVIDIA angewiesen sind, denn nur allgemeine Chips wie die GPU können mehrere Modelle mit unterschiedlichen Architekturen gleichzeitig unterstützen und dennoch eine hohe Effizienz aufweisen. Der ASIC hingegen ist eher ein „spezialisieretes Werkzeug“, das man entwickelt, nachdem man die Anforderungen des Modells genau kennt.
Tatsächlich sind die Entwicklungskosten und die Zeit für jedes neue ASIC-Modell beträchtlich. OpenAIs neun Monate sind im Halbleiterbereich schon ein Wunder. Dennoch lohnt es sich für die Cloud-Dienstleister, da sie die Massenproduktion selbst aufnehmen können und die Kosten pro Chip durch die Massenproduktion senken können. Wenn man die Wartungskosten hinzurechnet, ist es schließlich profitabel.
Interessanterweise fiel das Schreiben dieses Artikels zeitgleich mit der Korrektur der Halbleiteraktien nach einem starken Kursrückgang, was vielen Menschen ein „psychologisches Rutschbrett“ beschert hat. Der Kursrückgang der letzten Tage ist nicht schwer zu verstehen. Die anhaltende Kursschwäche hatte die Aktienkurse von Unternehmen wie Micron auf ein bisher nie erreichtes Niveau gebracht. Gleichzeitig hat Micron angekündigt, den Kapazitätsausbau für HBM-Speicher zu verschieben und einen Teil der Kapazität auf den Verbrauchsmärkt wie GDDR umzustellen.
Quelle: Baidu Aktien
Dies hat einige Anleger zu der Annahme gebracht, dass das Wachstumspotenzial von HBM dem Ende neigt und dass die Aussichten für die Rechenleistungshardware in der KI-Branche gesunken sind. Zusammen mit anderen Faktoren hat dies schließlich zu einem starken Kursrückgang der Halbleiterunternehmen geführt.
Dann hat das von Micron veröffentlichte Quartalsergebnis die Aktienkurse wieder in die Höhe katapultiert.
Tatsächlich wird man, wenn man den aktuellen Zustand der KI-Chips kennt, wahrscheinlich nicht an den zukünftigen Umsatz der Speicherhersteller zweifeln (nur eine Analyse, keine Anlageempfehlung). Ob es sich um NVIDIAs Rechenleistungskarten oder um die von verschiedenen Unternehmen entwickelten ASIC-Chips handelt, solange sie für Anwendungen mit hoher Parallelität, hohem Durchsatz und geringer Latenz verwendet werden, ist HBM-Speicher derzeit fast die einzige Wahl.
Dies wird so bleiben, bis eine bahnbrechende Technologie auftritt, wie die vollständige Reife der Wafer-Scale-Architektur oder die vollständige Umsetzung des On-Chip-SRAM-Designs (integrierter Hochgeschwindigkeitsspeicher auf dem Chip). Derzeit hat sich zwar bei diesen Technologien ein gewisser Fortschritt erzielt, aber es wird noch einige Zeit dauern, bis sie vollständig reif sind.
Eigentlich ist das wahrscheinlichste „Schwarze-Schwan-Ereignis“ der Fall, dass ein KI-Anbieter plötzlich eine neue Algorithmus entwickelt, die den Speicherbedarf von KI-Modellen stark reduzieren kann. Beispielsweise hat Google kürzlich TurboQuant veröffentlicht, das angeblich den Speicherbedarf für die Inferenz um mehr als das Sechsfache reduzieren kann. Obwohl die Ergebnisse der Studie umstritten sind, würde die Reife dieser Technologie den Bedarf nach HBM direkt beeinträchtigen.
Außerdem sind die MoE-Routing-Optimierung, die MLA-Richtung von DeepSeek und die Entwicklung neuer Modellstrukturen für bestimmte Speichertechnologien (z. B. gemischte Scheduling von kleinen und großen Modellen) vorhersehbare Entwicklungsrichtungen. Dies ist auch der Grund, warum Speicherhersteller DeepSeek nicht so gerne mögen, denn es stört einfach die Dinge.
Dennoch wird es wahrscheinlich in den nächsten ein oder zwei Jahren schwierig sein, den Speichermangel zu beheben.
Im Gegenteil wird der Bedarf an HBM aufgrund der Tatsache, dass die Chiphersteller alle an ihren eigenen ASIC-Chips arbeiten (ein einzelner Chip benötigt oft mehr als 128 GB HBM-Speicher), noch weiter steigen.
Abschluss
In den nächsten Jahren wird die KI-Branche wahrscheinlich noch „heißer“ werden, denn die derzeitigen Investitionen sind so hoch, dass niemand den Verlust verkraften kann.
Deshalb wird das GPU-Mythos von NVIDIA wahrscheinlich weiter bestehen bleiben, die Knappheit von HBM wird noch lange anhalten, und der Kampf um die ASIC-Chips hat erst begonnen. Die Verbraucher werden vielleicht einerseits immer günstigere KI-Dienste und andererseits immer teurere Grafikkarten, Speicher, SSDs und Elektronikprodukte sehen.
Betrachtet man es so, war der Name Jalapeño wirklich gut gewählt: Er ist nicht so aggressiv wie der Ghost Pepper, aber er reicht, um den gesamten KI-Chipmarkt zu erwärmen.
Das Ziel der KI-Unternehmen ist es, die Token günstiger zu machen. Aber bevor das passiert, wird vielleicht die gesamte Halbleiterindustrie in Brand gesteckt.
Dieser Artikel stammt aus dem WeChat-Account „Lei Technology“, geschrieben von Lei Technology und mit Genehmigung von 36Kr veröffentlicht.