StartseiteArtikel

Die Kommerzialisierung von ASIC hat den Wendepunkt erreicht

半导体产业纵横2026-06-29 12:06
Die Cloud-Giganten treten ins Rampenlicht, und OpenAI mischt auch mit.

Im zweiten Quartal 2026 erreichte die Nachrichtenintensität im Bereich der ASIC-Chips ein beispielloses Niveau. Nur von dem 18. Juni, als Amazon bestätigte, Verhandlungen über den Verkauf seiner Trainium-Chips an externe Rechenzentren zu führen, bis zum 24. Juni, als OpenAI zusammen mit Broadcom den ersten eigenentwickelten Inferences-Chip Jalapeño veröffentlichte, trafen binnen einer Woche zwei sensationelle Ereignisse ein. Wenn man noch weiter zurückblickt, gründete Google im Mai zusammen mit der Blackstone Group eine Joint Venture mit einem Kapital von 5 Milliarden US-Dollar, um die TPU zu vermarkten. Microsoft unterhält Verhandlungen mit Anthropic über die Miete von Rechenleistung für seine Maia 200, während Meta aufgrund eines fehlgeschlagenen internen Integrationsprozesses nach der Übernahme von Rivos in eine passive Position geraten ist.

Diese Ereignisse deuten auf dasselbe Ergebnis hin: ASIC-Chips rücken von der Peripherie des künstlichen Intelligenz-Rechenleistungssystems in den Mittelpunkt. Super-Cloud-Rechenleistungserbringer und führende KI-Labore setzen gleichzeitig die Pedale durch. Hinter diesen Aktivitäten verbirgt sich nicht nur das geschäftliche Bedürfnis zur Kostenkontrolle, sondern auch der Wettlauf um die Kontrolle über die nächste Generation von KI-Infrastrukturen. Goldman Sachs prognostiziert, dass die von KI getriebene Nachfrage nach ASIC-Chips 2027 mit der Nachfrage nach GPU-Chips auf gleicher Ebene liegen wird. Im Jahr 2026 werden die vier großen Cloud-Anbieter zusammen geschätzte 700 bis 775 Milliarden US-Dollar in KI investieren, was einem Anstieg von fast 78 % gegenüber dem Vorjahr entspricht. Mit einem so großen Kapitalvolumen kann kein einzelner Chip-Lieferant den Markt dominieren.

Cloud-Anbieter: Von der internen Nutzung zur Öffentlichkeit

Seit langem galten maßgeschneiderte KI-Chips als "interne Spielzeuge" der Cloud-Riesen, die eingesetzt wurden, um die enorme interne Rechenleistung zu nutzen. Doch die zahlreichen strategischen Veränderungen im Jahr 2026 zeigen, dass diese Grenze allmählich gebrochen wird. Der Kernmotor hinter diesen Veränderungen ist die strukturelle Umstellung der KI-Arbeitslast – von einer "Trainingsdominanz" hin zu einer "Inferenzdominanz". Studien von SemiAnalysis und Bernstein schätzen, dass ASIC-Chips im Vergleich zu allgemeinen GPU-Chips bei der massiven Inferences-Einrichtung einen Kostenvorteil von 40 % bis 65 % im Gesamtbesitzkostenmodell (TCO) haben. Nachdem die KI-Bildgenerierungsplattform Midjourney auf Googles siebte Generation von TPU-Chips umgestellt hat, sank ihre monatliche Rechenleistungskosten von 2,1 Millionen US-Dollar auf 700.000 US-Dollar. Dieser Kostenvorteil spiegelt sich direkt in den Preisen für Cloud-Dienste wider: Laut Artificial Analysis kostet das auf TPU basierende Google Gemini 3.1 Pro etwa 1,74 US-Dollar pro Million Tokens im Mischpreis, was fast 60 % billiger ist als die gleichwertigen Opus 4.7 (4,10 US-Dollar) und GPT-5.5 (4,35 US-Dollar).

Am auffälligsten sind die Aktivitäten von Amazon. Am 18. Juni 2026 bestätigte Peter DeSantis, Leiter des KI-Geschäfts von Amazon, in einem Interview, dass AWS Verhandlungen über den Verkauf seiner maßgeschneiderten Trainium-Chips an die Rechenzentren anderer Unternehmen führt. Bereits im April in seinem Brief an die Aktionäre deutete Amazon-CEO Andy Jassy an, dass das Chip-Geschäft, wenn es als unabhängige Einheit betrieben würde und die in diesem Jahr produzierten Chips an AWS und externe Unternehmen verkauft würde, ein Jahresumsatz von etwa 50 Milliarden US-Dollar erzielen würde. Der laufende Jahresumsatz der internen Chipabteilung von Amazon hat bereits die Marke von 20 Milliarden US-Dollar überschritten. Sein neuestes Trainium3-Chip war kurz nach der Veröffentlichung praktisch ausverkauft und hat über 225 Milliarden US-Dollar an Einnahmenzusagen erhalten. Zu seinen Hauptkunden gehören OpenAI, Anthropic und Uber. Anthropic hat sich verpflichtet, über eine Million Trainium-Chips zu installieren und hat einen Chip-Kapazitätsvertrag von 5 GW unterzeichnet.

Googles Vorgehen ist noch aggressiver. Im Mai 2026 kündigte Google die Gründung einer Joint Venture namens "TPU Cloud" mit der Blackstone Group an. Blackstone hat zunächst 5 Milliarden US-Dollar (mit Leverage bis zu 25 Milliarden US-Dollar) in das Projekt investiert. Ziel des Projekts ist es, im Jahr 2027 ein KI-Rechenzentrum mit einer Kapazität von etwa 500 MW zu eröffnen, das vollständig auf Googles TPU-Hardware, -Software und -Diensten basiert. Dies ist das erste Mal in zehn Jahren seit der Entstehung der TPU, dass es außerhalb des Google Cloud-Systems in großem Maßstab vermarktet wird. Google hat auch für das "Lake Mariner" KI-Rechenzentrumsprojekt im Westen des US-Bundesstaates New York eine finanzielle Bürgschaft in Höhe von 3,2 Milliarden US-Dollar übernommen. Das Projekt wird Anthropic mit Tausenden von auf TPU basierenden Rechenknoten versorgen. Auf der Lieferkettenseite hat Google Intel mit der Produktion von über 3 Millionen TPU-Chips beauftragt. MediaTek hat sich ebenfalls in die Design-Lieferkette der nächsten Generation von TPU v10 eingeschoben, was das langjährige Monopol von Broadcom gebrochen hat.

Die eigenentwickelten Chips der drei großen Cloud-Anbieter haben jeweils eine klare Produktpositionierung und ein Kundennetzwerk: Amazons Trainium/Inferentia-Serie dient Anthropic, OpenAI und Uber; Googles TPU v7 Ironwood und v8-Serie hat Anthropic, Meta und Midjourney angelockt; Microsofts Maia 200 versucht, Anthropic und OpenAI zu gewinnen.

Microsoft schreitet ebenfalls voran. Sein auf TSMC's 3nm-Prozess basierender zweiter Generation KI-Beschleuniger Maia 200 ist bereits in Rechenzentren im Einsatz. Er ist mit 216 GB HBM3e-Speicher ausgestattet und hat eine Spitzenleistung von über 10 Petaflops in FP4. Im Mai hält Anthropic Verhandlungen mit Microsoft über die Miete von Azure-Servern auf Basis der Maia 200. Wenn ein Vertrag zustande kommt, wird Anthropic der erste bedeutende externe Kunde für Microsofts eigenentwickelte Chips sein.

OpenAIs Neun-Monate-Chipentwicklung

Bemerkenswert ist, dass die Teilnehmer an der Eigenentwicklung von Chips nicht nur die Cloud-Riesen sind. Am 24. Juni 2026 veröffentlichte OpenAI zusammen mit Broadcom den ersten maßgeschneiderten Inferences-Chip Jalapeño, was bedeutet, dass das weltweit größte KI-Modellunternehmen offiziell in den Chip-Bereich eingestiegen ist.

Der Jalapeño wird als "intelligenter Prozessor" definiert und speziell für Szenarien der Inferenz von Large Language Models entwickelt. OpenAI ist für das Grundgerüst des Designs verantwortlich, Broadcom für die Siliziumimplementierung und das Netzwerkhardware, Celestica für die Platinen- und Rack-Systemintegration und TSMC für die Herstellung. Greg Brockman, Präsident von OpenAI, gab bekannt, dass dieser Chip dank der Unterstützung des eigenentwickelten Large Language Models von OpenAI nur neun Monate von der obersten Ebene des Designs bis zur Fertigung gebraucht hat. Frühe Tests zeigen, dass der Jalapeño in Bezug auf die Leistung pro Watt deutlich besser ist als die bestehenden Lösungen.

OpenAIs Logik bei der Chipentwicklung unterscheidet sich von der der Cloud-Anbieter. Als einer der weltweit größten Käufer von GPU-Chips steht OpenAI vor dem Problem, dass die Rechenleistung stets hinter dem Geschäftsaufbau zurückbleibt. Brockman gestand auf der Pressekonferenz: "Wir verstehen die Arbeitslast sehr gut und suchen ständig nach bestimmten Aufgaben, die von der bestehenden Hardware ineffizient bedient werden, und überlegen, wie wir spezielle Hardware bauen können, um diese Aufgaben zu beschleunigen." Broadcom-CEO Hock Tan sagte auch, dass die Rechenleistungsanforderungen seiner sechs Hauptkunden fast unbegrenzt seien. "Das Problem der Rechenleistungsmangel wird nicht nur 2026 und 2027 andauern, sondern auch 2028 wird die Branchennachfrage weiter steigen", sagte er.

Die physikalischen Proben des Jalapeño wurden am 24. Juni an OpenAI geliefert. Das Unternehmen plant, im Ende 2026 eine kleine erste Serie zu installieren, 2027 schnell zu wachsen und im ersten Halbjahr 2028 in die Massenproduktion zu gehen. Langfristig soll der maximale Stromverbrauch bis zu 10 GW betragen. Dies bedeutet, dass OpenAI einen vollständigen vertikalen Technologiestapel von Modellen, Produkten, Rechenzentren bis hin zu Chips aufbaut. Wie in seiner offiziellen Erklärung heißt: "OpenAI entwickelt nicht nur führende Modelle oder baut Produkte, sondern es entwirft auch die Infrastruktur unterhalb der Modelle – Chiparchitektur, Kern, Speichersystem, Netzwerk, Scheduling, Installationssystem und Produkt-Erlebnis."

Schmerzen und Barrieren: Metas Lehre

Die Eigenentwicklung von Chips ist jedoch kein rosaroter Weg. Metas Misserfolge in diesem Bereich haben die gesamte Branche gewarnt.

Im September 2025 kaufte Meta das RISC-V-Chip-Startup Rivos für über 2 Milliarden US-Dollar, um sein eigenes KI-Chip-Projekt (MTIA) zu beschleunigen. Doch nur sechs Monate später geriet diese Partnerschaft in Schwierigkeiten. Laut Berichten wurde der Integrationsprozess von Rivos durch starke Konflikte zwischen Metas bestehenden Mitarbeitern und dem Rivos-Team in Bezug auf Gehälter und strategische Richtungen behindert. Beide Parteien kämpften um die Frage, ob die zukünftigen Chips auf Metas bestehendem IP oder auf Rivos-Technologie basieren sollten, was direkt zu Verzögerungen mehrerer Projekte führte. Noch schlimmer, es wurde von informierten Quellen berichtet, dass das Rivos-Projekt innerhalb von Meta praktisch abgebrochen wurde.

Dies zeigt die tiefgreifenden Widersprüche auf, die Internetunternehmen bei der Einsteuerung in die Halbleiterbranche begegnen: Softwarecode kann jederzeit aktualisiert werden, aber bei einem Chip, sobald er in die Produktion geht (Tape-out), bedeutet jede kleine Architekturfehler Millionen von US-Dollar und mehrere Monate Zeitverlust. Auch Microsofts Maia-Projekt hat eine Verzögerung der Massenproduktion von 2025 auf 2026 erlebt. Diese Beispiele zeigen, dass selbst mit einem Forschungs- und Entwicklungsbudget von Hunderten von Milliarden US-Dollar die Schaffung einer reifen Chip-Ökosystem von Grund auf eine langfristige und kontinuierliche Investition erfordert.

Im Gegensatz dazu hat OpenAI einen praktischeren Weg gewählt: Es baut keine eigene Chip-Team auf, sondern kooperiert intensiv mit Broadcom. Indem es Broadcoms reife Fähigkeiten in der Siliziumimplementierung und die Lieferkettenressourcen nutzt, wandelt OpenAI sein Verständnis der Modellarbeitslast in die Chiparchitektur-Entwicklung um und schafft es, den gesamten Prozess von der Entwurf bis zur Fertigung in nur neun Monaten abzuschließen. Dieses "Modellunternehmen definiert die Architektur + Halbleiterunternehmen realisiert die Herstellung" -Teilungsmodell könnte eine effizientere Branchenkooperationsparadigma darstellen.

Umstrukturierung der Lieferkette und Marktaussichten

Die Welle der Eigenentwicklung von Chips durch Cloud-Riesen und KI-Labore verändert die Wertverteilung in der Halbleiterlieferkette. Broadcom und Marvell kontrollieren etwa 95 % des gemeinsamen Designsmarktes für maßgeschneiderte KI-ASICs. Broadcoms Einnahmen aus KI-Halbleitern im zweiten Quartal des Geschäftsjahres 2026 beliefen sich auf 1,08 Milliarden US-Dollar, was einem Anstieg von 143 % gegenüber dem Vorjahr entspricht. Broadcom-CEO Hock Tan prognostiziert, dass die Einnahmen aus KI-Chips 2027 über 100 Milliarden US-Dollar betragen werden. Qualcomm hat dank seiner Erfahrungen in der Entwicklung von Niedrigstromarchitekturen erfolgreich einen Auftrag für mehrere Millionen KI-Chips von ByteDance erhalten. Der CEO der taiwanesischen ASIC-Designfirma Alchip Technologies prognostiziert, dass die Einnahmen aus KI-ASICs von etwa 13 Milliarden US-Dollar im Jahr 2024 auf über 150 Milliarden US-Dollar im Jahr 2030 steigen werden, was einem durchschnittlichen jährlichen Wachstum von fast 50 % entspricht.

Laut der neuesten Prognose von TrendForce wird die Liefermenge von maßgeschneiderten KI-Chips im Jahr 2026 um 44,6 % steigen, während die Liefermenge von kommerziellen GPU-Chips nur um 16,1 % wachsen wird. Dies ist das erste Mal seit Beginn der KI-Ära, dass das Wachstum der Liefermenge von maßgeschneiderten Chips deutlich höher ist als das von allgemeinen GPU-Chips. Bloomberg Intelligence schätzt, dass die Nachfrage nach maßgeschneiderten Chips bis 2033 um durchschnittlich 27 % pro Jahr steigen wird. Die Global Institute von Goldman Sachs schätzt, dass zwischen 2026 und 2031 insgesamt etwa 7,6 Billionen US-Dollar in den globalen KI-Bereich investiert werden müssen.

Nach den Entwicklungstrends der Halbleiterindustrie wird die Unterscheidung zwischen "allgemein" und "spezifisch" immer deutlicher. Allgemeine GPU-Chips werden aufgrund ihrer Software-Ökosysteme wie CUDA weiterhin in der Modelltrainings- und vielseitigen KI-Entwicklung dominieren. Doch in der Phase der kommerziellen Implementierung, in der die Inferenzmenge exponentiell wächst, schneiden maßgeschneiderte ASICs mit ihrem extremen Kostenvorteil schnell an Marktanteilen ab. Daten von TrendForce zeigen, dass die Liefermenge von ASIC-KI-Servern im Jahr 2026 etwa 27,8 % des gesamten KI-Servermarktes ausmachen wird.

Für führende Modellunternehmen wird die "Mehr-Chip-Strategie" zur Standardpraxis. Anthropic nutzt derzeit gleichzeitig die AWS Trainium, Google TPU, Azure GPU und unterhält Verhandlungen über die Microsoft Maia. OpenAI nutzt neben den Amazon Trainium, AMD und Cerebras-Chips auch seinen eigenen Jalapeño. Adam Fisher, Partner der Bessemer Venture Partners, sagte öffentlich: "Einige aufstrebende Cloud-Unternehmen können sich nicht von der Nutzung der Hardware eines einzigen Anbieters lösen, weil sie Angst haben, dass ihre Quoten reduziert werden" - aber mit zunehmendem Rechenleistungsmangel brechen immer mehr Unternehmen diese Bindung.

Die Konzentration der Nicht-GPU-KI-Chips im Jahr 2026 ist nur das Vorspiel der Umstrukturierung der KI-Infrastruktur. Wenn Modellunternehmen beginnen, die Chiparchitektur zu definieren und Cloud-Anbieter beginnen, Siliziumscheiben an externe Kunden zu verkaufen, wird die traditionelle Aufteilung der Arbeit in der Halbleiterindustrie neu geschrieben.

Dieser Artikel ist aus dem WeChat-Account "Halbleiterindustrie im Überblick" (ID: ICViews) übernommen. Autor: Junxi. Veröffentlicht von