CPU, es ist total überlastet!
Die KI wandelt sich von der Trainingsphase zur Inferenzphase, und die CPU wird in der KI - Ära immer wichtiger und unverzichtbar. Dies lässt sich sehr anschaulich an den Prognosen und Korrekturen der Chip - Giganten und Marktanalysedienste für den zukünftigen Marktplatz (TAM) erkennen:
Im Mai 2026 hob Dr. Lisa Su, CEO von AMD, in der Telefonkonferenz zur Quartalsbilanz des ersten Quartals 2026 die langfristige Prognose für den globalen Server - CPU - Markt an. Sie schätzt, dass der TAM für Server - CPUs bis 2030 mit einem Jahres - Compound - Wachstumsrate (CAGR) von über 35 % rasant steigen und auf über 120 Milliarden US - Dollar ansteigen wird. Nur einige Monate zuvor lag die Prognose für diese Zahl noch bei 60 Milliarden US - Dollar.
Die Wall - Street - Investmentbank Citi war in ihrem Kundenbericht Mitte Mai 2026 noch optimistischer und fixierte das Volumen des globalen CPU - Marktes für das Jahr 2030 auf 131,5 Milliarden US - Dollar. Auch Arm hat seinen relevanten TAM auf die Milliarden - US - Dollar - Ebene festgelegt.
Nvidia war noch aggressiver. In der Telefonkonferenz des ersten Quartals des Geschäftsjahres 2027 wurde erwähnt, dass die Vera - CPU für Nvidia einen "neuen TAM von 200 Milliarden US - Dollar" eröffnen würde. Die Firma gab auch an, dass sie bereits in diesem Jahr eine CPU - Einnahme von fast 20 Milliarden US - Dollar absehen könne. Anschließend berichtete die Reuters, dass Jensen Huang die Prognose von Nvidia für den CPU - Markt von 200 Milliarden US - Dollar, einschließlich des chinesischen Marktes, bestätigte und dass die Firma die Produktion der Vera Rubin - Plattform beschleunige.
Innerhalb von nur wenigen Monaten wurde der Vorstellungsraum für den CPU - Markt in Datencentern von 60 Milliarden US - Dollar über 120 Milliarden US - Dollar auf die 200 - Milliarden - US - Dollar - Ebene gehoben. Die CPU - Märkte wachsen tatsächlich rasant. Die Frage ist nun, warum Datencentren in der KI - Ära plötzlich so viele CPUs benötigen?
Agentic AI, die CPU neu bewerten
Da sich die KI - Infrastruktur von Trainingszentren zu Inferenzzentren und weiter zu Agentenzentren wandelt, nimmt die Beteiligung der CPU rapide zu.
Früher war die Inference traditioneller großer Modelle eher ein einmaliger Request und eine einmalige Antwort: Der Benutzer gibt eine Frage ein, und das Modell generiert eine Antwort. Zu diesem Zeitpunkt übernahm die GPU den Großteil der Matrixberechnungen, während die CPU hauptsächlich die Planung und die Datenvorbereitung übernahm. Agentic AI ist jedoch anders. Sie muss kontinuierlich Aufgaben planen, Werkzeuge aufrufen, Datenbanken abfragen, Code ausführen, Wissen abrufen, mehrere Sub - Agenten koordinieren und den Zustand in einem langen Kontext aufrechterhalten.
Dr. Lisa Su, CEO von AMD, stellte in der Quartalsbilanz - Telefonkonferenz fest, dass mit dem raschen Wachstum der Inferenz - und Agentic - AI - Lasten die Rechenanforderungen an Server - CPUs neu gestärkt werden. Der Grund hierfür ist, dass diese Anwendungen nicht nur auf GPU und Beschleuniger für die Modellberechnungen angewiesen sind, sondern auch die CPU für eine Vielzahl von systemweiten Aufgaben benötigen, einschließlich Aufgabenplanung, Datenscheduling, parallele Ausführung, Ressourcenkoordination und als Kopfknoten für GPU - und Beschleunigercluster zur einheitlichen Planung des gesamten KI - Systems.
TrendForce zitierte die Informationen aus der AMD - Quartalsbilanz - Telefonkonferenz und erklärte, dass sich die Branche mit der Entwicklung der Agentic AI von der bisherigen Konfigurationslogik von "eine CPU auf vier bis acht GPUs" hin zu einer höheren Dichte und sogar einer nahen 1:1 - CPU - GPU - Verhältnis in den nächsten Generationen von Datencentern bewegt.
Chen Liwu, CEO von Intel, stellte auf der 54. Globalen Technologiekonferenz von J.P. Morgan fest, dass Kunden Intel berichteten, dass das Verhältnis von CPU zu GPU von 1:8 auf 1:1 und sogar auf 4:1 nähert. Chen Liwu sagte auch, dass der Markt für physische KI (Embodied AI) sehr groß sei. Deshalb glaube er, dass er die Möglichkeit habe, in die CPU - Entwicklung zu investieren und neue Architekturen zu entwickeln, um maßgeschneiderte Workloads zu treiben und für bestimmte Workloads zu optimieren. Das gleiche gelte für die Beschleuniger. Kürzlich habe Intel Alex von Qualcomm geholt, um die physische KI zu entwickeln, von der Siliziumoptimierung bis hin zu Software und Systemplattform - Engineering, und Lösungen für Roboter oder digitale Arbeiter zu fördern.
Nvidia betonte, dass sich heutige Datencentren zu KI - Fabriken entwickelt haben, die kontinuierliche Einnahmen generieren können. Kunden kaufen nicht wirklich eine einzelne GPU, sondern eine gesamte KI - Infrastruktur - Fähigkeit. Daher ist der Schlüsselindikator für den Wert der KI - Infrastruktur nicht mehr der Einzelpreis der GPU, sondern die Token - Ausgabe pro Einheit Leistung, die Token - Ausgabe pro Einheit Kosten, die System - Online - Rate, die Ressourcenauslastung, die Geschwindigkeit der Bereitstellung und Inbetriebnahme, die langfristige Verfügbarkeit des Softwarestapels sowie der Lebenszykluswert der Geräte - Assets.
Die grundlegende Logik für die Anhebung des CPU - Marktes ist, dass die CPU nicht mehr nur eine allgemeine Recheneinheit in Servern ist, sondern das System - Planungszentrum in einer KI - Fabrik. Wenn die KI von der Trainingsphase zur Inferenzphase, von der Inferenzphase zu Agentic AI und von Einzelservern zu Tausenden - GPU - Clustern und KI - Fabriken übergeht, konkurrieren Datencentren nicht mehr um eine einzelne GPU, sondern um ein System. In diesem System spielt die CPU die Rolle der Ordnung: Sie plant Aufgaben, verwaltet den Arbeitsspeicher, transportiert Daten, koordiniert Beschleuniger, verarbeitet Steuerfluss, unterstützt Datenbanken und Werkzeugaufrufe und organisiert GPU, DPU, NIC, Speicher und Softwarestapel zu einer lauffähigen, erweiterbaren und abrechenbaren KI - Fabrik.
Die beiden x86 - Riesen kämpfen um die Spitze
Die Zahlen zeigen, dass AMD in der Server - CPU - Beschaffung für Datencentren von großen Cloud - Anbietern, die höheren Wert und höhere Gewinne generieren, fast gleichauf mit Intel ist.
Im ersten Quartal 2026 beliefen sich die Einnahmen aus dem Datencenter - Geschäft von AMD auf 5,8 Milliarden US - Dollar, was einem Jahr - über - Jahr - Wachstum von 57 % entspricht. Dies wurde hauptsächlich durch die Nachfrage nach EPYC - CPUs und Instinct - GPUs angetrieben. Die Firma gab auch an, dass die Einnahmen aus Server - CPUs im vierten Quartal in Folge einen Rekordwert erreichten und um über 50 % gegenüber dem Vorjahr stiegen. Die wichtigsten Cloud - Anbieter erweiterten die Nutzung von EPYC, um eine Reihe von KI - Workloads von allgemeinen Rechenaufgaben und Datenverarbeitung bis hin zu Beschleuniger - Kopfknoten und neu aufkommenden Agentic - Anwendungen zu unterstützen.
Die Daten von Mercury Research zeigen, dass AMD seinen Marktanteil an der Server - CPU - Liefermenge auf 33,2 % gesteigert und seinen Umsatzanteil auf einen Rekordwert von 46,2 % gebracht hat. Dies bedeutet, dass von allen Server - CPUs, die weltweit im ersten Quartal 2026 ausgeliefert wurden, ungefähr ein Drittel von AMD stammte. Der durchschnittliche Verkaufspreis (ASP) der von AMD verkauften Prozessoren war deutlich höher als der von Intel.
Dies zeigt ein Problem auf: Obwohl Intel immer noch fast zwei Drittel (etwa 66,8 %) der Server - CPU - Liefermenge kontrolliert, wurde sein Umsatzanteil auf nur noch etwa 53,8 % reduziert, da seine Chip - Angebote auch preiswertere Standard - oder Mittel - und Niedrigend - Chips enthalten.
Intel, als traditioneller Anbieter von Server - CPUs, hat sich über die Xeon - Ökosystem langfristig in Unternehmen, Cloud, Datenbanken, HPC, Netzwerken und Edge - Computing etabliert. Die Xeon 6 hat zwei Strecken: Die E - Core - Version konzentriert sich auf hohe Kerndichte und Leistungs - Stromverbrauch - Verhältnis, während die P - Core - Version auf breitere Workloads, KI und HPC abzielt und in jedem Kern eine KI - Beschleunigungsfunktion integriert hat.
Angesichts der ständigen Abwanderung von hochwertigen Datencenter - Märkten sieht Intel Clearwater Forest, also Xeon 6+, als das Schlüsselprodukt für die nächste Gegenoffensive an. Als Intels erster Server - Prozessor, der auf der 18A - Technologie basiert, wird Clearwater Forest voraussichtlich im ersten Halbjahr 2026 auf den Markt kommen. Die Zielkunden sind hauptsächlich hyperskalige Datencentren, Cloud - Anbieter und Telekommunikationsbetreiber.
Die Kernlogik dieses Produkts besteht darin, mit fortschrittlicherer Technologie und höherer Kerndichte die Anforderungen von Cloud - Kunden an Leistung, Energieeffizienz und Bereitstellungsdichte zu erfüllen. Clearwater Forest wird bis zu 288 Energieeffizienzkerne bieten. Im Vergleich zur vorherigen Generation Sierra Forest steigt die Einzelschritt - Befehlsausführungsfähigkeit der Energieeffizienzkerne um etwa 17 %. Für Intel ist dies nicht nur ein neuer Xeon - Prozessor, sondern auch ein wichtiger Versuch, die Wettbewerbsfähigkeit seiner Server - CPUs mit der 18A - Technologie neu zu formen.
Obwohl der CPU - Markt wächst, steigt auch die Wettbewerbsdimension.
AMD verbindet CPU, GPU und Rack - Level - Systeme. Die sechste Generation EPYC Venice von AMD basiert auf der Zen 6 - Architektur und der 2 - nm - Technologie und ist für Cloud, Unternehmen und KI - Workloads ausgelegt. Verano ist der erste von AMD für KI - Infrastruktur entwickelte EPYC - CPU. AMD gab auch an, dass Venice verschiedene Richtungen wie Durchsatzoptimierung, Leistungs - Stromverbrauch - Verhältnis - Optimierung, Kosteneffizienzoptimierung und KI - Infrastrukturoptimierung abdecken würde und voraussichtlich später im Jahr 2026 auf den Markt kommen würde.
AMD beschleunigt auch die Investitionen in die Lieferkette. Lisa Su sagte in Taipeh, dass die Nachfrage auf dem globalen CPU - Markt höher sei als alle vor einem Jahr erwartet hätten und der CPU - Markt sich verdichtet habe. AMD arbeite mit taiwanesischen Partnern zusammen, um die Produktionskapazität zu erweitern und plane, mehr als 10 Milliarden US - Dollar in die taiwanesische KI - Branche zu investieren, insbesondere in fortschrittliche Verpackungstechnologien, Substrate und Rack - Level - Systemherstellung. Zu seinen Partnern gehören ASE, SPIL, PTI, Wiwynn, Wistron, Inventec, Unimicron, AIC, Nan Ya PCB und Kinsus.
Chen Liwu gab auf der 54. Globalen Technologiekonferenz von J.P. Morgan bekannt, dass Intel 18A Panther Lake in die Massenproduktion gebracht habe und die Ausbeute monatlich um etwa 7 % steige, was die internen Erwartungen übertroffe.
Im Bereich der CPU betonte er, dass Intel tiefgreifendere Architekturänderungen vorantreiben und sich schrittweise zu einer maßgeschneiderten Chip - Entwicklung bewegen müsse. Im Bereich der Beschleuniger werde Intel die fehlenden Fähigkeiten durch die Zusammenarbeit mit SambaNova ergänzen.
Chen Liwu sagte: "Die Kombination aus fortschrittlicher Verpackungstechnologie, Wafer - Fertigungsfähigkeit und der neuen CPU - Architektur, die wir einführen, ist sehr aufregend." Seine Vorstellung von der zukünftigen Wettbewerbsweise von Intel erstreckt sich nicht mehr nur auf einzelne Chips. Chen Liwu betonte, dass man in Zukunft zu einem ganzheitlichen Ansatz übergehen muss und nicht nur auf der Ebene von Siliziumchips oder Netzwerken bleiben darf. Unternehmen müssen nicht nur Software - Fähigkeiten aufbauen, sondern auch den Arbeitsspeicher optimieren und echte Plattform - Lösungen vorantreiben, um am Ende ein komplettes Rack - Level - System - Architektur an die Kunden zu liefern. In diesem Prozess kann kein Unternehmen alleine agieren. Chen Liwu betonte besonders die Wichtigkeit der Zusammenarbeit. Intel brauche Partner, um seine Fähigkeiten zu ergänzen, und auch die Ökosystem - Partner, um die Kundenprojekte umzusetzen.
Nvidias Vera - CPU kommt mit Vollgas
Für Nvidia sitzt auf der einen Seite die Firma dank ihrer GPU fest an der Spitze des Datencenter - Marktes. Auf der anderen Seite betritt Nvidia mit der Vera - CPU den CPU - Markt.
Nvidia hat bereits die Grace - CPU und ist mit Grace Blackwell in die Phase der CPU - GPU - Superchips eingetreten. Laut offiziellen Informationen von Nvidia verbindet das GB200 NVL72 36 Grace - CPUs und 72 Blackwell - GPUs in einem Rack - Level, flüssigkeitsgekühlten System, um einen 72 - GPU - NVLink - Bereich zu bilden, um Szenarien wie die Echtzeit - Inferenz von Modellen mit Billionen von Parametern zu bedienen.
Vera ist der nächste, noch stärkere Schritt.
In der Telefonkonferenz des ersten Quartals des Geschäftsjahres 2027 sagte NVIDIA, dass Vera auf einem maßgeschneiderten Arm - Kern basiere und mit Rubin - GPU und NVLink end - to - end koordiniert entworfen sei. Im Vergleich zu x86 - Alternativen könne Vera eine bis zu 1,5 - fache Einkernleistung, ein doppeltes Leistungs - Stromverbrauch - Verhältnis und eine vierfache Rack - Dichte erreichen. Nvidia gab auch an, dass die Produktion und Auslieferung von Vera Rubin im zweiten Halbjahr 2026 starten würde, beginnend im dritten Quartal, und dass durch die Integration von sieben Arten von Spezialchips in fünf Beschleunigungsracks eine bis zu 35 - fache Inference - Durchsatz und eine bis zu 10 - fache Einnahmensteigerung für die KI - Fabrik im Vergleich zu Blackwell erreicht werden könne.
Nvidia will nicht nur GPUs herstellen, sondern CPU, GPU, NVLink, DPU, NIC, Switches und Softwarestapel zu einer kompletten Plattform integrieren.
Dies wird Druck auf Hersteller wie Intel, AMD, Arm, Broadcom und Marvell ausüben. Für Intel und AMD dringt Nvidia in den CPU - Markt ein. Für Broadcom und Marvell verringert Nvidia durch das Spectrum - X, ConnectX, BlueField und NVLink - System weiterhin die Macht der externen Interconnect - Chip - Anbieter. Für Arm ist Vera ein gutes, aber auch ein komplexes Signal: Sie stärkt die Präsenz der Arm - Architektur in Datencentern, kann aber auch dazu führen, dass die Arm - Ökosystem stärker an die Nvidia - Plattform gebunden wird.
Arm betritt den Chip - Markt
Die Server - CPU - Ökosystem verändert sich
Arm ist eine der am meisten beobachteten Variablen in der Expansion des CPU - Marktes.
Arms AGI - CPU ist sein erstes echten Massenproduktions - Chip - Produkt, das speziell für Agentic - AI - Workloads entwickelt wurde. Dieser Prozessor basiert auf der Arm Neoverse CSS V3 - Plattform und ist für Hochleistungsrechnungen und Hochdichte - Rack - Bereitstellungen konzipiert. Es wurde ein Rack - erstes Designkonzept gewählt. Laut offiziellen Informationen von Arm kann in einem 36 - kW - luftgekühlten ORv3 - Rack die Zielkonfiguration 30 1U - Server aufnehmen, wobei jeder Server zwei Arm AGI - CPUs enthält, was insgesamt 8.160 Hochleistungs - CPU - Kerne bietet.
Technisch