StartseiteArtikel

COMPUTEX-Sonderbericht: Intel Data Center präsentiert erstmals einen 288-Kern-CPU und eine GPU mit 480 GB Grafikspeicher. Die 18A-Technologie ist da.

半导体产业纵横2026-06-01 11:51
Intel zeigt die Stärke seiner gesamten Produktpalette im Datencenter.

Der Datencenter-Bereich ist derzeit der heißeste Sektor in der gesamten Technologiebranche.

Das Datencenter-Geschäft von NVIDIA hat in mehreren aufeinanderfolgenden Quartalen Rekorde aufgestellt. Die EPYC-Serie von AMD weist ein starkes Wachstum auf. Der Bedarf an KI-Inferenz löst eine Rüstungsrace im Bereich der Rechenleistung aus. Zu diesem Zeitpunkt reift die Intel 18A-Prozesstechnologie von Intel, und die Umstellung des Outsourcing-Geschäfts tritt in die kritische Phase ein.

Heute hat Intel erstmals seine gesamte Produktpalette im Datencenter-Bereich präsentiert - CPU, GPU und Netzwerkkarten, alles dabei. Dies ist nicht nur eine Produktpräsentation, sondern auch die Veröffentlichung einer strategischen Richtung. Die Kombination dieser drei Dinge macht diese Pressekonferenz zu einem ausgezeichneten Fenster, um die strategische Ausrichtung von Intel zu beobachten.

Xeon 6+: Der 288-Kern-Monster taucht auf, Premiere der 18A-Prozesstechnologie

Das wichtigste Produkt dieser Präsentation ist der Xeon 6+.

Intel setzt erstmals die Intel 18A-Prozesstechnologie bei einem Datencenter-Prozessor ein. Noch wichtiger ist, dass es die Foveros Direct 3D-Packaging-Technologie nutzt, um die auf 18A basierenden Rechenchips auf dem Substratchip von Intel 3 zu stapeln und dann die Verbindung mit der EMIB-Technologie herzustellen. Das gesamte Package besteht aus 29 Komponenten: 12 Rechenchips, 3 aktive Substratchips, 2 I/O-Chips und 12 EMIB-Verbindungs-Tiles.

Ein einzelner Prozessor kann bis zu 288 Energieeffizienzkerne haben. Dies ist die derzeit höchste Kerndichte in der Branche. In Kombination mit einem LLC-Cache von bis zu 576 MB (mehr als fünfmal höher als bei der vorherigen Generation) und einem DDR5-Speicher mit 8000 MT/s wurde das Speichersubsystem erheblich verbessert. Bei den gängigsten Workloads kann die Gesamtleistung um bis zu 2,26 Mal und die Leistung pro Watt um bis zu 1,55 Mal gesteigert werden. Im Vergleich zu Konkurrenten ist die Leistung pro Thread des Xeon 6+ um 1,3 Mal höher, und die Leistung pro Thread und pro Watt ist ebenfalls um 1,3 Mal höher.

Die 18A-Prozesstechnologie bringt zwei wichtige technologische Upgrades mit sich: PowerVia ermöglicht kürzere und direktere Stromversorgungspfade und senkt effektiv den Energieverbrauch; RibbonFET senkt den Standby-Energieverbrauch und verbessert gleichzeitig die Leistungskonsistenz.

Ein recht anschauliches Beispiel: Im Vergleich zum zweiten Generation Xeon kann der Xeon 6+ eine Server-Integrationsrate von 9:1 erreichen, den Platzbedarf im Rack um fast 80 % reduzieren und gleichzeitig den Energieverbrauch um 73 % senken. Dies hat einen großen Einfluss auf die Betreiber, die mit den Energieverbrauchs- und Kühlungsproblemen in den Datencentern zu kämpfen haben. Ericsson hat den Xeon 6+ in der Paketkernnetzarchitektur in einer realen Betreiberumgebung getestet: Im Vergleich zur vorherigen E-core-Generation wurde bei gleicher Anzahl von Kernen die Leistung um 30 % gesteigert, der Rack-Energieverbrauch um 38 % gesenkt und die Leistung pro Watt um mehr als 60 % verbessert.

Intel bringt auch eine neue Hardwarfunktion mit: Intel AET (Anwendungs-Energieeffizienz-Telemetrie-Technologie). Sie kann die CPU-Energieaufnahme auf Workload-Ebene in Echtzeit überwachen, sodass die Datencenterbetreiber eine feinere Energieeffizienzoptimierung und Kostenteilung erreichen können. Für Cloud-Dienstleister und Unternehmensdatencentern bedeutet dies eine bessere Kontrolle der Gesamtbetriebskosten (TCO) und eine präzisere Ressourcenplanung.

Die erste Datencenter-GPU mit 480 GB Grafikspeicher - eine dominierende Leistung

Wenn der Xeon 6+ die Basis von Intel verteidigt, ist die Crescent Island der erste offizielle Schritt in den Datencenter-GPU-Markt. Dies ist die erste Datencenter-GPU auf Basis der Xe3P-Architektur, die speziell für KI-Inferenz und Agent-Workloads optimiert ist. Ihre Kernparameter sind beeindruckend: 480 GB LPDDR5-Speicher und 350 W TDP.

Die Zahl 480 GB hat eine besondere Bedeutung. Nehmen wir DeepSeek-V4 (1,6 T Parameter) als Beispiel: Bei FP8-Quantisierungsgenauigkeit können mit nur vier Crescent Island-Karten die Deploymentanforderungen erfüllt werden. Längere Kontextfenster und häufigeres Modellwechseln, die in Agent-Workflows häufig vorkommen, werden dank des großen Speichers kapazitätsmäßig besser handhabbar. Die Wahl von LPDDR anstelle von HBM senkt den Energieverbrauch auf 350 W, was bedeutet, dass die Karte in bestehenden luftgekühlten Datencentern direkt betrieben werden kann, ohne dass eine Flüssigkeitskühlung erforderlich ist.

Zusätzlich unterstützt die Crescent Island native FP64. Dies macht sie nicht nur zu einer KI-Inferenzkarte, sondern legt auch den Grundstein für den zukünftigen Eintritt in den HPC-Markt. Intel arbeitet an einem Software-Stack, der die CPU und die Crescent Island kombiniert, um bessere HPC-Anwendungen zu unterstützen. Intel kontrolliert offensichtlich die Produktgrenzen. Es hat die für einige allgemeine Szenarien unnötigen Funktionen entfernt und die Transistorfläche für die KI-Leistung freigegeben.

Im Bereich der Software baut Intel einen einheitlichen Xe-Software-Stack um vier Prinzipien herum: Offenheit, skalierbare Leistung, hervorragende Benutzererfahrung und Unterstützung heterogener Infrastrukturen. Intel hat die Strategie der Vorrangigkeit der oberen Schicht gewählt: Hauptstrom-Frameworks wie PyTorch, vLLM und SGLang werden ab Tag 0 unterstützt. Außerdem hat Intel eine Partnerschaft mit SambaNova eingegangen. Letztere konzentriert sich auf die Hochdurchsatz- und Niedrig-Latenz-Inferenz in großen Systemen, während die Crescent Island auf die kleine-Skala-Deployment auf Endgeräten und in Unternehmen (z. B. 8- oder 16-Karten-All-in-One-Systeme) abzielt.

Zurzeit arbeiten mehr als 20 OEM- und ODM-Hersteller an der Entwicklung für die Crescent Island. Hinter dieser Zahl verbirgt sich ein Signal für die beschleunigte Expansion des Intel-Ekosystems.

Neben der CPU und der GPU wurde auch eine neue E835-Ethernet-Netzwerkkarte vorgestellt. Sie bietet eine Durchsatzleistung von bis zu 200 GbE, unterstützt RDMA und dynamische Gerätepersonalisierung (DDP). Bei einer vollen 200-G-Geschwindigkeit in beiden Richtungen ist der Energieverbrauch um 28 % bis 47 % niedriger als bei vergleichbaren Produkten, und das Energieeffizienzverhältnis ist 1,4 bis 1,9 Mal höher als das von Konkurrenten. Die integrierte Hardware-Sicherheit, wie z. B. das Vertrauenszentrum auf Siliziumbasis und die Firmware-Authentifizierung, sowie die Produktlebensdauer von über 10 Jahren bieten den Datencentern eine stabile technologische Investitionssicherheit für den langfristigen Betrieb.

Im Zeitalter der Agentic AI kehrt die CPU in die Mitte des Spiels zurück

In den letzten ein oder zwei Jahren war die KI-Inferenz fast gleichbedeutend mit der Arbeit der GPU. Doch mit dem Aufstieg der Agentic AI ändern sich die Regeln des Spiels. Kevork Kechichian, stellvertretender Vorsitzender und Geschäftsführer der Datencenter-Geschäftseinheit (DCG) von Intel, sagte: "Die CPU befindet sich jetzt in der Mitte aller dieser Prozesse und versucht, das gesamte Ganze zu organisieren und zu planen."

Der Agent-Workflow ist mehrstufig, erfordert mehrere Inferenzen und Berechnungen und erfordert ein sehr langes Kontextfenster. Mehrere Experten-Agenten können mehrere Sub-Agenten hervorbringen, um komplexe Aufgaben zusammen zu bewältigen. Dies führt zu einem exponentiellen Anstieg des Token-Verbrauchs. In einem solchen Szenario ist die GPU für das Denken (Inferenz, Codegenerierung) zuständig, während die CPU für die Ausführung (Organisation, Planung, Simulation, Kontextverwaltung) verantwortlich ist. Das Verhältnis zwischen GPU und CPU entwickelt sich von dem traditionellen Verhältnis von 1:8 zu 1:4, 1:2 oder sogar 1:1. In Szenarien der verstärkten Lernfähigkeit kann es sogar umgekehrt sein.

Dies erklärt, warum die hohe Kerndichte des Xeon 6+ so wichtig geworden ist. Intel hat gemessen, dass auf der Basis des 288-Kern-Clearwater Forest problemlos 400 bis 500 oder mehr Agenten parallel betrieben werden können. Noch wichtiger ist, dass die eingebauten Beschleuniger (Matrix-Engine, Vektor-Engine) und die Fähigkeiten der vertraulichen Berechnung (TDX, SGX) der CPU genau den strengen Anforderungen an Datenschutz und sichere Isolation in Agent-Szenarien entsprechen. Wenn mehrere Agenten parallel laufen und mehrere Mieter parallel geplant werden, können TDX und SGX auf einer vertrauenswürdigen Plattform sicherstellen, dass die vertraulichen Informationen in einem sicheren und kontrollierbaren Rahmen funktionieren.

Das x86 wird noch 2030 die Dominanz behalten

Der Einfluss der x86-Architektur im Datencenterbereich hat sich durch die KI-Welle nicht geschwächt, sondern in einigen Schlüsselbereichen sogar neu gestärkt.

Intel unterteilt die Workloads in drei Kategorien: Skalierbare Szenarien, die eine hohe Rechenleistung erfordern, allgemeine Szenarien, die eine Balance zwischen Leistung und Datendurchsatz anstreben, und rechenintensive KI-Trainingsszenarien. Doch neben diesen traditionellen Kategorien entsteht ein neuer mittlerer Bereich. Das gemischte Szenario auf der Inferenzseite: GPU-Level-Beschleunigung, aber der Hauptteil ist immer noch die CPU.

Der Aufstieg dieses dritten Szenarios hat weitaus größere Bedeutung als es auf den ersten Blick scheint. Es besteht ein deutlicher Unterschied zwischen KI-Inferenz und -Training. Das Training erfordert eine massive parallele Berechnung, und die GPU ist hier die absolute Hauptkraft. Im Inferenzstadium, insbesondere in Unternehmens-Agent-Workflows, sind mehrere Schritte der Inferenz, die Kontextverwaltung, die Planung und die Simulation involviert - genau das, was die Stärken der CPU sind. Wenn der Token-Verbrauch exponentiell ansteigt, wenn mehrere Agenten parallel laufen und wenn ein sehr langes Kontextfenster aufrechterhalten werden muss, ist die CPU nicht mehr ein Zuschauer, sondern das Organisationszentrum des gesamten Systems.

Intel hat auf der Pressekonferenz eine Zahl genannt: Es wird geschätzt, dass bis 2030 80 % der über 80 Millionen in Betrieb befindlichen Server weltweit noch auf der x86-Architektur basieren werden. Derzeit laufen die Inferenz und die Agent-AI fast vollständig auf x86-Systemen.

Die breite x86-Software-Ökosystem und die Community der Entwickler, die jahrelang geschliffenen Hardware-Beschleunigungsfähigkeiten (IAA-Speicherkompression, CXL-Speichererweiterung usw.) sowie die reifen Verwaltungsmöglichkeiten und Sicherheitsmerkmale waren in der Vergangenheit vielleicht nur "Grundlagen", aber im Zeitalter der Agent-AI sind sie plötzlich zu einem Schatz geworden. Die hohen Speicherkosten und der sprunghafte Anstieg des Kapazitätsbedarfs bringen die IAA-Technologie wieder in den Fokus der Kunden; die Fähigkeit des CXL-Speicherpools ermöglicht es, den Cache-Level über mehrere CPUs hinweg zu teilen.

Intel reagiert auch auf diese Differenzierung durch eine feinere Architektur. Für verschiedene Workloads verfol