Hören Sie auf, nur auf Grafikkarten zu starren: Intel's gewaltige Waffe - Kann es NVIDIA's Rechenleistungsmacht beenden?

CPU, kehre zurück.

In den letzten zwei Jahren war die Kernkomponente der KI-Hardware fast ausschließlich eine: die GPU.

Von der Trainingsphase großer Modelle über Inferenzcluster bis hin zur Rechenleistung an Endgeräten und in der Cloud diskutiert die gesamte Branche, wer mehr GPUs beschaffen kann und wer mehr Rechenleistungskarten in die Rechenzentren packen kann. Man kann sagen, dass die gesamte KI-Branche um die GPU herum kreist, was auch dazu beigetragen hat, dass die Aktienkurse von NVIDIA ständig neue Höchstwerte erreicht haben.

Auf der COMPUTEX 2026 hat Intel jedoch eine andere Einschätzung abgegeben: Im nächsten Stadium der KI darf man nicht nur auf die GPU schauen. Der Kern dieser Einschätzung ist das von Chen Liwu in seiner Keynote wiederholt betonte Stichwort: Agentic AI, also das, was wir gewöhnlich als Intelligenzagenten bezeichnen.

Quelle: Intel

Intelligenzagenten verändern die Rechenökosysteme

Der Unterschied zwischen Intelligenzagenten und herkömmlicher KI ist eigentlich sehr groß. Die herkömmliche KI funktioniert wie eine "Runden-basierte" Frage-Antwort-Maschine, während Intelligenzagenten in den echten Arbeitsablauf eingreifen und den Zyklus von "Denken, Planen, Handeln, Reflektieren" aktiv durchführen müssen. Mit anderen Worten, sie müssen lernen, Daten zu lesen, Tools aufzurufen, Aufgaben auszuführen und die Ergebnisse zu überprüfen, und dann ständig anhand der Rückmeldungen den nächsten Schritt anzupassen.

Dies bedeutet, dass die KI-Inferenz nicht mehr nur ein "einmaliges Geschäft" ist, sondern zu einem kontinuierlich laufenden System für Selbstentscheidung und Selbstinferenz wird, was auch die Art und Weise, wie die Rechenleistung genutzt wird, völlig verändert. Deshalb ist die zentrale These von Intel in diesem Fall: Agentic AI wird die Verteilung der Rechenleistung in Rechenzentren neu gestalten.

Zurzeit kann das Verhältnis von CPU zu GPU in der Phase des Trainings von Spitzenmodellen nahezu 1:8 betragen, wobei die GPU den Großteil des Rechenaufwands trägt. Wenn man jedoch in den Inferenzmodus für Intelligenzagenten wechselt, muss die CPU Aufgaben wie die Aufgabenplanung, den Tool-Aufruf, die Datenmigration und die Systemkoordination übernehmen. In diesem Fall wird das Verhältnis von CPU zu GPU allmählich auf 1:1 gehen, und es kann sogar eine höhere CPU-Dichte erforderlich sein, um die Aufgaben schnell aufzuteilen.

Tatsächlich verhält sich ein Intelligenzagent, wenn er nicht nur eine Antwort generiert, sondern ständig Modelle, Tools und externe Systeme aufrufen muss, völlig anders als herkömmliche KI. In der Präsentation hat Intel eine Statistik erwähnt: Im Vergleich zur einfachen Inferenz kann der Token-Verbrauch eines Intelligenzagenten um bis zu 1.000 Mal steigen.

Quelle: Intel

Mit anderen Worten, Intelligenzagenten bringen nicht nur ein einfaches Wachstum der Inferenzmenge mit sich, sondern auch eine komplexere, häufiger auftretende und fragmentiertere Systemlast. Wenn man diese Lasten weiterhin an die GPU abwälzt, ist dies sowohl ineffizient als auch teuer.

Der von Intel neu veröffentlichte Xeon 6+ Prozessor basiert auf Intel's 18A-Prozesstechnologie, verfügt über bis zu 288 Energiesparkerne und bis zu 576 MB L3-Cache. Für Cloud-native, Agentic AI- und netzwerkintensive Lasten kann er eine höhere Energieeffizienz und eine stabilere kontinuierliche Leistung bieten.

In der von Intel vorgeschlagenen Lösung kann ein einzelner flüssigkeitsgekühlter Rack mit 32U Rechenraum 36.864 Kerne bieten. Der Stromverbrauch des Racks beträgt nur etwa 100 kW, was ausreicht, um eine hochdichte Intelligenzagenten-Bereitstellung zu unterstützen. Obwohl 100 kW auf den ersten Blick beeindruckend klingt, ist der Stromverbrauch im Vergleich zu früheren Serverracks mit gleicher Leistung erheblich gesenkt.

Außer dem Xeon 6+ gibt es noch etwas, das sich lohnt, beachtet zu werden: Intel's Neuaufteilung der Inferenzarchitektur.

In der Präsentation hat Intel angekündigt, zusammen mit Partnern wie SambaNova, Vista Equity Partners und Cambium Capital ein neues, vollständig entkoppeltes Inferenzkonzept vorzustellen. Dieses Konzept läuft auf der Vector Core Compute-Intelligenzagenten-Cloud. Der Intel Xeon 6-Prozessor ist für die Planung und Ausführung zuständig, der SambaNova SN40RDU für die Decodierung und die NVIDIA Blackwell GPU für die Vorbelegung.

Quelle: Intel

Dieses neue Konzept ist speziell für die Lasten von Intelligenzagenten entwickelt. Im Gegensatz zu vielen früheren KI-Systemen, die es gewohnt sind, den Großteil der Arbeit in der Inferenzkette an die GPU zu delegieren, haben in diesem System CPU, RDU und GPU jeweils ihre eigenen Aufgaben und sind für verschiedene Schritte wie die Systemsteuerung, die Decodierung und die Vorbelegung verantwortlich. So kann jeder Inferenzschritt auf der am besten geeigneten Hardware ausgeführt werden, um die Effizienz zu maximieren.

Nach der Präsentation des Xeon 6+ ist auch der kürzlich veröffentlichte dritte Generation Core Ultra-Prozessor wieder aufgetaucht. Er ist ein weiterer Baustein in Intel's KI-Ökosystem - der Kern der Edge-KI. In der Präsentation haben Intel und Perplexity einen hybriden lokalen Server gezeigt, der auf dem dritten Generation Core Ultra und dem Xeon 6+-Cloud-Server basiert.

Quelle: Intel

Er kann die Arbeitslast dynamisch zwischen lokalem Gerät und Cloud verteilen, basierend auf der Gerätefähigkeit und den Funktionsmerkmalen. Dadurch wird die Abhängigkeit von der Cloud-Rechenleistung weiter reduziert. Dies ist auch die ideale Form zukünftiger AIPC-Geräte: Durch die dynamische Leistungszuteilung können die Token-Kosten gesenkt werden, während die Sofortigkeit der Aufgaben und die Datenschutzanforderungen gewährleistet bleiben.

Außer für PCs hat Intel den dritten Generation Core Ultra auch auf Handheld-Gamingkonsolen und Edge-Computing erweitert. Der neu veröffentlichte Arc G3-Serie-Prozessor ist für Handheld-Gaminggeräte entwickelt und auf der gleichen Architektur optimiert. Er wird später in diesem Monat auf den Markt kommen (die von Handheld-Benutzern am meisten erwartete integrierte Grafikkarte ist bald da).

Von der Standard- zur maßgeschneiderten Lösung: Intel will "überall sein"

Außer den Standardprozessoren hat Intel diesmal auch auf maßgeschneiderte Chips hingewiesen, was auch ein Geschäftsfeld ist, das Chen Liwu seit seiner Zeit als CEO von Intel fördert.

Intel ist der Meinung, dass maßgeschneiderte Chips in Zukunft einen riesigen Markt haben werden. Denn wenn die KI in verschiedene Branchen eindringt, werden die Kunden immer weniger zufrieden mit der Standard-Rechenleistung sein. Um höhere Effizienz und Leistung zu erzielen, werden sie sich zunehmend für maßgeschneiderte Chips entscheiden, um ihre Wettbewerbsfähigkeit aufrechtzuerhalten.

In der Präsentation hat Intel erwähnt, dass es zusammen mit Google an der Entwicklung von IPUs arbeitet. Solche Chips sind für Cloud-Anbieter sehr wichtig, um die Leistung ihrer Infrastruktur zu verbessern. Gleichzeitig arbeitet Intel auch mit Telekommunikationskunden wie Ericsson zusammen und bietet weltweit fortschrittliche Chips für drahtlose Infrastrukturen an.

Dies ist eigentlich ein weiteres Thema in Chen Liwu's Präsentation: Intel will nicht mehr nur mit einem Standard-Chip den Markt erobern, sondern stattdessen Chip, System, Software und Branchenpartnerschaften zu einer ganzheitlichen Lösung zusammenfassen, die nach den Bedürfnissen verschiedener Unternehmen maßgeschneidert werden kann, um Intel's Stärken optimal auszunutzen.

Quelle: Intel

Nach Ansicht von Lei Technology definiert Intel eigentlich seine Ökosystem-Position neu: Rechenzentren benötigen CPUs für die Planung von Intelligenzagenten, Inferenzsysteme benötigen heterogene Entkopplung, um die Kosten zu senken, PCs benötigen lokale KI, um Datenschutz- und Compliance-Probleme zu behandeln, Edge- und Embodied AI benötigen energieeffiziente Chips, und Branchenkunden benötigen maßgeschneiderte Chips.

Indem Intel die Bedürfnisse von Unternehmen in verschiedenen Bereichen und an verschiedenen Stellen der Wertschöpfungskette erfüllt, wird es noch "überall" sein als NVIDIA.

Natürlich steht Intel immer noch vor großen Herausforderungen. NVIDIA hat immer noch deutliche Vorteile bei KI-Beschleunigern und Software-Ökosystemen, und AMD setzt auch weiterhin Druck auf Server-CPUs und KI-Chips. Ob Intel diesen Weg erfolgreich gehen kann, hängt letztendlich von der Serienproduktionsgeschwindigkeit von 18A und der schnellen Umsetzung des Xeon 6+-Rack-Konzepts ab, sowie davon, ob die Kunden tatsächlich signifikante Vorteile aus dieser neuen Lösung ziehen können.

Aber zumindest ist Intel diesmal klarer im Kurs.

Man kann sagen, dass mit der Eintrittszeit der KI in die Ära der Intelligenzagenten der Wettbewerb nicht mehr nur auf den Spitzenwert der Leistung eines einzelnen Chips abzielt, sondern die Optimierung der Koordinationseffizienz des gesamten Rechensystems betrifft. Die GPU bleibt zwar wichtig, aber auch die CPU, Edge-Geräte, lokale KI und maßgeschneiderte Chips werden wieder an Bedeutung gewinnen.

Und genau diese Phase der Neuaufteilung der KI-Infrastruktur will Intel nutzen.

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

Hören Sie auf, nur auf Grafikkarten zu starren. Intel hat eine gewaltige Waffe ausgepackt. Kann es die Rechenleistungsmacht von NVIDIA beenden?

Intelligenzagenten verändern die Rechenökosysteme

Von der Standard- zur maßgeschneiderten Lösung: Intel will "überall sein"