首页文章详情

我以为被英伟达吊打的AMD,在数据中心赚麻了

差评2026-06-10 10:22
性价比,是AMD的阳谋。

提到 AI 时代的最大赢家,差友们的第一反应,肯定是英伟达吧?

毕竟老黄这两年靠着给 AI 厂商"卖铲子",营收和市值都"遥遥领先"。而这一切,都得益于 20 年前老黄力排众议,坚持 CUDA 生态——这一把,真让他赌对了。

但你可能想不到,还有一家公司,左手拿着性能干不过英伟达的显卡,右手攥着 "过时" 的 4nm 工艺,居然也在 AI 竞争里赚得盆满钵满。

而它就是——A M D!

等会,这是怎么做到的?

前段时间,托尼受邀参加了AMD的AI开发者大会,回来后,我对这个问题有了一些答案。

不过这事儿嘛。。。得从十多年前苏妈靠锐龙翻身那会儿说起。

锐龙诞生之前,AMD 的处理器一直活在 "i3 默秒全" 的阴影里。

直到 Zen 架构横空出世——在 "硅仙人" 吉姆·凯勒的带领下,初代锐龙 IPC 性能实打实提升了 52%,8 核 16 线程的规格,更是在那个 4 核称王的年代震撼全场,也拉开了芯片厂之间 "核战争" 的序幕。

到了 2020 年的 Zen 3系列,AMD 终于一雪前耻:单核、多核性能双双干翻了英特尔同期旗舰。

而 AMD 的这场胜利,也逐渐从消费市场蔓延到数据中心 B 端。说到数据中心,很多人现在的第一反应,应该是老黄和他的 GPU 的天下。

但其实,从早期虚拟机、云服务,到如今的 AI,都离不开 CPU 的协调调度。

所谓数据中心,其实就是一个超级物流中心,本质是百万级的 "小快递" 同时配送。

即使单核 CPU 再快,面对百万小件,那也是分身乏术;而多核 CPU,就像雇了一支庞大的“司机车队”同时出发,还能通过“拼车”(虚拟化)服务更多客户,把效率拉满。

也就是说,到了数据中心这边,别管这那的,我就要那个核多的超大杯。

尤其是现在 AI 智能体兴起,工具调用、任务编排,还得靠 CPU 来干活。以至于前段时间的 GTC ( GPU 技术大会 )上,老黄也掏出属于英伟达的 CPU 来。

可这事儿呢,反倒是 AMD 的老本行了。在锐龙处理器证明了 Zen 架构的实力之后,AMD 的下一步,便是剑指数据中心。

十年前,数据中心的 x86 处理器,还是英特尔的一言堂:2016 年至强 Broadwell 最高 24 核,2017 年至强 Skylake-SP 最高 28 核。

可就在同年,AMD 开始爆种,掏出了 32 核的初代 EPYC 处理器。

而在接下来的十年里,AMD 把 EPYC 的核心数一路堆到了 256 核 512 线程!英特尔也被迫跟进,做出了 128 个大核、288 个小核的产品……

谁说英特尔不会堆核心?这不是挺会的嘛。

所以朋友们,不是英特尔突然有了良心,只是因为苏妈来过。。。

当然,光靠"便宜大碗"给家人们谋福利还不够,AMD 还祭出了杀手锏——

3D V-Cache

所谓 3D V-Cache,指的是在CPU上加一块大容量缓存。像是最早的 5800X3D,把 L3 缓存加到了 96M,对比普通版翻了 3 倍。

缓存大,对于打游戏来说,意味着帧数更高、更稳定。

但缓存大可不只对游戏有用,在数据中心同样能大杀四方。无论是需要超低延迟的金融交易,还是仿真计算、有限元分析这类重计算任务,都能靠 3D V-Cache 获得夸张的性能提升。

就拿 EPYC 9684X 来说,96 核心塞了足足 1152MB 三级缓存,相比竞品(至强 8490H)的优势几乎达到了 3 倍。

这些功能特性方面的投入,让 AMD 在今年彻底收到了回报。事到如今,哪个数据中心会不喜欢 AMD 的 EPYC 处理器呢?

这种喜欢,在市场份额上就体现得非常真实:2019 年之前,Intel 在数据中心的份额一度高达 97%;可随着 EPYC 的崛起,这个数字在 2025 年降到了 70% 左右。

换句话说,AMD 只用了短短 6 年,就从零拿下了 30% 的市场份额。

看来真香定律,在数据中心这也是能成立的。。。

靠着向数据中心卖 CPU,AMD 再也不会像曾经一样风雨飘摇,大厦将倾了。

当然了,大家也都知道,AMD 除了 CPU,也做显卡生意的,然而 AMD 的显卡 —— 也就是 GPU 业务,这两年过的则是。。。

其实在 2018 年之前,AMD 还是能跟英伟达掰掰手腕的。2006 年收购的 ATi(也就是如今 AMD 的图形部门),市场表现一直透着一股 "神鬼二相性":神的时候王牌对王牌,旗舰卡甚至能小胜英伟达;鬼的时候呢,旗舰卡只能勉强和老黄的中端卡过过招。

可转折点,在于老黄的神之一手:2018年,老黄开始在消费级 GPU 当中集成 RT Core 和 Tensor Core,并且同步推出了光线追踪和 DLSS 超分技术,如今这两项技术,每个臭打游戏的差友,应该都不会陌生。

可正是这两项颠覆传统光栅化渲染的技术,让 AMD 一下子陷入了被动:在这之后,两年后的 6000 系、四年后的 7000 系显卡,都没能拿出像样的光追和超分支持。

直到 2025 年 9000 系显卡的发布,AMD 才算有了不错的光追表现。而 A 卡的超分超帧技术——FSR,早期更是用传统算法糊弄。FSR 能用,但效果跟 N 卡的 DLSS 差着一截。同样,直到随着 9000 系一同推出的 FSR4,才是真正基于 AI 的超分技术,能和 DLSS 在画面表现上掰掰手腕了。

换句话说,AMD 在图形技术方面,花了 7 年时间才追上老黄的布局。

到了服务器端,剧情就更是大家熟悉的味道了:对 AI 支持最好、坐拥 CUDA 生态的 N 卡直接卖爆。AMD 这边确实没老黄那么有前瞻性,对标 CUDA 的 ROCm 直到 2016 年才出现,各类算法的支持和优化功底,也没 CUDA 那么深厚。

总结下来就是:无论是光追、超分超帧,还是大模型时代的软硬件支持,又或者是硬件性能,AMD 的 GPU 确实不是英伟达的对手。

也正因如此,很长一段时间里,AMD 的 GPU 都是靠"性价比"这一招,吃着老黄看不上的订单。

而 AMD 维持性价比优势的方法其实挺简单:又不是什么芯片都得用 2nm 先进制程,更便宜的 4nm,甚至 5nm 工艺其实也够用了嘛。

成本更低,卖的自然也可以更便宜。

而倒有点“无心插柳”的感觉:随着智能体引爆了市场对 CPU 和 GPU 的混合需求,AMD 正好是左口袋 CPU、右口袋 GPU,都能掏出东西来。

既然两边都能自研,那就可以整点不一样的花活了。于是,AMD 尝试偷师苹果,把更大规模的 CPU 和 GPU 都塞进同一块芯片,再把内存也整合进去。

AI Max+ 395 应运而生。这颗 U 在一颗芯片里,塞入了 16 核 CPU 和 40CU 的 “核显”,性能堪比独显的同时,又可以共享系统内存,用超大内存直接跑大模型。

曾经这个活只有苹果能干,可一台大内存的 Mac Studio 动辄三五万,而一台 395 的小主机只要一万多。虽然依旧不便宜,但对于那些重度使用大模型、同时又有隐私顾虑的小伙伴来说,这个价钱其实……挺划算的。

当然了,AMD 如今的问题也不少。

就拿 AI Max+ 395来说,生态短板依旧明显。托尼有同事一直用它跑本地大模型:面对主流的 LLM 模型,AMD 的兼容性没啥问题;可一旦想试试图片或者视频生成模型,又或者想进行模型微调,就不好说了。

面对生态劣势,一方面 AMD 把 ROCm 开源,想要借社区的力量来实现对 CUDA 的"弯道超车"。

另一方面,在这次 AMD AI 开发者大会上,苏妈给出了一个更适合 AMD 的答案——围绕性价比,构建一套属于自己的 AI 生态。

具体来说就是:开发者可以在 AI Max+ 395 这类终端上快速实现想法,再用 AMD 显卡的工作站做微调测试,最后在数据中心用 AMD GPU 完成生产部署。整套流程都跑在 AMD 的软件生态里,迁移起来自然顺畅得多。

理论归理论,实际用起来怎么样?

大会上给出了答案:单台 AI Max+ 395 最大支持 128GB 统一内存,能把 Qwen 122B 模型跑在本地;

4 台 395 互联,还能搞定更大更复杂的任务。同时,AMD 还宣布了与魔搭社区的合作,每人有 100 小时的云端算力体验时间——好不好用,自己试试就知道。

不论是拿下"过时"产能,在硬件上坚持性价比;还是上个月结束的 AI 开发者大会,如今 AMD 的种种动作,也是在尝试打造属于自己的软硬件生态。

今年 AMD AI 开发者大会,选在了对 AI 开源贡献最大的中国,足以见得 AMD 对生态的重视。

当补齐生态这块最短的板之后,即使 AMD 顶着"落后"工艺,性能也比不过的双重 Debuff,恐怕也能在市场杀出属于自己的一片天。

图片、资料来源

AMD官网

2026 AMD AI开发者大会

2026 GTC

How Chip Giant AMD Finally Caught Intel

Mercuy Research

本文来自微信公众号“差评X.PIN”,作者:洛洛 & 米罗,编辑:米罗,36氪经授权发布。