首页文章详情

高通的「共享内存架构」,想让 Win 本追上 MacBook Pro

爱范儿2026-04-29 10:58
Windows 用户不做二等公民。

一台 14 或 16 英寸的笔记本电脑,将几十上百 GB 内存直接封装进 SoC,实现超过 200 GB/s 的高性能内存带宽,还有轻薄的机身和安静又狂暴的性能……

你可能以为这是 MacBook Pro——但如果我告诉你,这是一台 ARM 架构的轻薄型 Windows 本呢?

4 月 27 日,华硕发布了灵耀 16 Air 的骁龙版,搭载的是高通骁龙 X2 Elite Extreme 平台,也即高通去年推出的第二代 Windows on ARM 处理器。

这是第一颗将 LPDDR5X 内存做进 SoC 封装的骁龙旗舰 PC 平台,是与苹果「统一内存架构」理念一致、执行接近的平行方案。尽管没能做到 M 芯片的百分百效果,仍然是高通在这条新路上,最关键的一次尝试。

这台华硕灵耀 16 Air 骁龙版,整机 1.2kg、厚度 13.9mm,48GB 内存(频率 9523 MT/s),可提供 20-30 小时续航。机器于 4 月 28 日京东首发,售价 13999 元。华硕同时也有 14 寸版本提供。

同期亮相的还有面向创作者的 ProArt 创 X 2026 二合一笔记本,重 0.82kg、提供 22 小时续航与 2.8K 144Hz OLED 屏。这些机型共同组成了华硕在 ARM Windows 阵营的 2026 全新产品矩阵。

回到顶配 X2 Elite Extreme 的共享内存架构:将内存放进芯片封装内,放到 CPU、GPU 和 NPU 的身边,并不只是改了改电路板布局。实际上,整个计算资源调度的方式,都发生了很大的改变。

苹果在 2020 年的 M1 芯片开始,不仅将内存封装进 PC 级芯片,更让调度变得更加灵活,内存反复读写的次数要求有所降低,结果就是让内存带宽暴增——称为统一内存架构。今年 3 月发布的 M5 Pro 和 M5 Max,则更是将内存带宽推到了 307 GB/s 和 614 GB/s。

骁龙 X2 Elite Extreme 是 Windows on ARM 笔记本第一次通过内存内封装的思路,让 1.2 公斤左右的轻薄本也可以享受类似于统一内存架构带来的快乐。

这背后,是高通和各大 OEM 一起,想让 Windows 笔记本追上 MacBook Pro 的企图。

让内存搬运再快一点

需要注明的是,「统一内存架构」是苹果使用的说法,高通官方称自己的方案为 SiP(System-in-Package)。

两者所指不完全相同:UMA 描述的是内存访问架构,SiP 则指的是具体的封装技术。但它们的实现效果和追求目标高度一致——共享物理内存池、跨 IP 块缓存一致。

可用于算力密集型任务(比如 AI 推理)的「显存」上限,直接等于整机的内存上限。哪怕是一台 48GB 的轻薄本,理论上也可以本地运行数百亿参数级别的大模型,这在传统架构上需要工作站级独显,采用集显的轻薄本很难做到。(X2 Elite Extreme 最高 SKU 为 128GB 共享内存。)

系统级缓存(SLC)可以在 CPU、Adreno X2 GPU、Hexagon NPU 之间动态分配,比上一代带宽高 70%;192-bit 内存总线搭配 LPDDR5X-9523,能够实现高达 228 GB/s 的C/G/NPU 共享内存带宽。

而传统的混合计算负载(同时依赖 C/G/NPU),被内存搬运所掣肘的情况,也得到了极大缓解。并且,整机功耗也能维持在轻薄本可以接受的水平。

更值得一提的是,这一代 Hexagon NPU 还专门把 DMA 单元升级到 64 位虚拟寻址,让 NPU 终于可以访问超过 4GB 的内存,一定程度上突破了 NPU 坐端侧大模型推理任务的瓶颈。

这的确不是 Windows 阵营第一次试水类似统一内存架构的方案,在此之前,英特尔、AMD 都做过尝试(稍后会详述)。

不过在今天,华硕灵耀 16 Air 骁龙版的高配机型,是 Windows 阵营里首个最大限度接近统一内存架构效果,并且还做到 1.2 公斤左右 ARM 轻薄本上的方案。

让更多 Windows 笔记本用上新架构

在共享/统一内存架构的道路上,每家芯片巨头对的判断都不一样,首先是工程问题,更深一层是商业问题。

一名在某芯片巨头供职的专家告诉爱范儿,行业里无人质疑统一内存架构的优秀,但做与不做,能否持续做,分歧在于厂商对性能目标和成本之间的平衡。

在 X2 顶配 SKU 上,高通目前的看法是:将统一内存架构所解锁的强大性能,交给给到真正需要它的硬核用户,特别是那些工作流里重度依赖 AI 模型/AI 功能的专业用户和创作者,这件事值得花成本去做。

再看英特尔,在上一代 Lunar Lake 架构上做过类似尝试,然而成本炸裂难以控制,不得不终止。英特尔前 CEO Pat Gelsinger 在财报会上明确将该次尝试定义为「one-off」,理由是封装内存把毛利压得太低。

今年 1 月发布的 Panther Lake 机型则回归了传统外置内存路线,据信后续的 Nova Lake 架构也将延续老的策略。英特尔仍然在高端 AI 笔记本市场上占有一席之地,但可以说短期内不会再走统一内存架构这条路了。

AMD 那边,Ryzen AI Max+ 395(Strix Halo)同样采用类似的共享内存架构架构,最高 128GB 板载 LPDDR5X,能够实现高达 256 GB/s 内存带宽,比 X2 Elite Extreme 还激进。

正因为此,在 AMD 的定义下 Strix Halo 属于移动工作站芯片,搭载的笔记本价格都更高,形态也更厚重,抑或是搭载于迷你工作站,不在个人笔记本电脑消费者的选购范围内。

三家芯片厂商,三种不同答案。骁龙 X2 Elite Extreme 消费级笔记本在这个时间点正式面市,虽然很难说撞上了换机窗口(毕竟今年的内存实在太贵),但至少填补了消费级市场的真空。

何时能追上 MacBook Pro 呢?

老实说,骁龙 X2 Elite Extreme 目前也只是跟苹果那边的 M5 基础款能打个有来有回,跟 M5 Pro/Max 这样的工作站级「顶级牛马」距离还比较远。

最直接的差距在于内存带宽的极限值:X2 Elite Extreme 的带宽宣传值能够达到 228GB/s,是 M5 Max 的 ⅓ 左右,比 M5 Pro 的 ⅔ 多一点。

当然还是要给 X2 挽尊一下,这一代仍然是单 die(晶粒),内存带宽存在物理上限。

而苹果在 M5 Pro/Max 这一代用上了新的「融合封装」,也即将两块 die 拼到一起,把内存总线扩展到更高。

在最直接的大模型推理任务上,内存带宽差距直接意味着 token 吞吐速度的差距;在 4K/8K 等极高清的视频剪辑和 AI 处理任务上,或者在其他工程软件的算力密集型任务上,也会有明显体现。

不过至少,Windows 平台在这些专业/工业软件的兼容性上是要比 macOS 好的……

我想,骁龙把共享内存架构带进消费级 Windows 笔记本市场,这件事的意义讨论或许不应该局限于性能数字上谁暴打谁,

而在于 Windows 平台用户不应该一直享受「二等公民」的体验。

即便是一台不超过 1.5 公斤的大屏轻薄本,仍然可以提供远比其它 Windows 性能本更好的 AI 算力,而且仍能保住轻薄本应该有的功耗优势——这,才是更重要的。

当然,围绕在 Windows on ARM 周围的种种问题,比如软件生态、x86 模拟层稳定性、专业软件适配等等,仍然无法被共享内存一劳永逸地解决。

从芯片厂,到微软,再到 ISV,大家都在加紧马力。比如 Photoshop、Lightroom 已经能够稳定运行 ARM 原生版本;达芬奇也早在两年前就完成了 Windows on ARM 的原生支持,甚至比 Adobe 还早。

但软件生态兼容仍有不完美之处,比如 Adobe AE 的部分渲染器和工作流仍然只能在 x86 平台上使用;Blender 的一些渲染功能在 ARM 架构上也会性能打折。

这是一个软件追硬件的时代。只有 X2 这一代能够让足够多用户,特别是创作者和专业用户,真正将骁龙本纳入主力机考虑——ARM 生态才会进入「用户越多适配越多,适配越多用户越多」的正反馈。

苹果也走过同样的路,所以这绝非不可能完成的任务。

本文来自微信公众号“爱范儿”,作者:杜晨,36氪经授权发布。