首页文章详情

刚刚,黄仁勋直接抄了英特尔和AMD的家

雷科技AGI2026-06-01 18:09
黄仁勋口袋里的东西太多了。

「(我口袋里)太多东西了。」老黄用中文吐槽道。

图片来源:英伟达

6 月 1 日,台北电脑展前夕,GPU 史上最佳带货主播、英伟达创始人黄仁勋举办了一场 GTC Taipei 2026 主题演讲,展示了围绕英伟达的 AI 工厂生态,还发布了 Vera CPU、Vera Rubin、Vera BlueField-4 STX、DSX、RTX Spark 等。

一串名字砸下来,普通人很容易只记住两个字:很强。

如果只看参数,黄仁勋这次台北演讲很像一场典型的 NVIDIA 发布会。但真正值得注意的变化是英伟达正在把 CPU、GPU、网络、存储、散热、Windows PC,甚至安全权限,全部拧进同一个故事里。

这个故事的名字叫「智能体 AI」,最重要的两个新角色是面向数据中心的 Vera CPU,以及面向个人电脑的 RTX Spark(此前网传的 N1X)。

而从 GPU 到 CPU,再到「重新发明个人电脑」,英伟达不只想继续卖 GPU,它还想继续定义 AI 时代里,数据中心和个人电脑到底该长什么样。

英伟达 Vera 炸场:AI 时代的原生 CPU

先看最硬的一块:Vera CPU。

过去几年的 AI 浪潮之中,英伟达的核心一直是 GPU。从 A100、H100 到 Blackwell,AI 产业的焦虑也基本围绕 GPU 展开,谁买得到,谁供得上,谁能把机柜堆起来。但当大模型从聊天机器人走向智能体,问题开始变复杂。

一个 AI 智能体不只是生成一段文字,它要拆任务、查资料、跑代码、调用工具、验证结果,甚至同时维持成千上万个执行环境。

这时候,CPU 又被推回了台前。于是我们也看到了英伟达为 AI 时代设计的 Vera CPU。

英伟达对 Vera 的定义很直接,这是第一颗为 AI 智能体超大规模运行打造的 CPU。它有 88 个自研 Olympus 核心,支持 Spatial Multithreading,LPDDR5X 内存带宽最高 1.2TB/s。放到 Vera Rubin 系统里,它还能通过第二代 NVLink-C2C 和 GPU 以最高 1.8TB/s 的一致性带宽相连。

图片来源:英伟达

参数背后,CPU 不再只是给 GPU 打杂的「房管」。在智能体工作流里,代码执行、数据处理、沙盒环境、任务编排,都会变成算力工厂的关键路径。英伟达说 Vera 相比 x86 CPU 能带来 1.8 倍更快的任务完成速度,之前也强调过 2 倍能效和 50% 性能提升。

AI 工厂的竞争,已经从「每张卡多少钱」变成「每瓦电能产出多少 token」。Vera Rubin 就是这个逻辑的放大版。

老黄还宣布,Vera Rubin 正在进入全面量产,系统由 Vera CPU、Rubin GPU、Groq 3 LPX、BlueField-4 STX 存储和 Spectrum-6 网络等机架组成。官方给出的说法是,相比上一代 Grace Blackwell,Vera Rubin 在规模化 智能体 吞吐上可达 10 倍。

也正因为智能体会持续读写企业数据,英伟达还把存储和安全塞进了同一套叙事里。Vera BlueField-4 STX 的重点不是又一张 DPU,而是把智能体的上下文记忆、文件访问、网络隔离直接放到芯片层面进行处理。

按照英伟给出的数据,Vera BlueField-4 STX 引入 DOCA(英伟达的软件框架)后,能让运行时的威胁检测比现有无智能体方案快最高 1000 倍,并在最高 800Gb/s 的速率下执行网络和文件访问策略。

RTX Spark 将彻底引爆个人 PC 智能体

如果说 Vera 是 AI 工厂里的新地基,RTX Spark 则是这场发布会里离普通人最近的产品。

英伟达和微软把 RTX Spark 定义为面向个人 AI 智能体的 Windows PC 超级芯片。它有 1 petaflop AI 性能,最高 128GB 统一内存,采用 Blackwell RTX GPU、6144 个 CUDA 核心、第五代 Tensor Core 和 FP4 精度,并通过 NVLink-C2C 连接一颗 20 核 Grace CPU。

图片来源:英伟达

对了,这颗 SoC 的 Grace CPU 部分由英伟达与联发科合作定制设计。而首款搭载 RTX Spark 的笔记本电脑则是微软的 Surface Laptop Ultra,将于今年晚些时候正式推出,搭载 RTX Spark 的联想、戴尔、惠普、华硕、宏碁笔记本也都在上市的路上。

RTX Spark 的配置听起来不像传统笔记本电脑,更像 DGX Spark 的消费级改造,包括英伟达给出的使用场景也是诸如:

- 本地运行 1200 亿参数大模型和最高 100 万 token 上下文;

- 渲染 90GB 以上 3D 场景;

- 剪辑 12K 4:2:2 视频;

- 生成 4K AI 视频;

- 在 1440p 下以超过 100 帧运行 3A 游戏。

搭载 RTX Spark 的 Surface Laptop Ultra,图片来源:英伟达

过去两年,AI PC 最大的尴尬是,很多产品只是在传统 PC 上加了一个 NPU,然后告诉用户「这就是 AI PC」。但普通人真正想问的是能不能不用排队、不用付 token 账单、不把私人文件丢进云端,也让 AI 帮我做点实际工作?

RTX Spark 给出的答案明显更激进,要让智能体直接进入 Windows 工作流。英伟达和微软会提供新的 Windows 安全基础架构和英伟达 OpenShell,让智能体在本机运行时有身份、隔离、策略和权限控制。Adobe 也会为 RTX Spark 重构 Photoshop 和 Premiere,号称 AI 与图形性能最高提升 2 倍。

这当然不是说 PC 马上就会从工具变成同事。真正的门槛仍然在软件,智能体能不能稳定调用应用、能不能理解本地文件、出了错谁负责、用户是否愿意把权限交给它,这些都不是 1 petaflop 能单独解决的。

写在最后

在演讲中,老黄展示了一张围绕英伟达构建的 AI 工厂生态图,几乎囊括了 AI 时代全球最有实力的一批公司,其中联想作为唯一一家港股公司,在最近更是交出了一份史上最好财报。

当然,这场台北演讲也不只是 Vera 和 RTX Spark。英伟达还把「AI 工厂」的施工图往前推了一步,发布了 DSX 平台,同时对应到桌面端,又推出了面向企业用户的 DGX Station for Windows。

另一条线则是物理 AI,英伟不仅发布了 Cosmos 3 开放世界基础模型、物理 AI 开源工具和技能、Isaac GR00T 人形机器人参考设计,还扩大了 DRIVE Hyperion robotaxi 生态。

就像老黄说的,(英伟达)口袋里的东西太多了。从晶圆厂、AI 工厂、企业桌面,到医院、机器人和自动驾驶,英伟达都在试图把「智能体」变成下一代计算平台的默认用户,更重要的「节点」则是数据中心和个人 PC。

本文来自微信公众号“雷科技AGI”,作者:三七二十一,36氪经授权发布。