首页文章详情

WWDC 2026,硅谷历史上最昂贵的认输:1.2万亿参数Siri来自Gemini,但你的手机跑不了

极客邦科技InfoQ2026-06-09 16:28
对苹果公司而言,这是一个“证明自己”的时刻。

这可能是 Tim Cook 最后一次在 Apple 发布会上说出那句熟悉的“Good morning”。

北京时间 6 月 9 日凌晨,Apple 举行了 WWDC 2026 主题演讲。按照此前消息,Tim Cook 将于 9 月 1 日卸任 Apple CEO,因此外界普遍预计,这场 WWDC 是他以 CEO 身份主持的最后一场 Apple 大型发布活动。活动开始前,Cook 也提前在 X 上发布了一支特别视频,用一种轻松、幽默的方式,为自己的经典开场白做了一次告别式预热。

多年来,Tim Cook 几乎总是以同一句“Good morning”开启 Apple 发布会。这句简单的问候,早已成为 Apple Keynote 的固定仪式,也逐渐被网友做成各种梗。此次视频中,Cook 邀请多位影视和综艺明星客串,让他们用不同方式演绎这句“Good morning”,既像是一次自我调侃,也像是在为这场特殊的 WWDC 提前铺垫情绪。

https://x.com/tim_cook/status/2063973568787226897

今年 4 月,Cook 宣布将在 9 月把 Apple 的掌舵权交给 John Ternus。Cook 曾帮助 Apple 成为全球最具价值的公司之一,而 Ternus 是一名机械工程师出身的高管,目前负责 Apple 硬件产品的开发,包括 Mac 电脑和 iPhone。

尽管外界认为 Apple 在 AI 上曾有失误,但在 Cook 的领导下,这家公司依然取得了巨大成功。起码在他担任 CEO 的 15 年里,按拆股调整后,Apple 股价上涨了约 2000%。

不过,在这个略带告别意味的开场之外,WWDC 2026 真正的看点,仍然是 Apple 接下来要如何讲述自己的 AI 故事。

从零开始的 Siri 

这届 WWDC,Apple 最受关注的主角可能不再只是 iOS、macOS 或新的开发者工具,而是 Siri。过去一年,Apple Intelligence 曾被寄予厚望,但最关键的 Siri 升级迟迟未能兑现,最终让 Apple 内部意识到,问题已经不只是一次功能延期,而是一场 AI 战略危机。

据 Mark Gurman 披露,2025 年初,Apple 高层曾专门召开关键会议,讨论如何应对 Apple Intelligence 表现不佳和 Siri 改造延期的问题,并最终推动 Siri 重建进入新的组织安排。换句话说,这次 WWDC 上可能出现的新 Siri,并不是一次按部就班的产品迭代,而是 Apple 在生成式 AI 浪潮中被迫加速调整后的结果。

如果说过去的 Siri 更像是一个语音命令入口,那么这一次 Apple 试图展示的,是一个被重新定义的系统级 AI 助手。

按照 Apple 的说法,新版 Siri AI 并不是在旧 Siri 上简单叠加几个生成式 AI 功能,而是一次从底层架构到交互方式的重建。

“Siri 经过彻底重构,以强大的 AI 为核心。它充分利用了 Apple Intelligence 的全新架构,包括可在设备和服务器上运行的下一代 Apple Foundation 模型(使用私有云计算)。”

目前,Apple Intelligence 已经拥有第二代端侧模型。在新的体验中,听写功能得到了改进,个人上下文理解能力也融入新系统。Apple Intelligence 会使用 Spotlight 的语义索引来改进搜索,并为感知能力提供支持。此外,新系统还包含广泛的世界知识和 App Actions,屏幕感知能力也被加入其中。

落实到具体 App 上,Apple Intelligence 也带来了不少实用改进:

  • 密码 App:可以帮助用户一键更新多个弱密码。
  • Messages:它可以理解聊天上下文,提醒用户把某件事加入提醒事项或备忘录,也可以帮用户找到聊天中提到过的照片。
  • Phone App: 将新增通话上下文能力,例如当用户给航空公司打电话时,可以帮助调出航班确认号码等相关信息。
  • 邮件 App 和日历 App:会变得更“懂上下文”。比如邮件可以根据内容给出更合适的建议,日历则可以直接通过自然语言创建日程,并自动识别其中的联系人、地点等信息。

据 Apple Siri 工程副总裁 Mike Rockwell 介绍,新版 Siri 将提供一个能力更强的助手,并拥有一个专门的 Siri App。

设计上也采用了此前传闻中的变化:过去那种环绕屏幕边缘的彩色效果,被一个基于 Dynamic Island 的深色主题界面取代。

新版 Siri 也展示了屏幕感知能力。比如,当用户看到一条 Instagram 帖子时,可以直接询问帖子中提到的地点;Siri 还能识别联系人,而无需在每次提示中提供具体信息。至少从目前展示来看,新 Siri 的这些功能,兑现了 Apple 两年前在 WWDC 2024 上演示、原本计划随 iOS 18 推出的能力。

新版 Siri 的语音功能也更加个性化,不仅提供预设语音选择,还增加了语速和语调等更多选项。

在 iOS 上,用户可以从 Dynamic Island 向下滑动打开 Siri,也可以使用现有的唤起方式。在 Mac 上,Siri 现已与 Spotlight 集成,菜单栏图标终于变成了单色而不再是彩色。

Apple 特别提到,全新的 Siri 专属应用让用户可以回溯之前的对话并开启新的对话,对话历史记录通过 iCloud 进行私密同步,因此会话可以在不同设备间无缝衔接。

租用谷歌的“大脑”来修复 Siri 

更大的转向是,Apple 不再完全依赖自研模型完成这场追赶。

Apple Intelligence 的核心是与谷歌联合开发的 Apple Foundation Models。今年 1 月,谷歌和苹果宣布了一项多年合作计划,根据该计划,谷歌的 Gemini 人工智能模型将成为苹果人工智能系统的基础。

苹果将此次合作描述为“深度”合作,并称其为 Apple Intelligence 的“巨大升级”,带来了最先进的理解和推理能力,以及包括图像理解和生成在内的多模态支持。

而根据 Gurman 报道,这次 Siri 升级基于 Google 定制的 1.2 万亿参数模型,每年成本约 10 亿美元。

要知道,Apple 作为市值最高的公司,持有 1470 亿美元现金和证券。这家从硅片到螺丝钉都要自己掌控、自己做芯片、自己做调制解调器的公司,今天在 WWDC 上正式承认了一件事:他们不会自己构建前沿 AI 模型。他们选择从 Google 租一个模型,这件事比今年任何一个 benchmark 都更能说明 AI 的经济学。

为什么是租,而不是自己造?看看现在拥有一个前沿模型要付出什么代价:OpenAI 的运营利润率为 -122%,Anthropic 仅算力每月就要花大约 12.5 亿美元,而一次前沿模型训练每隔几个月就要花掉九位数美元。Apple 看完这些成本,选择了放弃。

但 Apple 没有放弃算力。繁重的 Gemini 推理运行在 Apple 自己的 Private Cloud Compute 服务器上,不在 Google 的服务器上。Apple 租的是模型权重,但保留了基础设施。它为模型向 Google 付费,同时仍然掌握算力层。这才是这场下注真正重要的点。

Apple 拥有 25 亿台活跃设备。一个 1.2 万亿参数的模型即将站在 Siri 背后,为所有这些设备服务。这意味着行星级规模的前沿模型推理。它运行在数据中心里,而数据中心依赖电力——电网目前还没有准备好承载这样的负荷。

也有观点认为,这不是投降,而是一个建设者的判断。拥有前沿模型就像踏上一台跑步机:每隔几个月重新训练一次,大多数推理都在亏钱,还要花巨额成本维持模型服务。Apple 赌的是,模型会变成商品,而模型下面的算力层,芯片、电力、冷却系统,这些才是护城河。这些东西不会按照软件的时间表扩张。世界上最有价值的公司正在下注:前沿模型会商品化,真正困难的是模型下面的一切。

所以,这次合作很难简单理解成胜利或失败。它是一种在 AI 追赶压力下作出的罕见妥协。

WWDC 主题演讲结束后,Craig Federighi 在面向媒体的技术交流中进一步解释了 Apple 与 Google 的合作边界。

谈到与 Google 的合作时,Federighi 解释说:

当然,我们并没有把 Gemini app 当作我们的 app 来使用。事实上,我们在 iOS 上运行时,并不使用其中任何客户端代码。对于这些模型,我们没有使用 Google 部署给其客户的任何模型,也没有使用 Google 向客户部署模型时所采用的基础设施和方式。至于知识库,我们当然也没有使用 Google Search 或类似产品作为我们系统的基础。所以我希望这一点是清楚的:我们使用的 Google Assistant 成分为零。

那么,接下来谈谈我们真正使用了什么,或者说,我们的系统是如何构建的。

一切当然始于我们的 Assistant 体验。正如你们今天早些时候所看到的,这种 Assistant 体验已经深度整合进系统,整合进 iOS、iPadOS 和 macOS。你们在 iPhone 上看到,Assistant 如何以一种我认为非常漂亮的方式,从 Dynamic Island 中以 Liquid Glass 的形态浮现出来;你可以通过侧边按钮唤起它,也可以直接呼唤 Siri 的名字来启动它。但更重要的是,它已经融入系统中的各种场景。无论你是在使用 Writing Tools 写作,还是通过上下文菜单进行操作,这一切都与系统体验深度结合在一起。

接入这一体验的是 Siri app。Siri app 是一个很好的入口,可以让你回到此前已经开始的一段对话,查看你之前做过什么,也可以继续延展那段对话,或者开启一段新的对话。但这个 app 并不是简单地去云端调用某个模型。它建立在 Apple Intelligence 中强大的系统软件之上。

其中包括 System Orchestrator,这是我们整个系统隐私架构的关键。它负责协调各类请求,例如通过 App Toolbox 访问你 app 中的操作,通过 Spotlight Semantic Index 访问个人内容以帮助完成你的请求,甚至还能利用屏幕上的上下文,理解你在发起请求的那一刻可能正在看的内容。

这一切又建立在一组强大的端侧模型之上。这些模型负责处理各种任务,从理解语音,到合成回应你的语音;从视觉上理解环境和屏幕上下文,判断其中是否存在相关内容,到理解屏幕上的文字,以及其他一整套模型能力。

在这种部署模式下,我们拥有一个模型家族,也就是第三代 Apple Foundation Models,从 AFM Cloud 和 AFM Cloud Pro 模型,到 AFM Fusion 模型和图像模型。这些模型是我们与 Google 合作的成果,后面大家还会听到更多相关内容。但它们的架构是为了运行在我们的部署架构之上而设计的。这些模型专门服务于 Apple Intelligence 体验。

Apple AI 副总裁 Amar Subramanya 进一步解释说:

“我们非常兴奋地推出与 Google 合作打造的第三代 Apple Foundation Models,也就是 AFM。我们构建了一个覆盖端侧到云端的模型家族。在逐一介绍这个模型家族之前,我想先说这一代最核心的一点:相比上一代,这一代中的每一个模型,无论质量还是能力,都有显著提升。

如果逐个来看,我们先从端侧模型开始。首先是 AFM Core。这是我们目前随设备推出的下一代端侧模型,采用的是密集架构。

接下来是 AFM Core Advanced。这是我们此前从未在设备端运行过的模型。它采用稀疏架构,并且原生支持多模态。也正因为如此,这个模型的能力实现了巨大跃升,支撑了大家今天早上听到的一些功能,比如邀请相关能力和更具表现力的语音,而且这些能力都完全在设备端运行。

再来看服务器端模型,它们全部通过 Private Cloud Compute 提供服务。首先是 AFM Cloud。这是我们的服务器端主力模型,基本上针对延迟和服务成本进行了优化。

接下来是 AFM Cloud Image。这是我们的下一代图像生成和编辑模型,支持许多非常出色的体验,包括大家今天早上听到的 spatial reframing,也就是空间重构。

刚才提到的这四个模型,AFM Core、AFM Core Advanced、AFM Cloud 和 AFM Cloud Image,都是为 Apple Silicon 定制构建的,使用专有数据训练,并通过 Gemini 前沿模型进行精炼。

最后,对于一些要求最高的任务,比如 agentic tool use,也就是智能体式工具调用,以及复杂推理,我们有 AFM Cloud Pro。这是我们能力最强的模型,质量接近 Gemini 前沿模型。

为了把这个模型投入生产环境,我们与 Google 和 Nvidia 合作,将 Private Cloud Compute 基础设施扩展到 Google 云中的 NVIDIA GPU,同时仍然保持 Apple 无与伦比的隐私保证。

在整个模型家族中,我们的目标是,把每一个用户请求匹配给最合适的模型,让它以最低延迟提供最佳回答。因此,我们对这一代模型非常兴奋,也对它们所能支撑的各种强大功能感到兴奋,其中包括新的 Siri AI 体验,以及整个操作系统中的各种智能体验。”

AI 换代,用户买单 

不过,模型变强的另一面,是硬件门槛也在同步抬高。按照苹果目前给出的要求,iOS 27 中最强大的端侧 AI 模型至少需要 12GB 统一内存,这意味着标准版 iPhone 17 因为只有 8GB 内存,将无法运行这套最强端侧模型。过去,Apple Intelligence 的标准内存门槛一直是 8GB,而这一次,苹果第一次为最强的端侧 AI 功能单独提高了要求。

要运行苹果最强大的端侧模型,用户需要使用以下设备之一:

  • iPhone:iPhone Air、iPhone 17 Pro 或 iPhone 17 Pro Max
  • iPad:搭载 M4 或更新芯片、且至少拥有 12GB 统一内存的 iPad
  • Mac:搭载 M3 或更新芯片、且至少拥有 12GB 统一内存的 Mac
  • Vision Pro:搭载 M5 的 Apple Vision Pro

这也让下一代 Apple Intelligence 的分层变得更清晰:大多数 AI 功能仍会覆盖目前支持 Apple Intelligence 的设备,例如 iPhone 15 Pro,但最强的端侧模型会向最新、最高规格的硬件集中。换句话说,苹果仍然在讲端侧智能、系统级整合和隐私保护,但在更强模型面前,它也不得不接受一个现实:真正先进的端侧 AI,需要更大的内存、更强的芯片,以及更昂贵的设备来承载。

所以,iOS 27 的 Apple Intelligence 不只是一次软件升级,也是一条新的硬件分水岭。过去,用户关心的是自己的 iPhone 能不能升级到新系统;现在,更关键的问题变成了:即便能升级 iOS 27,它是否真的能跑完整的 Apple Intelligence?这可能也是苹果 AI 时代最现实的一面——智能越强,门槛越高,而“端侧 AI”最终也会重新定义什么才算一台真正的新 iPhone。

更现实的是,即便用户愿意为更强的 Apple Intelligence 换机,也未必马上能用上它:苹果已经确认,新 Siri AI 今年晚些时候进入 beta 时,iPhone 和 iPad 上的相关功能将暂不向欧盟和中国用户开放。

参考链接:

https://9to5mac.com/2026/06/08/new-siri-whats-new/

https://9to5mac.com/2026/06/08/craig-federighi-details-apples-collaboration-with-google-for-siri-ai-in-ios-27/

https://www.macrumors.com/2026/06/08/most-powerful-on-device-ai-now-requires-iphone-17-pro-or-air/

本文来自微信公众号 “InfoQ”(ID:infoqchina),作者:Tina,36氪经授权发布。