首页文章详情

阿里与谷歌,agent 齐 步走

蓝洞商业2026-05-22 18:54
面对 Agent 时代谷歌在购物上的完整闭环,阿里会如何接招?

打开阿里云全新 AI 产品官网,最先看到的是一行安装技能指令,这是一条 Agent 可读的指令。调用之后,你的 AI 智能体就可以一键搭载通义千问大模型的原生调用能力。

这是阿里云 17 年来第一次在主官网之外建立独立产品站,却没有按照互联网产品的惯例去做一个展示给用户的官网。它的首屏专为 Agent 设计,逻辑是:当你的用户是 AI,你就不需要 Banner,你需要的是一个可执行指令。

背后的逻辑不难理解,Agent 时代的服务对象,不只是人,更是自主决策运行的 Agent。阿里云明确对云产品进行了 Skill 组件化、MCP 标准化和 CLI 指令化改造,让每一个云产品都变成标准化能力模块,智能体可像调用程序函数一样直接启用。

同一时间,Agent 化改造也在大洋彼岸上演,谷歌也在 I/O 大会发布了从芯片、模型到应用的全栈技术和产品更新,中美两大 AI 全栈企业再度在同一赛道同向布局。

尤其是在应用层,谷歌最新 Antigravity 2.0 平台是开发和管理自主 AI Agent 集群的核心环境,能在 12 小时内自主编写出完整的操作系统,专注于核心智能体对话、智能体生成的工件以及多智能体编排,「我们正在将 Antigravity 打造成您进行 Agent 优先开发所需的唯一平台。」

Agent 优先,智能体接管一切,相似的发展趋势,正在阿里云与谷歌同步显现。

当今年夏天,谷歌开始推出智能购物车,方便用户在浏览网页、与 Gemini 聊天时购物,同时自动查找优惠和降价信息,依托通用商务协议(UCP)等底层架构,联合亚马逊、Meta、微软等巨头入伙,这种跨平台的购物体验,注定会让 Agent 时代的购物车更加智能。

面对 Agent 时代谷歌在购物上的完整闭环,阿里该如何应对,在智能体购物领域搭建行业基础规则?

阿里云更开放了

此前《拿下敌人,谷歌云给阿里云上了一课》已经提到,云厂商们赢得竞争重要,更重要的是让竞争发生在自己的生态中,模型自由是谷歌云的重要优势之一,这也是谷歌给阿里云上的重要一课。

如今,阿里云也学习谷歌的长处,朝着「AI 时代最开放的云」奔去。作为企业级的大模型应用开发平台,阿里云百炼也开始开放接入第三方模型。

除了阿里自研的千问模型矩阵,百炼平台还将接入智谱 GLM-5.1、MiniMax M2.7、月之暗面 Kimi K2.6、可灵、Vidu Q3 等第三方模型。

在千问云官方网站上,已经上架 150 余个模型系列、480 余款各类模型,覆盖国内外主流模型,支持多款模型同步对比,开发者可以按照自己的需求,快速完成体验、评估与选型。

同时,千问云把模型服务的核心能力封装成 Skills 和 CLI 工具,这意味着 OpenClaw 这类 Agent 工具,只需要一句指令就能学会整个平台的全部能力,并自主规划,让图片任务调视觉模型,生图任务调生图模型,视频任务调视频模型,全程无需人工干预,也无需编写集成代码。

对于云厂商的客户来说,如何透明地消耗 Token 资源是一个很现实的问题。

千问云拿出的解决方案是智能透明的管理机制,A 智能体可实时调取模型用量数据,研判数据趋势、排查异常使用、助力成本优化,同时可通过 CLI 拉取日志、Key 活动等数据,实现异常识别与任务溯源。

这也是阿里云和谷歌云的共同趋势,它们不再只是卖模型,而是要把自己变成提供算力和调动基础设施的 AI 工厂。

谷歌的优势是全球开发者密度,阿里的优势是本地生态深度。

谷歌在这次 I/O 大会上,公布的数据是每分钟通过 API 处理的 tokens 数已达到 190 亿,每月有 850 万开发者在用谷歌的 AI 模型构建应用,而谷歌内部通过 AI 开发工具每天处理超过 3 万亿 tokens,且每隔几周就翻一倍。

这不仅是模型算力能力数据,更是基础设施承载体量的核心数据。

所以在这个逻辑下,Gemini 3.5 Flash 定价提高三倍就不难理解了。谷歌自己的测算是:尽管单价贵了,但这个模型更高效,足以帮助企业每年节省超过 10 亿美元的 AI 成本。

它卖的不是便宜,而是要让每一分钱的处理量更值。这和传统模型降价逻辑完全不同,以前降价抢占用户,是入场券逻辑,现在提价但提效,谁能用更低的芯片成本产出更高质量的 Token,是基础设施逻辑。

基础设施的逻辑,意味着当一个 Agent 需要调用语言能力时,智能体将优先选用何种能力、何种调用路径,这才是阿里和谷歌两场峰会所有技术发布的真实目标。

谷歌依然是阿里的老师

谷歌在 I/O 2026 上发布了很多内容,从模型层面的 Gemini Omni 世界模型到硬件层面的首款基于 Android XR 平台的内置 Gemini 音频智能眼镜,可以说,Agent 已经彻底融入了谷歌的所有业务中,在搜索、办公、购物等场景中构建了自己的生态,这让所有对手都难以超越。

更重要的是背后的投入,谷歌今年的年度资本支出在 1800 亿至 1900 亿美元之间,其中关键部分都是花在了定制芯片上。

谷歌之前已经发布了针对预训练优化的 TPU 8t 与针对推理优化的 TPU 8i,这预示着芯片走到了岔路口,方向上的进一步细分,训练需要极致的算力密度和大规模并行,推理需要极致的低延迟和内存带宽,两个目标之间存在根本性的设计张力,在同一颗芯片上同时追求两者的代价是两个方向都不够极致。

而阿里此次发布的真武 M890,内置 144GB HBM 显存,片间互联带宽 800GB/s,整体性能是上一代真武 810E 的三倍。

128 张芯片组成磐久 AL128 超节点,P2P 时延低于 150 纳秒。平头哥副总裁高慧对这款芯片的定位是:Agent 在执行任务时,可能在毫秒内连续发起数十次模型调用,这需要 CPU、GPU、网络和存储的紧密协同,而非单纯堆算力。

真武 M890 是训推一体的设计,这与谷歌把训练和推理拆开的路线形成了明显对比,两种选择背后是对当前主要瓶颈的不同判断。

在芯片功能一体化研发路线上,阿里平头哥与英伟达、百度昆仑芯站在一起,而谷歌 TPU 和华为昇腾则属于「彻底分化派」,这类技术路线分歧,是算力产业规模化发展后的必然趋势,因为给企业客户提供最简单、性价比最高的全能解法,还是给客户提供明确分工的解法,都是应对不同市场需求的产物。

阿里和谷歌在芯片之路上方向不同,但巧合的是,谷歌第八代 TPU 与阿里真武 V900 芯片规划落地时间相近,都瞄准了 2027 年年底。

这可能是二者的一致性押注,AI 性能竞争的下一个主战场,不是谁的模型参数量更大,而是谁更符合市场需求,能用最少的能耗跑出高质量的 token。

从芯片研发层面这一点上看,谷歌依然是阿里的老师,阿里云智能集团资深副总裁、公共云事业部总裁刘伟光就认为,谷歌 TPU 和 Gemini 的结合就跑出了最高的性能,背后的逻辑是自己的芯片和自己的模型一定能达到最好性价比。

谁会改写智能购物?

最值得阿里提前布局预判的是,谷歌最新拿出了通用购物车功能,这是在瞄准 Agent 时代的电商消费。

这是谷歌打造的全新 AI 场景,名为「Universal Cart」。用户可以在搜索、YouTube、Gmail 中随时添加商品,购物车在后台自动查优惠、监控降价、补货提醒,然后用谷歌钱包进行支付,自动计算哪个付款卡更优惠。即便用户不用谷歌付款,也可以退回到零售商网站进行结账。

这实际是要把谷歌打造成一站式购物网站,谷歌在用户的购物消费中,充当的是一个「媒人」的角色,而且目前不收取佣金。

更重要的是,谷歌底层的通用商务协议(UCP)和保障支付的 AP2 协议,正在建立一套新的电商规则,这才是值得所有电商行业提前预判的事情。

UCP 可以理解为一套人工智能购物开放标准协议,从搜索商品、加入购物车、购买、支付到获得售后服务,这套规则的发起者包括谷歌、沃尔玛、Shopify 和 Target 等大型零售商。4 月份,亚马逊、微软、Meta等公司也加入了这个开放标准中。

也就是说,以后在电商网站下单的不是人,而是一个个具体的 Agent,它代替人去比价和下单,而且能够在众多购物网站中执行,而不是仅仅限于某一个具体的购物网站。

这与当下中国市场的电商 Agent 形成了鲜明的对比,豆包可以实现在抖音电商中下单,千问 App 打通淘宝可以下单,但它们都无法实现跨平台的消费,所以每一个 Agent 的能力都会被局限在各自的范围中。

谷歌要把这种智能购物体验推广到更大的市场中,「Universal Cart」这套 Agent 消费体验,将在今年夏天上线在谷歌搜索和 Gemini 中。而 UCP 这种结账体验,也将在未来几个月登录加拿大、澳大利亚和英国,并且逐步扩展到酒店预订、本地食品配送等垂直行业。

除此之外,谷歌的 AP2 协议也是一项保障智能购物的底层规则,旨在让Agent 在设定的限额内安全地代表用户进行支付。

AP2 的底层机制是在用户、商家和支付处理商之间建立透明、可验证的连接,并全程采用加密技术保护用户数据。该协议还包含防篡改的数字记录,确保 Agent 始终代表用户行事,并提供永久的审计跟踪,供买卖双方在退货或纠纷时参考。

也就是说,Agent 购物要满足各种限定条件,包括指定所需的品牌和产品,以及消费限额。当满足这些条件时,Agent 会自动完成购买。

A2A 覆盖 Agent 之间的通信,UCP 覆盖 Agent 的商业行为,AP2 覆盖 Agent 的支付授权,三层叠加,谷歌在 Agent 时代写的不是一个产品,是一套跨平台购物消费的基础规程,这也是国内电商巨头亟需提前预判的行业趋势:

战场不再是用户要在哪个平台上买东西,而是用户用哪个 Agent 下单。

对于中国用户来说,电商平台购物的消费习惯和信任基础,短时间内不会改变,但长期来看,如果谷歌带动的这套智能购物底层协议在全球范围内成熟,「购物入口」这个逻辑就将改写。

阿里、京东、拼多多等电商平台注定要面临选择,是自主搭建全新规则体系,还是选择兼容这套全球通用协议?

本文来自微信公众号 “蓝洞商业”(ID:value_creation),作者:赵卫卫,36氪经授权发布。