首页文章详情

同一天,谷歌和阿里说了什么?

IT时报2026-05-21 20:55
科技巨头们服务的,已经不是“人”了

北京时间5月20日凌晨1点,山景城的夜幕刚刚降临,Google I/O开发者大会如约而至,舞台中央,Google CEO桑达尔·皮查伊在台上反复提到一个词:Agent

几个小时后,太平洋西岸的杭州,阿里云在峰会上打出一句近乎宣言式的标语:“云的用户正在从人变成Agent。”

没有约定,却如出一辙。

时间再往前推,4月底,Google、Meta、Microsoft、Amazon同日发布财报,唯有Google因云业务爆发成为唯一明显的“赢家”。几天后发布的阿里2026财年四季报显示,阿里云外部商业化收入同比增长40%,AI相关产品收入占比首次突破30%。阿里CEO吴泳铭明确表示,全栈AI技术投入已跨越培育期,进入正向规模商业化回报周期。

Google和阿里,作为全球范围内为数不多能在开放市场上同时跑通“自研AI芯片+自建云+自研大模型”完整闭环的科技公司,正分别成为中美这一轮AI投入周期中的“优等生”。而且在同一个节点,不约而同把AI竞赛的下一站共同指向了同一个全新的服务对象:不再是“人”,而是Agent(智能体)

从“卷模型”到“卷落地”

过去两年,AI行业的叙事简单而粗暴:谁的模型参数更大?谁的榜单分数更高?谁的推理能力更强?整个行业围绕大模型展开了疯狂的军备竞赛。

但转折正在发生。

斯坦福大学《2026年人工智能指数报告》给出了一个关键判断:中美顶级大模型差距已“实质性消除”,头部模型呈并跑态势。与此同时,模型本身正在快速“通货膨胀”——能力差距依然存在,模型依然重要,但已不再构成决定性的商业壁垒。

真正拉开差距的,变成了另一件事:谁能让AI真正“干活”?

今年Google I/O大会最明显的变化,就是Google开始把展示重点,从“模型能力”,转向“Agent能力”,其中最核心的产品之一,是个人智能体产品Spark

Spark运行在Google Cloud之上,可直接调用Gmail、Docs、Sheets等Google生态中的服务,在不同应用之间自主协同,自动完成信息拉取、邮件撰写、会议纪要整理等复杂任务,即便用户关闭设备,它依然可以持续工作,像一个真正持续在线的“数字员工”。

Spark背后的关键,是Google全新的Antigravity 2.0框架。

Google现场做了一个演示:让Antigravity搭载Gemini 3.5 Flash,从零开始构建一个操作系统,93个子Agent并行工作,发出超过15000次模型请求,用掉26亿Token,12小时后,一个完整的OS内核被自动生成,调度程序、内存管理、文件系统全部由Agent完成,甚至包括代码测试与审计,花费成本不到1000美元

与此同时,在杭州举行的阿里云峰会上,阿里云给出了另一种表达。阿里云资深副总裁刘伟光表示,Agent突破临界点之后可以24小时不间断工作,对AI和云的需求无穷无尽。

当日,阿里云围绕Agent做了底层芯片、Agentic Cloud、模型到推理平台等全栈产品发布,也是阿里云成立17年来,第一次在阿里云官网之外,单独推出全新产品入口。

这个入口非常特殊,打开页面,突出的不是产品列表,也不是控制台,没有任何传统意义上的导航结构。首页只有一行字:“安装Skills npx skills add QianWen-AI/qianwen-ai(一键安装qianwen-ai 技能包)”。

这不是给人看的,而是给Agent看的。

AI行业开始进入“全栈战争”

如果说过去两年的AI竞争,本质上还是“模型战争”;那么现在,AI行业开始进入另一种更复杂的竞争阶段。

当AI真正开始承担复杂任务后,竞争维度会被急剧放大。比拼的将不再只是模型能力,而是:是否拥有云基础设施?是否掌握推理成本?是否拥有芯片能力?是否能连接真实业务系统?是否拥有生态入口?是否具备持续的数据闭环?

最终,比拼的不再是单点技术,而是一场涉及“芯—云—模型—产品(智能体)”的全栈战争。

这也是为什么,当前真正走在前列的公司,几乎都具备高度相似的能力结构。Google拥有TPU、自建云、Gemini模型、搜索和Android生态;阿里拥有含光芯片、阿里云、千问模型,以及庞大的企业生态。

因为Agent时代天然要求:芯片、云、模型、工具调用、业务系统与生态协同,Agent对算力、推理成本与基础设施的依赖,远远超过传统聊天模型。

在芯片层,阿里云晒出了一个覆盖算力、网络、存储的完整自研数据中心芯片矩阵。

平头哥新一代训推一体AI芯片真武M890首次亮相,规格相当硬核:144GB显存,片间互联带宽800GB/s,性能是上一代真武810E的3倍。

同时,阿里发布了基于新一代AI芯片真武M890的磐久AL128超节点服务器,搭载自研互联芯片ICN Switch 1.0,可让128张AI芯片组成一台计算机,P2P时延低于150ns,主打解决Agent场景下的海量并发推理和大模型训练需求。

平头哥还首次公布了真武系列芯片的路线规划:未来两年将陆续推出算力更强的真武V900、真武J900两代芯片。目前真武系列AI芯片累计出货56万片,已服务于20多个行业的400多家客户。

Google则提出第八代TPU的“双芯”战略:TPU 8t专攻训练,单个Pod可塞下9600颗芯片,集群总算力121 ExaFLOPS;TPU 8i专攻推理,推理性价比提升80%。

不管是更便宜大碗、推理能力更强的模型,还是芯片,背后对应的,其实正是Agent时代的新需求。只有同时掌握芯片、云、模型与生态等,才能真正控制Agent时代最核心的变量——推理成本。

Agent时代的入口

过去一年,大模型行业里有一种很流行的观点:AI会重构互联网入口:搜索会被替代,App会被替代,浏览器会被替代。

但Google和阿里的选择,却非常耐人寻味。他们没有放弃原有生态。相反,他们开始把AI重新嵌入自己的生态。

Google把Agent塞进搜索、Chrome、Android、Gmail、YouTube;而早在今年年初,阿里就把千问全面接入淘宝、钉钉、支付宝等阿里体系。

某种意义上,这是一种巨头逻辑的“回归”。

过去两年,Google一直在疯狂追赶OpenAI;阿里则在努力寻找自己的AI超级入口。但走到今天,两家公司似乎都重新意识到:真正的护城河,其实一直就在自己手里。

Spark天然就能读取Gmail、Docs、Calendar。这些数据,本来就在Google服务器里。用户不需要反复授权,不需要配置复杂接口,也不需要额外搭建工作流。

而这恰恰是很多独立Agent产品最难跨越的门槛。同样,阿里重新押注千问,也是在重新押注自己的生态能力。今年年初,千问App一次性上线超过400项AI办事能力。

目标非常明确:把AI从“聊天工具”推向“办事入口”。因为阿里终于重新意识到,自己的真正优势,恰恰是淘宝、支付宝、钉钉、本地生活、企业服务这些现实世界的连接能力。

而Google这次真正更深的一步,是要争夺Agent时代的“协议层”。此次I/O大会上,Google集中推出了UCP、AP2、SynthID等多个协议。

这些东西看起来很技术,但背后的商业逻辑非常清晰。Google正在试图定义Agent时代的商业规则。

UCP(Universal Commerce Protocol,通用商务协议)的目标是让Agent能够使用统一标准,在不同电商平台之间完成搜索、比价、加购物车、下单;AP2则是Agent Payments Protocol(智能体支付协议),它要解决的问题是,当Agent替你花钱时,如何确认它花的是你授权的钱;MCP是Anthropic提出的Model Context Protocol,解决的是AI如何调用外部工具的问题,Google这次选择全面接入MCP;最后是SynthID。这是Google DeepMind推出的AI内容水印技术,目前已经给超过1000亿张图像与视频、6万年音频嵌入数字水印。

把这四个协议放在一起,会发现Google真正想做的事情:UCP负责“AI怎么买东西”、AP2负责“AI怎么付款”、MCP负责“AI怎么调用工具”、SynthID负责“AI内容如何可信”。

它们共同构成的,其实是完整的Agent商业基础设施。

某种意义上,这甚至有些像Google当年做Android,先定义标准,再让整个行业跟着走。

AI将为AI服务

如果回看过去很多年,Google和阿里代表着两种完全不同的互联网模式。

Google长期更偏“技术驱动”。它的核心能力一直是:搜索、操作系统、云、基础模型与开发者生态,Google相信,只要掌握底层技术与基础设施,就能够定义下一代互联网。而阿里则更偏“商业驱动”,交易、支付、平台运营、本地生活与企业服务……要让天下没有难做的生意。

结果走到今天,AI,尤其是Agent,正在把两家公司重新拉到同一个坐标系。

甚至连双方这次大会最核心的关键词都开始高度趋同:Google在讲Agent、推理、协议、工具调用、支付;阿里也在讲Agent、推理、工作流、企业系统、AI工厂。

本质上,这是AI产业进入深水区之后的结果。因为当模型能力逐渐趋同时,所有巨头最终都会走向同一个终点:控制AI时代的基础设施。

过去,科技巨头服务的是“人”。未来,它们服务的,可能首先是Agent。

真正开始使用云、调用工具、处理流程、连接业务系统、完成交易与执行任务的,未必再是人类自己,而是越来越多持续在线、24小时工作的智能体。

本文来自微信公众号 “IT时报”(ID:vittimes),作者:贾天荣,36氪经授权发布。