AI云换赛道:Token战落幕,谁落地谁赢
做科技观察这些年,我有个很直观的感受:每个行业都有自己的 "战报周期"。
前两年AI圈的战报永远绕不开几个数字:参数规模、上下文窗口、Token价格、API调用量。每次大厂开发布会,台下人最关心的问题永远是:你们家模型现在支持多少Token了?每百万Token多少钱?
Token就像移动互联网时代的DAU,成了衡量一家科技公司AI实力的硬标准。谁的Token便宜,谁的Token处理量大,谁就好像更接近行业牌桌的中心。
但今年以来,模型API价格继续快速下探。5月DeepSeek把V4-Pro的价格打下来之后,缓存命中的输入价格已经低至0.025元每百万Tokens。行业里有人算了一笔账,现在写一篇十万字的小说,模型处理成本不到三块钱。
这引发了一个新讨论:当Token越来越便宜,Token本身还重要吗?
当一件东西的成本无限趋近于零,它就不再是核心竞争力,而变成了基础设施。就像今天没有人会因为宽带便宜就选择一家互联网服务商,未来也不会有企业只因为Token便宜,就把核心业务系统交给某一家AI云服务商。
问题随之变化了:当Token最终都会变成水电一样的基础资源,接下来该拼什么?
答案不是谁能消耗更多Token,而是谁能用更少Token完成更复杂的任务;不是谁能把模型单点能力做得更漂亮,而是谁能把模型、算力、工具、数据和业务流程真正组织起来,交付可验证的结果。
换句话说,AI云的下半场,拼的是谁能落地。
落地不是单点能力,而是系统能力
今年5月的百度Create大会,李彦宏提出了一个值得关注的判断:进入智能体时代,衡量一个平台和生态的繁荣,更应该看的是DAA这个指标,关注有多少Agent在给人类干活,并交付结果。这比Token消耗更接近价值,也更接近本质。
而Agent要真正干活,背后就需要AI云厂商的全栈AI能力。特别是对于企业级项目,往往不是简单接入一个模型API就结束了。它需要芯片和模型适配,需要推理成本优化,需要和既有业务系统打通,把员工原有工作流重新组织起来,做好数据治理、权限控制……任何一个环节没做好,Agent都难以从Demo走向生产环境。
过去,很多人对全栈AI的理解还停留在技术栈的完整度上。只要有芯片、有模型、有云、有应用,就叫全栈。但在企业客户现场,真正有价值的全栈不是“我什么都有”,而是“我可以把这些能力整合成一个可交付、可运维、可持续优化的业务系统”。
前阵子听百度智能云伐谋内部研讨会的分享,有个制造业大客户的案例印象很深刻:这个项目的方向是做一个资源运营智能体,涉及复杂的业务流程、企业数据,交付难度很大。去年一个类似的项目,是一个大厂委派30位高工驻场6个月联合攻关做的。而百度这个项目只去了两个人,其中一位还是实习生。最后上线到真实的生产系统上,关键指标提升了超过10%。
这个案例真正值得讨论的,不是谁派了多少人,而是背后的效率差。几十人的团队,意味着要分好几个小组,每个小组算力、数据、模型、应用各管一段,出了问题要层层沟通,需求变更要反复对齐。而两个人的团队,意味着每个人都能打通从底层算力到上层应用的全链路,遇到问题当场就能定位,调整方案当天就能落地。
当一条技术链路被拆给多个供应商、多个团队分别负责时,客户需求每变化一次,协同的时间和成本就会被放大一次:算力要重新适配,模型要重新调优,推理系统要重新优化,Agent实现也要跟着调整。表面上看,客户买到的是不同环节的产品和技术;实际上承担的,是整条链路反复磨合的成本。
而全栈AI厂商,可以把这些环节打通,降低交付周期和成本。不仅如此,因为算力、模型和Agent运行在同一套体系里,厂商可以联动优化、统一调度、持续反馈,系统性提升性能、降低成本。
这也是近期全栈AI被各大厂商视为重要战略方向的真正原因。
招商银行的例子更有代表性。
现在招行已经上线了超过800个AI智能体,覆盖风控、营销、研发、办公几乎所有核心场景,其中一半以上跑在昆仑芯的国产算力上。
试想,如果没有全栈能力,这些事情需要找芯片厂商、模型厂商、云厂商、集成商好几家公司一起做,看似每个环节都有专业供应商负责,但一旦进入交付环节,系统兼容性、交付稳定性、责任边界划分以及后续运维保障等关键问题会变得异常复杂。
百度这次升级的新全栈AI云,本质上是把过去在内部跑通的垂直整合能力,变成了对外输出的标准化产品。Agent层面把单位Token的智能水平做到最好,让智能体更好地完成任务;算力层面把每瓦性能和性价比做到极致。两层能力高效整合,端到端优化,实现整体性能最大化。客户不需要关心底层的技术细节,只需要关心自己的业务问题能不能解决。
AI落地难,但落地从来都不是技术问题,是工程问题,是协同问题,是成本问题。全栈AI真正要解决的也正是这类问题——要用更高效的系统,让AI更快进入到核心业务场景,把技术能力转化成业务结果。
卡位战的窗口,正在收窄
如果说去年大家还在讨论智能体是不是噱头,今年一季度中标数据已经给出更现实的答案。
数据统计,一季度国内主要云厂商大模型相关的中标项目一共85个,总金额16.5亿。
当行业从“模型能力比拼”进入“落地能力兑现”阶段,谁能真正拿下项目、进入客户生产系统,开始成为新的竞争标尺。
在这组数据里,百度智能云的领先非常明显:一季度拿下25个项目,中标金额12.48亿元,金额是第二名的五倍以上。
如果把时间再拉长,趋势会更明显。去年,百度智能云已经以48个中标项目、5.1亿元中标金额,成为国内云厂商大模型项目“中标王”。
这些数字的背后,更值得关注的,是这些项目的属性。金融、制造、能源、通信、政务、大交通等,都是高信任、高合规、高迁移成本的行业。特别是涉及到央国企的核心业务系统,他们落地AI,不是为了短期试点,是要真正把AI能力嵌入真实业务流程,甚至进入生产系统。
比如,国家电网的营销供电方案智能体,实现了企业办电流程的全面智能;金融行业的智能助理,已经渗透到不少银行每个员工的日常工作;运营商的基础设施项目,往往是数亿级别的长期建设。
而这些,都已经落到了第一梯队厂商的手里。
市场格局已经日渐清晰:第一梯队的厂商拿走了几乎所有的高价值场景,第二梯队的厂商只能抢剩下的边缘项目,第三梯队的已经开始退出市场。
企业级市场的游戏规则从来都是这样:一旦某个供应商跑通了某个行业的核心场景,产品与客户流程深度绑定,员工也形成了新的使用习惯,后来者再想进入,就必须面对很高的迁移成本。企业客户不会为了细小的模型参数差异,轻易推翻已经跑在生产环境里的系统。
这就是卡位战最残酷的地方:窗口只有一次,错过了就是错过了。
类似的逻辑,放到现在火热的通用智能体赛道,依旧成立。无论是海外的Codex,还是国内的百度搭子DuMate、WorkBuddy、Trae Work……谁能更早进入真实工作流,谁就更有机会抢先占据用户心智、培养用户习惯。目前来看,百度搭子DuMate率先进入了企业级规模落地阶段。以华硕案例来讲,依托百度智能云强大的Skills生态,用户只需通过自然语言下达指令,即可调动本地软硬件,实现如邮件自动整理、数据多维分析、PPT智能生成等多项功能。
智能体真正的价值,并不来自某一个惊艳Demo,而来自成千上万个具体场景中的效率提升。比如自如的设计师,基于秒哒代码智能体可以快速搭建AI设计平台。“设计师跟业主现场聊方案,当场就能出图。业主有新的想法,现场就改。”当这样的优化不断累积,从一个环节扩展到更多流程,从一个岗位覆盖到更多角色,从一个行业复制到更多行业……就会构成产业智能化的真实红利。
这个红利,只会属于最早卡位成功的厂商。
而这个卡位的窗口,正在快速关闭。
AI云,是一门好生意
百度今年一季度的财报出来的时候,很多人注意到AI业务收入占比首次超过50%。但从AI云角度看,更关键的是两个数字:AI云收入88亿,同比增长79%;GPU云收入同比增长184%。 更难得的是,这一增长是建立在2025年AI云全年同比增长34%的基础之上,是连续高增长后的进一步提速。这样的增速,即便放在全球AI云市场里,也称得上亮眼。
毫无疑问,AI云作为百度核心增长引擎之一,是一门高增长的好生意。
不仅如此,这个增长不是建立在单纯卖Token之上,而是来自智能体、模型、算力需求的共同放大。这给AI云带来了可观的利润空间。
在财报会上,百度表示:GPU云在结构上具有高利润率特征。究其原因,GPU云不仅门槛更高、需求强劲,而且高质量供给紧张、客户对成本接受度高。而自研芯片和全栈能力有机会进一步优化成本。更长远看,为AI智能体和应用本身付费的市场规模,可能会大于单纯按Token计费的市场。
放眼全球市场,类似趋势也在发生。拿谷歌来讲,今年一季度,谷歌云收入同比增长63%,营业利润率达32.9%,同比提升15.7%,其中,未完成订单量环比几乎翻倍,数据堪称亮眼。亚马逊、微软、甲骨文等头部公司,“AI云”业务也有不同程度的增长。
AI云是一门好生意,但它并不是一门轻松的生意。
硬币的另一面是,AI云竞争正在演变成芯片、模型、推理平台、数据工程和应用交付的系统工程竞争。只卖算力,容易陷入价格战;只卖模型,容易被更便宜的API替代;只卖应用,又会受制于底层成本和能力边界。
真正有机会建立壁垒的,是充分发挥全栈AI的效率优势,把AI转化成客户愿意持续付费的业务结果。
好生意要持续,考验的是战略的耐心
但很少有人看到,这些亮眼数字的背后,是更艰难的战略选择。
尤其当GPU资源紧张时,云厂商必须回答一个现实问题:宝贵的算力,到底应该优先投向哪里?
接近百度智能云的人士告诉《新眸》,就在前不久一次内部管理层研讨会上,这个问题也作为核心议题被反复讨论。
这不是一个简单的经营问题,而是对未来AI商业模式的判断。
如果把资源过度投向MaaS,短期内Token数据一定好看。但Token生意本质上是流量生意,没有护城河。一旦价格战继续下探,最后大家都没钱赚。相反,如果把关键资源投向自研模型和智能体基建,长期会形成更高质量的商业化能力,但短期内销售团队会面临巨大压力。
这很容易让我联想到微软和谷歌,在AI时代,他们的核心管理层都经历过类似的艰难抉择。
百度智能云目前的路径,更接近后者:不把GPU全部投给短期Token收入,而是优先保障自研模型和长期技术底座的建设,再根据项目情况综合ROI分配资源。同时,继续强化软硬件协同优化,提升训推系统性能,用长期系统能力换未来更高质量的商业化。
这是一条更难也更慢的路。据内部人士透露,此前沈抖还给所有管理层和全员分享了《论持久战》的片段。按照沈抖的说法,做ToB业务,应该做的是树而不是草:只要是树,就会年复一年的生长;如果是草,无论多么旺盛,一到秋天就会枯萎,第二年只能重来。
AI行业过去两年的竞争,常常被包装成一场百米赛跑,谁模型发布得快,谁价格降得多,谁调用量冲得高,谁好像就要赢了。
但AI云是一场马拉松。短期战报重要,但更重要的是能否把核心资源投向长期价值,能否建立起真正的全栈能力,能否持续拿到高价值落地场景,并在这些场景里不断降低成本、将每一个Token都转化成有意义的业务结果。
Token战已经落幕了。
接下来,是属于落地者的时代。
本文来自微信公众号“新眸”(ID:xinmouls),作者:桑明强,36氪经授权发布。