AI云换赛道：Token战收官，落地者赢未来

落地为王：AI云行业的游戏规则变了。

做科技观察这些年，我有个很直观的感受：每个行业都有自己的 "战报周期"。

前两年AI圈的战报永远绕不开几个数字：参数规模、上下文窗口、Token价格、API调用量。每次大厂开发布会，台下人最关心的问题永远是：你们家模型现在支持多少Token了？每百万Token多少钱？

Token就像移动互联网时代的DAU，成了衡量一家科技公司AI实力的硬标准。谁的Token便宜，谁的Token处理量大，谁就好像更接近行业牌桌的中心。

但今年以来，模型API价格继续快速下探。5月DeepSeek把V4-Pro的价格打下来之后，缓存命中的输入价格已经低至0.025元每百万Tokens。行业里有人算了一笔账，现在写一篇十万字的小说，模型处理成本不到三块钱。

这引发了一个新讨论：当Token越来越便宜，Token本身还重要吗？

当一件东西的成本无限趋近于零，它就不再是核心竞争力，而变成了基础设施。就像今天没有人会因为宽带便宜就选择一家互联网服务商，未来也不会有企业只因为Token便宜，就把核心业务系统交给某一家AI云服务商。

问题随之变化了：当Token最终都会变成水电一样的基础资源，接下来该拼什么？

答案不是谁能消耗更多Token，而是谁能用更少Token完成更复杂的任务；不是谁能把模型单点能力做得更漂亮，而是谁能把模型、算力、工具、数据和业务流程真正组织起来，交付可验证的结果。

换句话说，AI云的下半场，拼的是谁能落地。

落地不是单点能力，而是系统能力

今年5月的百度Create大会，李彦宏提出了一个值得关注的判断：进入智能体时代，衡量一个平台和生态的繁荣，更应该看的是DAA这个指标，关注有多少Agent在给人类干活，并交付结果。这比Token消耗更接近价值，也更接近本质。

而Agent要真正干活，背后就需要AI云厂商的全栈AI能力。特别是对于企业级项目，往往不是简单接入一个模型API就结束了。它需要芯片和模型适配，需要推理成本优化，需要和既有业务系统打通，把员工原有工作流重新组织起来，做好数据治理、权限控制……任何一个环节没做好，Agent都难以从Demo走向生产环境。

过去，很多人对全栈AI的理解还停留在技术栈的完整度上。只要有芯片、有模型、有云、有应用，就叫全栈。但在企业客户现场，真正有价值的全栈不是“我什么都有”，而是“我可以把这些能力整合成一个可交付、可运维、可持续优化的业务系统”。

前阵子听百度智能云伐谋内部研讨会的分享，有个制造业大客户的案例印象很深刻：这个项目的方向是做一个资源运营智能体，涉及复杂的业务流程、企业数据，交付难度很大。去年一个类似的项目，是一个大厂委派30位高工驻场6个月联合攻关做的。而百度这个项目只去了两个人，其中一位还是实习生。最后上线到真实的生产系统上，关键指标提升了超过10%。

这个案例真正值得讨论的，不是谁派了多少人，而是背后的效率差。几十人的团队，意味着要分好几个小组，每个小组算力、数据、模型、应用各管一段，出了问题要层层沟通，需求变更要反复对齐。而两个人的团队，意味着每个人都能打通从底层算力到上层应用的全链路，遇到问题当场就能定位，调整方案当天就能落地。

当一条技术链路被拆给多个供应商、多个团队分别负责时，客户需求每变化一次，协同的时间和成本就会被放大一次：算力要重新适配，模型要重新调优，推理系统要重新优化，Agent实现也要跟着调整。表面上看，客户买到的是不同环节的产品和技术；实际上承担的，是整条链路反复磨合的成本。

而全栈AI厂商，可以把这些环节打通，降低交付周期和成本。不仅如此，因为算力、模型和Agent运行在同一套体系里，厂商可以联动优化、统一调度、持续反馈，系统性提升性能、降低成本。

这也是近期全栈AI被各大厂商视为重要战略方向的真正原因。

招商银行的例子更有代表性。

现在招行已经上线了超过800个AI智能体，覆盖风控、营销、研发、办公几乎所有核心场景，其中一半以上跑在昆仑芯的国产算力上。

试想，如果没有全栈能力，这些事情需要找芯片厂商、模型厂商、云厂商、集成商好几家公司一起做，看似每个环节都有专业供应商负责，但一旦进入交付环节，系统兼容性、交付稳定性、责任边界划分以及后续运维保障等关键问题会变得异常复杂。

百度这次升级的新全栈AI云，本质上是把过去在内部跑通的垂直整合能力，变成了对外输出的标准化产品。Agent层面把单位Token的智能水平做到最好，让智能体更好地完成任务；算力层面把每瓦性能和性价比做到极致。两层能力高效整合，端到端优化，实现整体性能最大化。客户不需要关心底层的技术细节，只需要关心自己的业务问题能不能解决。

AI落地难，但落地从来都不是技术问题，是工程问题，是协同问题，是成本问题。全栈AI真正要解决的也正是这类问题——要用更高效的系统，让AI更快进入到核心业务场景，把技术能力转化成业务结果。

卡位战的窗口，正在收窄

如果说去年大家还在讨论智能体是不是噱头，今年一季度中标数据已经给出更现实的答案。

数据统计，一季度国内主要云厂商大模型相关的中标项目一共85个，总金额16.5亿。

当行业从“模型能力比拼”进入“落地能力兑现”阶段，谁能真正拿下项目、进入客户生产系统，开始成为新的竞争标尺。

在这组数据里，百度智能云的领先非常明显：一季度拿下25个项目，中标金额12.48亿元，金额是第二名的五倍以上。

如果把时间再拉长，趋势会更明显。去年，百度智能云已经以48个中标项目、5.1亿元中标金额，成为国内云厂商大模型项目“中标王”。

这些数字的背后，更值得关注的，是这些项目的属性。金融、制造、能源、通信、政务、大交通等，都是高信任、高合规、高迁移成本的行业。特别是涉及到央国企的核心业务系统，他们落地AI，不是为了短期试点，是要真正把AI能力嵌入真实业务流程，甚至进入生产系统。

比如，国家电网的营销供电方案智能体，实现了企业办电流程的全面智能；金融行业的智能助理，已经渗透到不少银行每个员工的日常工作；运营商的基础设施项目，往往是数亿级别的长期建设。

而这些，都已经落到了第一梯队厂商的手里。

市场格局已经日渐清晰：第一梯队的厂商拿走了几乎所有的高价值场景，第二梯队的厂商只能抢剩下的边缘项目，第三梯队的已经开始退出市场。

企业级市场的游戏规则从来都是这样：一旦某个供应商跑通了某个行业的核心场景，产品与客户流程深度绑定，员工也形成了新的使用习惯，后来者再想进入，就必须面对很高的迁移成本。企业客户不会为了细小的模型参数差异，轻易推翻已经跑在生产环境里的系统。

这就是卡位战最残酷的地方：窗口只有一次，错过了就是错过了。

类似的逻辑，放到现在火热的通用智能体赛道，依旧成立。无论是海外的Codex，还是国内的百度搭子DuMate、WorkBuddy、Trae Work……谁能更早进入真实工作流，谁就更有机会抢先占据用户心智、培养用户习惯。目前来看，百度搭子DuMate率先进入了企业级规模落地阶段。以华硕案例来讲，依托百度智能云强大的Skills生态，用户只需通过自然语言下达指令，即可调动本地软硬件，实现如邮件自动整理、数据多维分析、PPT智能生成等多项功能。

智能体真正的价值，并不来自某一个惊艳Demo，而来自成千上万个具体场景中的效率提升。比如自如的设计师，基于秒哒代码智能体可以快速搭建AI设计平台。“设计师跟业主现场聊方案，当场就能出图。业主有新的想法，现场就改。”当这样的优化不断累积，从一个环节扩展到更多流程，从一个岗位覆盖到更多角色，从一个行业复制到更多行业……就会构成产业智能化的真实红利。

这个红利，只会属于最早卡位成功的厂商。

而这个卡位的窗口，正在快速关闭。

AI云，是一门好生意

百度今年一季度的财报出来的时候，很多人注意到AI业务收入占比首次超过50%。但从AI云角度看，更关键的是两个数字：AI云收入88亿，同比增长79%；GPU云收入同比增长184%。更难得的是，这一增长是建立在2025年AI云全年同比增长34%的基础之上，是连续高增长后的进一步提速。这样的增速，即便放在全球AI云市场里，也称得上亮眼。

毫无疑问，AI云作为百度核心增长引擎之一，是一门高增长的好生意。

不仅如此，这个增长不是建立在单纯卖Token之上，而是来自智能体、模型、算力需求的共同放大。这给AI云带来了可观的利润空间。

在财报会上，百度表示：GPU云在结构上具有高利润率特征。究其原因，GPU云不仅门槛更高、需求强劲，而且高质量供给紧张、客户对成本接受度高。而自研芯片和全栈能力有机会进一步优化成本。更长远看，为AI智能体和应用本身付费的市场规模，可能会大于单纯按Token计费的市场。

放眼全球市场，类似趋势也在发生。拿谷歌来讲，今年一季度，谷歌云收入同比增长63%，营业利润率达32.9%，同比提升15.7%，其中，未完成订单量环比几乎翻倍，数据堪称亮眼。亚马逊、微软、甲骨文等头部公司，“AI云”业务也有不同程度的增长。

AI云是一门好生意，但它并不是一门轻松的生意。

硬币的另一面是，AI云竞争正在演变成芯片、模型、推理平台、数据工程和应用交付的系统工程竞争。只卖算力，容易陷入价格战；只卖模型，容易被更便宜的API替代；只卖应用，又会受制于底层成本和能力边界。

真正有机会建立壁垒的，是充分发挥全栈AI的效率优势，把AI转化成客户愿意持续付费的业务结果。

好生意要持续，考验的是战略的耐心

但很少有人看到，这些亮眼数字的背后，是更艰难的战略选择。

尤其当GPU资源紧张时，云厂商必须回答一个现实问题：宝贵的算力，到底应该优先投向哪里？

接近百度智能云的人士告诉《新眸》，就在前不久一次内部管理层研讨会上，这个问题也作为核心议题被反复讨论。

这不是一个简单的经营问题，而是对未来AI商业模式的判断。

如果把资源过度投向MaaS，短期内Token数据一定好看。但Token生意本质上是流量生意，没有护城河。一旦价格战继续下探，最后大家都没钱赚。相反，如果把关键资源投向自研模型和智能体基建，长期会形成更高质量的商业化能力，但短期内销售团队会面临巨大压力。

这很容易让我联想到微软和谷歌，在AI时代，他们的核心管理层都经历过类似的艰难抉择。

百度智能云目前的路径，更接近后者：不把GPU全部投给短期Token收入，而是优先保障自研模型和长期技术底座的建设，再根据项目情况综合ROI分配资源。同时，继续强化软硬件协同优化，提升训推系统性能，用长期系统能力换未来更高质量的商业化。

这是一条更难也更慢的路。据内部人士透露，此前沈抖还给所有管理层和全员分享了《论持久战》的片段。按照沈抖的说法，做ToB业务，应该做的是树而不是草：只要是树，就会年复一年的生长；如果是草，无论多么旺盛，一到秋天就会枯萎，第二年只能重来。

AI行业过去两年的竞争，常常被包装成一场百米赛跑，谁模型发布得快，谁价格降得多，谁调用量冲得高，谁好像就要赢了。

但AI云是一场马拉松。短期战报重要，但更重要的是能否把核心资源投向长期价值，能否建立起真正的全栈能力，能否持续拿到高价值落地场景，并在这些场景里不断降低成本、将每一个Token都转化成有意义的业务结果。

Token战已经落幕了。

接下来，是属于落地者的时代。

本文来自微信公众号“新眸”（ID：xinmouls），作者：桑明强，36氪经授权发布。

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

AI云换赛道：Token战落幕，谁落地谁赢

落地不是单点能力，而是系统能力

卡位战的窗口，正在收窄

AI云，是一门好生意

好生意要持续，考验的是战略的耐心