米哈游一夜烧掉200万元Token,大厂高管也开始质疑:Token烧不出价值,但养肥了谁?
终于有高管站出来,用自己的实际经验直接质疑 tokenmaxxing 成本问题了。
Uber 运营负责人 Andrew Macdonald 在近期的访谈中直接表示,公司内部越来越难证明 AI tokenmaxxing 成本是合理的。
此前,Uber 首席技术官 Praveen Neppalli Naga 曾在 4 月份时透露,Uber 已经提前用完了 2026 年的 Claude Code 预算。这番话随后在网上引发热议。Macdonald 形容自己那一刻像是“脑袋炸开了”,公司内部也开启了一场关于 token 消耗的讨论,以及这种消耗所带来的取舍,比如是否会影响员工人数。
根据与 Uber 高级工程管理层的交流, Macdonald 意识到:更高的 token 使用量,并没有转化为同等比例的、有用的消费者功能增长。
“这中间的联系还没有建立起来,对吧?”他说道,“我觉得也许从隐性层面看,确实有更多东西被交付出来了,但很难在这些数据和‘好,现在我们真的多产出了 25% 的有用消费者功能’之间画出一条清晰的线。”
Macdonald 表示,由于无法建立直接联系,AI 带来的取舍成本就更难被合理化。需要注意的是,本月早些时候,Uber CEO Dara Khosrowshahi 在财报电话会上表示,为了对冲 AI 投入,公司正在放缓招聘。
Macdonald 补充称,如果你只是“坐在那里想各种有趣用例的用户”,而且不用自己付钱,AI 看起来确实像是免费的。但最终,账单是由公司来买单。
要 tokenmaxxing?先问自己钱够吗
对于大公司来说,不用“Tokenmaxxing”,日常一次尝试就很烧钱了。
5 月 20 日,《崩坏》系列 AI NPC & Gameplay 技术团队负责人郑银河在 2026 阿里云峰会上无意透露了内部对 agent 尝试的成本:有员工为了实现项目,建了几十个 Agent 共同协作,结果一晚上烧了价值 200 万人民币的 Token。
“我们接受在探索 AI 时有成本、有学费,这也帮助更完善我们的 Agent 平台。”话虽如此,但有网友指出,这 200 万人民币的价值似乎并没有显著体现出来。
而这种“豪气”并非每个公司都能负担得起。就像有网友打趣道:“一单 648 才半个多金,两百万不过是三个全 65 氪佬养服的钱。”
值得注意的是,5 月 15 日,米哈游联合创始人刘伟曾在外部活动中表示,未来三年,最多投入 1000 亿元以深耕 AI 领域。他坦言,“就算最终不成功,没做出来,也认了,就当放一场大烟花。”
“我们作为一个‘all in ai ’口号的公司,在某一天用了十万块钱的 token 后,封掉了所有人的 API。”有网友对此评论道。
已有公司开始调整
当大型科技公司还在大力推进所谓的 “tokenmaxxing”时,一些公司已经开始往相反方向调整。
例如,多邻国此前曾决定把 AI 使用情况纳入绩效评估,但在员工提出疑问“他们是否只是为了使用 AI 而不得不用 AI”后,公司撤回了这一做法。
多邻国 CEO Luis von Ahn 在 4 月的一期播客访谈中 曾说道:
“多邻国确实曾把 AI 使用情况纳入绩效考核,但后来我们取消了。我给公司发过内部备忘录,说明绩效考核会包含 AI 使用情况,结果发现员工们会疑惑,“是不是为了用 AI 而用 AI?”。最后我们收回了这个要求,因为绩效考核最重要的是把本职工作做到最好,AI 很多时候能帮上忙,但没必要强制使用。我们不想让大家为了迎合形式而忽略实际工作成果,有些场景 AI 本身就不适用。”
还有像 Shopify 这样的公司开始想办法阻止失控的 token 消耗。
Shopify 是较早尝试 Token 排行榜的公司之一。其工程负责人 Farhan Thawar 曾表示,公司会表扬使用 Token 最多的人,因为他们可能正在用 AI 做出有价值的工作。例如,一个月在 Cursor 上花费 1000 美元的开发者,可能背后已经建立了一支 Agent 员工队伍。
但 Shopify 后来将“Token 排行榜”改名为“使用情况仪表盘”。原因是,公司不希望鼓励员工为了冲榜而竞争。Token 花费仍会展示在内部个人资料页和使用仪表盘中,但重点从“排名”转向“理解使用情况”。
Shopify 还设置了“熔断机制”。如果某个员工的个人花费在一天内突然激增,公司可以立刻切断访问权限。如果这次激增是有意为之,或确实是 Agent 失控,员工可以申请恢复。
Farhan 表示,这套机制不仅帮助公司发现了失控 Agent,也暴露出了基础设施中的 bug。更重要的是,Shopify 会关注高 Token 使用者到底在做什么。高支出员工会被询问具体使用场景,如果有人只是单纯刷 Token,很可能会在这一过程中暴露出来。
Farhan 还提出一个更有价值的角度:与其只看“谁花的钱最多”,不如看“谁生成的 Token 最贵”。一些高成本 Token 背后,往往对应更深入、更复杂的开发工作,这比单纯的总量排名更有参考价值。
Tokenmaxxing 潮中的赢家们
Tokenmaxxing 的本质是把企业内部 AI 使用从“按需调用”变成“鼓励消耗”。只要企业把 token 使用量当成先进性指标,模型厂商就获得了一个近乎完美的增长飞轮。
Tokenmaxxing 最直接的受益方,是 OpenAI、Anthropic、Google、xAI 等基础模型厂商。
因为 token 本身就是模型调用的计费单位。企业一旦把 token 使用量变成内部排行榜或绩效信号,员工就会从“按需调用 AI”转向“主动制造 AI 使用量”。这会直接放大模型 API 调用、企业订阅和推理收入。
Meta 的案例最能说明这一点。Meta 员工在 30 天内消耗了 60.2 万亿个 AI token,如果按照 Anthropic API 价格计算,这笔成本可能高达 9 亿美元;即便 Meta 能拿到折扣,成本也可能超过 1 亿美元。
这意味着,Tokenmaxxing 一旦在大型企业内部规模化,就不再是普通工具开销,而是上亿美元级别的推理账单。
Anthropic 的收入增长也能反映这种趋势。Reuters 最新报道称,Anthropic 预计 2026 年第二季度销售额将超过 109 亿美元,高于第一季度的 48 亿美元,并有望实现 5.59 亿美元经营利润。此前报道,Anthropic 的 Claude Code 在推出当年就接近 10 亿美元年化收入。
也就是说,对模型厂商而言,Tokenmaxxing 本质上是在把企业内部焦虑转化为 API 收入。当然,这不意味着模型公司没有算力压力,但 Tokenmaxxing 至少给了他们很可观的收入。
第二类赢家,是 Cursor、Claude Code、Windsurf、Replit、Lovable 等 AI 编程工具和 Agent 平台。比如,Cursor 背后的 Anysphere 在 2025 年 11 月完成新一轮融资,估值接近 300 亿美元;公司称其年化收入已经超过 10 亿美元,销售驱动收入自 2025 年初以来增长了 100 倍。
但这不代表 AI 工具类公司就能盈利。据外媒报道,Cursor、Windsurf 等公司增长迅速、估值高企,但许多公司尚未盈利,原因之一是它们依赖 Anthropic 等基础模型,推理成本很高;一些公司因此开始训练自有模型,以降低成本和增强控制力。
所以,AI 编程工具只能说是 Tokenmaxxing 的流量赢家和估值赢家,还不一定都是利润赢家。
Tokenmaxxing 底层烧的是算力,最大的赢家还是英伟达、云厂商、GPU 云服务商以及 AI 基础设施公司。
典型如英伟达,其财务数据已经体现了这种趋势。英伟达在 2026 财年(截至 2026 年 1 月)全年收入达 2159 亿美元,同比增长 65%;第四财季收入 681 亿美元,同比增长 73%。随后,在 2026 年 4 月结束的 2027 财年第一季度,收入进一步达到 816 亿美元,同比增长 85%,其中数据中心业务和网络硬件是核心驱动力,网络销售额达到 148 亿美元、同比增长约三倍。
云和推理基础设施创业公司同样受益。AI 基础架构新创公司 Modal Labs 在最新一轮融资后估值达到 46.5 亿美元,年化收入从去年 9 月的 6000 万美元增长到 3 亿美元。它的业务正好踩中两个趋势:AI coding 需求暴涨和算力资源越来越稀缺。
而这场浪潮中,最大的输家还是那些无法把 token 消耗转化为资产、但还盲目追风的企业。
有钱大厂对 token 太“上头”
回头看,这场硅谷“token 消耗战”中已经浪费了不少 token,“上头”的更多还是有钱的大厂们。
多位 Meta 工程师表示,内部正在出现大量无意义的 AI 使用。一些开发者运行类似 OpenClaw 的内部 Agent,消耗海量 Token,却几乎没有产生有效成果。还有开发者提到,部分 SEV 线上事故疑似与粗心的 AI 代码生成有关:开发者更关注用 AI 快速产出大量代码,而不是产品质量本身。
更具争议的是,排行榜让 Token 使用变成了游戏化竞争。排在榜首的员工,未必做出了更有价值的工作,反而可能制造了大量一次性、可丢弃的代码和提示词记录。内部人员查看 AI 提示词轨迹后,可以清楚看到其中许多工作并没有实际意义。
在社交媒体上出现舆论反弹,以及外媒披露相关数据后,Meta 下线了该排行榜。
微软、OpenAI、Anthropic 等内部也存在类似的 Token 使用仪表盘。早期来看,这一机制确实推动了 AI 工具实验,但问题也随之出现:当 Token 使用量与绩效评价、晋升信号、AI 原生程度挂钩后,它就不再只是一个观察指标,而会变成员工刻意追逐的目标。
有微软工程师承认,自己会主动进行 Tokenmaxxing,不是为了冲榜,而是担心被认为“AI 用得太少”。他会向 AI 提问文档里已经写明的问题;让 AI 生成自己根本不会开发的功能原型;即使明知道手写更快,也默认使用 Agent,然后看着它失败。
这位工程师入职时间不长,对职业安全感较为敏感,因此选择通过消耗更多 Token 来证明自己是“够 AI 原生”的员工。
Salesforce 的做法更激进,直接让员工之间对比 token 消耗。
根据一名内部工程师的说法,公司推出了两个工具:一个是 Mac 小组件,每 15 分钟更新一次个人花费,同时显示最低预期花费,曾有周 Claude Code 的目标是 100 美元,Cursor 的目标是 70 美元;另一个是网页工具,可以查看任意同事的 Token 花费情况。
Salesforce 还设置了 Claude Code 250 美元 / 每月、Cursor 170 美元 / 每月的最高花费限制,但这一限制可以通过简单点击按钮接触。部分工程组织甚至移除了最高限制,理由是“消除开发流程中的任何摩擦”。
这传递给员工的信号很明确:每月至少要使用约 170 美元 Token,否则可能被认为 AI 使用不足。
结果,员工开始为了达到最低线或略高于平均水平而主动燃烧 Token。一些开发者会让 Claude 或 Cursor 生成与工作无关、也不会真正交付的项目;另一些人则查看同事的花费,计算出“略高于平均值”的安全区间,再把自己的 Token 用量刷到那个位置。
Tokenmaxxing 甚至被推崇成创业方法论
然而,这个风气并未停止。YC 正在把“Tokenmaxxing”从硅谷流行词推向创业公司方法论。
在最新一期《Startup School》中,合伙人 Diana Hu 向创业者提出,打造 AI 原生公司的关键转变,不是继续扩大员工规模,而是最大化 AI token 使用量。她直言:“最大化 token 使用,而不是最大化员工人数,将成为关键转变。最优秀的公司,会是那些 tokenmaxxing 的公司。”
Hu 认为,AI 正在改变创业公司的成本结构。过去一家前 AI 时代公司需要一支大型工程团队完成的工作,如今一个熟练使用 AI 工具的人就可能完成。她表示,这意味着工程、设计、人力资源和行政团队都可以变得更精简。
她进一步建议,创业者应当愿意承受“高到令人不舒服的 API 账单”,因为这笔支出替代的,是过去更昂贵、更臃肿的人力成本。这意味着,在 YC 的新创业观里,高额 token 账单不一定是浪费,反而可能是公司用 AI 替代组织膨胀的信号。
不过,这套建议是否真的适合早期创业公司呢?
如之前所说的,这些已经有不错用户的基础的 AI 编程公司都未能盈利,那新的创业公司在 tokenmaxxing 之后的成本又该如何负担呢?难道真要把股权“贱卖”给 Altman,换 200 万美元的 token 先烧一个半月再说?
无限量、无治理、不可转嫁的 token 消耗,是会拖垮这些创业公司的。
结束语
Tokenmaxxing 的本质,一定程度上,也是企业在 AI 转型焦虑下,把“消耗”误当成了“生产力”。
它把 token 使用量包装成 AI 原生程度,把 AI 原生程度包装成组织先进性。在更多 token 是否带来了更快交付、更少 bug、更低事故率、更高收入和更可复用的能力等没有数据验证下,就无脑鼓励无尽烧 token,更像是在缴纳一笔昂贵的“转型焦虑税”。
参考链接:
https://www.businessinsider.com/uber-coo-andrew-macdonald-ai-token-spending-harder-justify-2026-5
https://mp.weixin.qq.com/s/Xvoh9hGnqe7rJ_ns5tRwBQ
https://mp.weixin.qq.com/s/JaGOyQ20UOTKkrXkJ2AXBw
https://blog.pragmaticengineer.com/the-pulse-tokenmaxxing-as-a-weird-new-trend/?utm_source=chatgpt.com
本文来自微信公众号 “AI前线”(ID:ai-front),作者:褚杏娟,36氪经授权发布。