营收翻3倍仍陷“烧钱黑洞”！深度拆解Anthropic财务数据：算力枷锁与变现焦虑

AI实验室的成本最终需要用户买单

神译局是36氪旗下编译团队，关注科技、商业、职场、生活等领域，重点介绍国外的新技术、新观点、新风向。

编者按：收入翻三倍也救不了现金流？当编程智能体跑赢了效率，却撞上了光刻机产能和电网的南墙。算力限购与涨价潮正在路上，这不只是AI实验室的亏损危机，最终可能也要每一位用户来买单。文章来自编译。

去年年底，一场新的 AI 狂热拉开了序幕。这一次，站在舞台中央的是“编程智能体”（coding agents）。

人们开始宣称编程进入了新纪元，诸如此类的陈词滥调不绝于耳。

很难形容在过去的两个月里，AI 给编程带来了多么巨大的变化：这种变化并非那种“循序渐进”的常规进展，而是特指刚刚过去的这个 12 月。虽然还有一些前提和限制（asterisks），但在我看来，编程智能体（Coding Agents）在 12 月之前基本上是不可用的，而自那以后基本可以胜任了——模型的质量、长期连贯性和韧性都有了显著提升，它们能够攻克大型且长期的任务，其表现已足以对默认的编程工作流产生颠覆性的影响。

几个月后，我们手里拥有的不再仅仅是口头上的宣称。我们拿到了数据。而这些数据表明，市场正在发生一些非同寻常的变化。

编程智能体是第一款让用户愿意大规模、持续性付费的 AI 产品，因为它可以直接提升工作效率。虽然现在断言企业正全面用智能体取代整个业务流程还为时尚早，但算力需求的增长速度已经超过了任何人的建设速度。

接下来，我会聊聊为什么当下的情形与以往不同，为什么没人已为此做好了准备，以及我个人的一些感悟。

数据说明一切

OpenAI 和 Anthropic 也许很快就会 IPO。正因如此，它们才急于展示其收入增长的速度有多惊人。

这笔金额极其巨大。

Anthropic 的收入自年初以来已经翻了三倍。要知道，它已经是一家大公司了，通常体量越大，维持同等增速就越难，所以这一表现确实令人惊叹。

左为 OpenAI年化收入，右为 Anthropic年化收入。

即使在过去的繁荣时期，也没人能跑出这样的数据（当然，这有一个前提条件，详见下文）。疫情期间的 Zoom、刚上市时的谷歌，或是趁着加密货币热潮大赚佣金的 Coinbase。这些公司当时的规模只有 Anthropic 的五到十分之一，且处于特殊环境下，但它们的增长速度依然略逊一筹！

大公司增长最快的年份。仅统计已成规模的公司。对比年初与年末的收入。

前提条件：首先，疫情期间的疫苗制造商表现同样抢眼；其次，Anthropic 的数据是基于早期数据对全年做出的预测，且它们的统计口径与 OpenAI 略有不同。但这些都不影响我的结论，即：

真金白银的投入是衡量“智能体系统”真实需求最可靠的风向标。

去年，当一大群人突然发现 ChatGPT 可以生成酷炫图片时，这种热度并没能转化为实质性的营收。

与此同时，仅在 1 月份，GitHub 公开仓库中 Claude Code 的提交量占比就从 2% 飙升到了 4%。如果这听起来微不足道，请记住这只是一个月的变化，而且还没算上 Codex、Copilot 或 Devin。Dylan Patel 预测，到今年年底，Claude 的占比将突破 20%。

GitHub 上的 Claude 提交量。

即便每月 100 美元的订阅费只能自动化一小部分工作，但与程序员的薪水相比，这简直是九牛一毛。对于一名日薪在 350 到 500 美元之间的普通开发者来说，如果订阅服务能处理掉最简单、最机械的 10% 的工作，那么其投资回报率（ROI）就高达 10 到 30 倍。

这里的观点仍有很多可商榷之处。

我甚至可以自己列举出我逻辑中的破绽。

收入确实在涨，没问题，但从商业模式来看，这些实验室依然处于亏损状态。他们有充足的动力去制造噱头，以吸引那些风险承受能力最强的公司。现在的付费用户大多是早期的狂热爱好者，而非大型企业。而爱好者的热情往往来去匆匆，很多泡沫就是这样破灭的。

智能体并不稳定，且依然会随机犯错。一旦出了差错，谁来担责？由于正规企业更看重可靠性，因此现在还无法取代人类。而且，如果你停止招收初级工程师，未来的资深工程师又要从哪里来？

智能体目前只能胜任一小部分特定任务。即便写代码变快了，产品的交付依然受限于需求采集、架构设计、代码评审、测试，以及我们“深恶痛绝”的利益相关者视频会议和合规流程。

但我觉得，到了某个时间点，你必须做出抉择并选边站队，哪怕还没有定论。

“终点线”可以被无限推后。曾几何时，推理能力对机器学习模型来说是天方夜谭；高质量的图像生成或听起来不像机器人的语音也是如此。曾经也没人相信机器能学会下围棋。你应该明白我的意思。

引用自泰格马克《生命 3.0》中的比喻：计算机逐渐学会处理越来越难的任务。随着时间的推移，它们无法胜任的事越来越少。就像洪水由低到高逐渐淹没地图一样。

Ilya Sutskever 还在 OpenAI 时经常提到一个内部梗：感受 AGI（Feel the AGI）。

他是第一批坚信深度学习将逐步改变人类生活的人士之一。确实，我们还有很多未知领域，但一切都在朝那个方向推进，这才是关键。每个人感受到“那一刻”的时间点都不同。当神经网络完成了你平时需要手动处理的工作时，那种感觉是非常奇妙的。

在关注神经网络的十年里，这种时刻我已经经历过无数次了。因此，我不再关心这是否是泡沫，我只关心水位如何上涨。

就个人而言，我有足够的证据表明，智能体已经能够完成让公司愿意掏腰包的有价值工作。

而且，需求增长的空间还很大。智能体通常不是开箱即用的，你需要去适应它们，而那些反应最快、好奇心最强的人总是做得最好。其他人也会逐渐跟上。

而且……

行业还没做好准备

为了让关于“行业”的讨论不显得过于抽象，我将其划分为三个层面。

AI 实验室：负责研发模型（OpenAI, Anthropic, DeepMind）。
超大规模云服务商：负责建设数据中心（Google, Amazon, Microsoft, Meta）。
芯片制造商：负责生产芯片（Nvidia, TSMC, ASML）。

而在每一个层面上，这些公司都在感到恐惧。

网友们热衷于讨论泡沫。事实证明，这些公司自己也深知泡沫的存在。为了避免破产，每家公司都在酝酿自己的应对方案。

Dario Amodei 曾表示，他是根据悲观的收入预期来制定公司计划的。讽刺的是，今年才过去三个月，他们的业绩已经比悲观预期高出 1.5 倍，甚至连乐观预期都被甩在了后头。

Dwarkesh 在采访中直截了当地问他：为什么？Dario 确实相信 AI 拥有巨大的前景。他为此撰写长篇论文，描绘“数据中心里的天才国度”。然而，他并不想把所有赌注都押在这个未来上。

Dario 认为这很冒险，因为商业模式还存在现金流缺口。

他的想法是这样的：他们向用户提供神经网络服务，向硬件持有者支付推理费用，并通过订阅和 API 盈利。与此同时，他们将巨额资金投入下一代模型的研发，而这些模型在未来一两年内都不会产生收益。

AI公司年度算力支出。他们经常将超过一半的收入用于研发。

你不仅要平衡收支，还要平衡对未来增长的投资。如果你投入巨资而预期增长没有出现，麻烦就大了。

Anthropic 已经用这种模式运作了整整三年，每年增长 10 倍。Dario 原以为这种增长会在 2026 年宣告终结，因为公司规模越大，维持增长就越难，总有一天会慢下来。

他在采访中没提到的是，他们的利润率增长低于预期。成本的增长速度比计划快了好几倍。

Dario 表示他想在几年内实现盈利。为此，他们需要提高利润率，这意味着要放慢增长步伐，转而采取保守的投资策略，只投在最高效的项目上。

这逻辑没毛病，但想慢下来谈何容易。他们今年看起来又要翻 10 倍，但支撑这种增长的资源却跟不上了。

Anthropic 没有足够的算力来支撑这么多核心用户。

他们向云服务商租用 GPU。但他们不能直接走进数据中心要求增加容量，因为数据中心的所有者同样面临泡沫风险，所以算力容量都是提前预订一空的。

为了让 Anthropic 赚到 300 亿美元，就必须有人在基础设施上投入 800 亿美元，并寄希望于几年后能回本。

亚马逊今年将投入约 2000 亿美元，谷歌 1800 亿，Meta 1250 亿，微软 1050 亿。这正是在为未来几年创造数万亿经济价值做铺垫。

而如果这些价值未能兑现，随之而来的就是现金流缺口风险。

整个行业是一条漫长的价值链。这个链条上的每一位都试图通过合同来锁定预期，以降低自身风险。但这降低了整个链条应对突发状况的能力，比如编程智能体的突然崛起。

因此，实验室每年都会遇到新的瓶颈。而且瓶颈不断向上游转移，移向那些远离最终用户的环节。因为上游的风险更高，合同的灵活性也更差。

每年都会遭遇新瓶颈

2023 年，所有人都在抢购 GPU。更具体地说，是台积电的工厂没有足够的先进封装（CoWoS）产能。到了 2024 年，轮到这些模块所需的 HBM 内存短缺。2025 年，GPU 供应有所好转，但数据中心的建设却受限于电力供应。而到了 2026 年，事实证明即使你有发电设备，美国电网也无法按需将电力输送到数据中心。

1 - 内存

现代模型对内存的需求更胜以往。我前面提到，企业每年在基础设施上投入数千亿美元，其中约 30% 都花在了内存上。

而且他们必须购买昂贵的 HBM 而非廉价的 DDR。因为高带宽可以减少 GPU 在处理数据时的等待时间。

*事实证明，内存才是 GPU 最贵的部分。*

内存价格可能会持续上涨，除非有人能找到绕过它的办法。价格再涨 2 到 3 倍也不足为奇，因为 SK 海力士和三星控制了 90% 的市场。而对内存的需求还在不断增长。

2 - 能源与数据中心

xAI 证明了数据中心的建设可以非常迅速。

但它们的耗电量堪比一个小城市。当这种庞然大物在半年内突然出现在某个地区时，当地电网根本无法负荷。

出人意料的是，Dylan Patel 对能源并不那么担心。虽然新建发电厂、变电站和输电塔耗时较长，但在电网跟上负荷之前，可以用工业燃气轮机为数据中心供电。直接拖上十几辆装满发电机的挂车开到数据中心门口就行了（尽管人们开始担心这离清洁能源的目标太远）。

此外还有活塞式发动机、太阳能配电池、氢反应堆、船舶发动机……基本上，燃油行业历史上发明的每一项技术都能派上用场。再加上更高效的电网调度，这可以提供数百吉瓦的电力。

*目前单是 GPU 就消耗了 13 吉瓦。算上数据中心的其他设备，这个数字还得翻倍。*

阻碍数据中心和反应堆快速建设的瓶颈是熟练工人的短缺，特别是电工。

虽然成本高昂且劳动力密集，但事实证明，这依然比半导体供应链要容易搞定。

3 - 半导体

台积电等代工厂负责生产特定时代的 GPU（基于英伟达或谷歌的设计），比如采用 3 纳米工艺的产品。

然而，工厂盖得还不够多。

这事儿急不来，因为这些工厂是全世界最复杂的工业设施之一。建一座工厂需要 2 到 3 年的时间，以及成堆的精密设备和化学材料。

其中最难搞的是光刻机（EUV 扫描仪）。它们负责将电路刻在晶圆上，然后晶圆与内存封装成模块，最终形成 GPU。

这些机器每台造价约为 3.5 亿美元。全世界只有荷兰的 ASML 一家公司生产，每年产量仅约 50 台。

据粗略估计，到 2030 年，全球将拥有约 700 台此类设备，对应约 200 吉瓦的算力。而到 2025 年底，我们的耗电量约为 27 吉瓦。请注意，这还没算上 2026 年初开始的智能体热潮。

所以增长空间虽然有，但短缺将是常态——受限于工厂建设、晶圆和光刻机。

与内存和数据中心能源不同，这类约束不是靠砸钱就能立刻解决的。

这一点从谷歌的行为就能看得很清楚。

谷歌有自己的芯片设计，但他们依然要从英伟达采购四分之一的算力。他们很想自给自足，但产能不允许。

占比虽然在下降，但考虑到他们自己的芯片性能更好，占比依然可观！

所有的芯片都由台积电代工。当黄仁勋锁定 70% 的 3 纳米产能合同时，同样拥有自家设计的谷歌和亚马逊却反应迟钝，错失了良机。这对台积电是好事——他们处于生产链末端，需要稳定性。

英伟达也过着神仙般的日子，卖出的显卡价格是生产成本的 6 倍。

甚至连谷歌都通过 GCP 把自己的算力产能转卖给了 Anthropic。真是个奇葩公司。

结论是什么？

结论是，行业并没有为智能体爆发做好准备。

因为爆发得太突然了。而在当前的市场上，最终起决定作用的是关于复杂芯片制造基础设施的长效合同。

Anthropic 目前拥有 2.5 吉瓦的算力，但到今年年底他们需要 5 到 6 吉瓦。想要获得这么多算力，唯一的办法就是去“其他”类别里淘。比如 CoreWeave、Bedrock、Vertex 或 Foundry。高价收购任何还没被占用的“残羹冷炙”。

而由于他们想要转型为盈利公司，所以不能无止境地烧钱。

坏消息也因此而来。

最终受苦的可能还是我们用户。

最显而易见的举动就是削减额度并提高价格。

就在前几周，他们把 OpenClaw 移到了 API 端。他们倒是解释得很诚恳：抱歉各位，我们要勒紧裤腰带了，这是补偿给各位的 20 美金。

他们还推出了根据时间段分层的收费模式。我就碰到过几次 Claude 提示算力告罄的情况。即便是在“非高峰”时段，也因为大家都在抢打折 Token 而压力山大。

对此，我为自己总结了两点感悟。

1 - 不要把鸡蛋放在同一个篮子里。

比如，在开发技能时，要确保它在任何模型上都能运行。虽然我是 Claude 的铁粉，但 OpenAI 和谷歌在算力获取方面显然更有优势。

所以我学会了根据任务切换模型。我给每家实验室都支付了最低额度的订阅费，一旦额度用完，就无缝切换。

我目前没在使用中国的开源模型。

2 - 如果你还没能靠 AI 赚钱，那确实该感到焦虑了。

对我来说，神经网络不是直接赚钱的工具。它们属于我的支出项，但由于它们为我争取了更多选择和时间，实际上早已回本。

但如果他们推出每月 1000 美元的会员级别，我就吃不消了。现在听起来很荒谬，但想想之前那个员工薪水的例子。只要 1000 美元的支出能带来 5000 美元的利润，你就赢了。

而那些无法变现的人，就只能守着免费版看广告了。

译者：boxi。

本文来自翻译, 如若转载请注明出处。

营收翻 3 倍依然深陷“烧钱黑洞”？拆解 Anthropic 财务数据背后的算力勒颈与变现焦虑