营收翻 3 倍依然深陷“烧钱黑洞”?拆解 Anthropic 财务数据背后的算力勒颈与变现焦虑
神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。
编者按:收入翻三倍也救不了现金流?当编程智能体跑赢了效率,却撞上了光刻机产能和电网的南墙。算力限购与涨价潮正在路上,这不只是AI实验室的亏损危机,最终可能也要每一位用户来买单。文章来自编译。
去年年底,一场新的 AI 狂热拉开了序幕。这一次,站在舞台中央的是“编程智能体”(coding agents)。
人们开始宣称编程进入了新纪元,诸如此类的陈词滥调不绝于耳。
很难形容在过去的两个月里,AI 给编程带来了多么巨大的变化:这种变化并非那种“循序渐进”的常规进展,而是特指刚刚过去的这个 12 月。虽然还有一些前提和限制(asterisks),但在我看来,编程智能体(Coding Agents)在 12 月之前基本上是不可用的,而自那以后基本可以胜任了——模型的质量、长期连贯性和韧性都有了显著提升,它们能够攻克大型且长期的任务,其表现已足以对默认的编程工作流产生颠覆性的影响。
几个月后,我们手里拥有的不再仅仅是口头上的宣称。我们拿到了数据。而这些数据表明,市场正在发生一些非同寻常的变化。
编程智能体是第一款让用户愿意大规模、持续性付费的 AI 产品,因为它可以直接提升工作效率。虽然现在断言企业正全面用智能体取代整个业务流程还为时尚早,但算力需求的增长速度已经超过了任何人的建设速度。
接下来,我会聊聊为什么当下的情形与以往不同,为什么没人已为此做好了准备,以及我个人的一些感悟。
数据说明一切
OpenAI 和 Anthropic 也许很快就会 IPO。正因如此,它们才急于展示其收入增长的速度有多惊人。
这笔金额极其巨大。
Anthropic 的收入自年初以来已经翻了三倍。要知道,它已经是一家大公司了,通常体量越大,维持同等增速就越难,所以这一表现确实令人惊叹。
左为 OpenAI年化收入,右为 Anthropic年化收入。
即使在过去的繁荣时期,也没人能跑出这样的数据(当然,这有一个前提条件,详见下文)。疫情期间的 Zoom、刚上市时的谷歌,或是趁着加密货币热潮大赚佣金的 Coinbase。这些公司当时的规模只有 Anthropic 的五到十分之一,且处于特殊环境下,但它们的增长速度依然略逊一筹!
大公司增长最快的年份。仅统计已成规模的公司。对比年初与年末的收入。
前提条件:首先,疫情期间的疫苗制造商表现同样抢眼;其次,Anthropic 的数据是基于早期数据对全年做出的预测,且它们的统计口径与 OpenAI 略有不同。但这些都不影响我的结论,即:
真金白银的投入是衡量“智能体系统”真实需求最可靠的风向标。
去年,当一大群人突然发现 ChatGPT 可以生成酷炫图片时,这种热度并没能转化为实质性的营收。
与此同时,仅在 1 月份,GitHub 公开仓库中 Claude Code 的提交量占比就从 2% 飙升到了 4%。如果这听起来微不足道,请记住这只是一个月的变化,而且还没算上 Codex、Copilot 或 Devin。Dylan Patel 预测,到今年年底,Claude 的占比将突破 20%。
GitHub 上的 Claude 提交量。
即便每月 100 美元的订阅费只能自动化一小部分工作,但与程序员的薪水相比,这简直是九牛一毛。对于一名日薪在 350 到 500 美元之间的普通开发者来说,如果订阅服务能处理掉最简单、最机械的 10% 的工作,那么其投资回报率(ROI)就高达 10 到 30 倍。
这里的观点仍有很多可商榷之处。
我甚至可以自己列举出我逻辑中的破绽。
收入确实在涨,没问题,但从商业模式来看,这些实验室依然处于亏损状态。他们有充足的动力去制造噱头,以吸引那些风险承受能力最强的公司。现在的付费用户大多是早期的狂热爱好者,而非大型企业。而爱好者的热情往往来去匆匆,很多泡沫就是这样破灭的。
智能体并不稳定,且依然会随机犯错。一旦出了差错,谁来担责?由于正规企业更看重可靠性,因此现在还无法取代人类。而且,如果你停止招收初级工程师,未来的资深工程师又要从哪里来?
智能体目前只能胜任一小部分特定任务。即便写代码变快了,产品的交付依然受限于需求采集、架构设计、代码评审、测试,以及我们“深恶痛绝”的利益相关者视频会议和合规流程。
但我觉得,到了某个时间点,你必须做出抉择并选边站队,哪怕还没有定论。
“终点线”可以被无限推后。曾几何时,推理能力对机器学习模型来说是天方夜谭;高质量的图像生成或听起来不像机器人的语音也是如此。曾经也没人相信机器能学会下围棋。你应该明白我的意思。
引用自泰格马克《生命 3.0》中的比喻:计算机逐渐学会处理越来越难的任务。随着时间的推移,它们无法胜任的事越来越少。就像洪水由低到高逐渐淹没地图一样。
Ilya Sutskever 还在 OpenAI 时经常提到一个内部梗:感受 AGI(Feel the AGI)。
他是第一批坚信深度学习将逐步改变人类生活的人士之一。确实,我们还有很多未知领域,但一切都在朝那个方向推进,这才是关键。每个人感受到“那一刻”的时间点都不同。当神经网络完成了你平时需要手动处理的工作时,那种感觉是非常奇妙的。
在关注神经网络的十年里,这种时刻我已经经历过无数次了。因此,我不再关心这是否是泡沫,我只关心水位如何上涨。
就个人而言,我有足够的证据表明,智能体已经能够完成让公司愿意掏腰包的有价值工作。
而且,需求增长的空间还很大。智能体通常不是开箱即用的,你需要去适应它们,而那些反应最快、好奇心最强的人总是做得最好。其他人也会逐渐跟上。
而且……
行业还没做好准备
为了让关于“行业”的讨论不显得过于抽象,我将其划分为三个层面。
AI 实验室:负责研发模型(OpenAI, Anthropic, DeepMind)。
超大规模云服务商:负责建设数据中心(Google, Amazon, Microsoft, Meta)。
芯片制造商:负责生产芯片(Nvidia, TSMC, ASML)。
而在每一个层面上,这些公司都在感到恐惧。
网友们热衷于讨论泡沫。事实证明,这些公司自己也深知泡沫的存在。为了避免破产,每家公司都在酝酿自己的应对方案。
Dario Amodei 曾表示,他是根据悲观的收入预期来制定公司计划的。讽刺的是,今年才过去三个月,他们的业绩已经比悲观预期高出 1.5 倍,甚至连乐观预期都被甩在了后头。
Dwarkesh 在采访中直截了当地问他:为什么?Dario 确实相信 AI 拥有巨大的前景。他为此撰写长篇论文,描绘“数据中心里的天才国度”。然而,他并不想把所有赌注都押在这个未来上。
Dario 认为这很冒险,因为商业模式还存在现金流缺口。
他的想法是这样的:他们向用户提供神经网络服务,向硬件持有者支付推理费用,并通过订阅和 API 盈利。与此同时,他们将巨额资金投入下一代模型的研发,而这些模型在未来一两年内都不会产生收益。
AI公司年度算力支出。他们经常将超过一半的收入用于研发。
你不仅要平衡收支,还要平衡对未来增长的投资。如果你投入巨资而预期增长没有出现,麻烦就大了。
Anthropic 已经用这种模式运作了整整三年,每年增长 10 倍。Dario 原以为这种增长会在 2026 年宣告终结,因为公司规模越大,维持增长就越难,总有一天会慢下来。
他在采访中没提到的是,他们的利润率增长低于预期。成本的增长速度比计划快了好几倍。
Dario 表示他想在几年内实现盈利。为此,他们需要提高利润率,这意味着要放慢增长步伐,转而采取保守的投资策略,只投在最高效的项目上。
这逻辑没毛病,但想慢下来谈何容易。他们今年看起来又要翻 10 倍,但支撑这种增长的资源却跟不上了。
Anthropic 没有足够的算力来支撑这么多核心用户。
他们向云服务商租用 GPU。但他们不能直接走进数据中心要求增加容量,因为数据中心的所有者同样面临泡沫风险,所以算力容量都是提前预订一空的。
为了让 Anthropic 赚到 300 亿美元,就必须有人在基础设施上投入 800 亿美元,并寄希望于几年后能回本。
亚马逊今年将投入约 2000 亿美元,谷歌 1800 亿,Meta 1250 亿,微软 1050 亿。这正是在为未来几年创造数万亿经济价值做铺垫。
而如果这些价值未能兑现,随之而来的就是现金流缺口风险。
整个行业是一条漫长的价值链。这个链条上的每一位都试图通过合同来锁定预期,以降低自身风险。但这降低了整个链条应对突发状况的能力,比如编程智能体的突然崛起。
因此,实验室每年都会遇到新的瓶颈。而且瓶颈不断向上游转移,移向那些远离最终用户的环节。因为上游的风险更高,合同的灵活性也更差。
每年都会遭遇新瓶颈
2023 年,所有人都在抢购 GPU。更具体地说,是台积电的工厂没有足够的先进封装(CoWoS)产能。到了 2024 年,轮到这些模块所需的 HBM 内存短缺。2025 年,GPU 供应有所好转,但数据中心的建设却受限于电力供应。而到了 2026 年,事实证明即使你有发电设备,美国电网也无法按需将电力输送到数据中心。
1 - 内存
现代模型对内存的需求更胜以往。我前面提到,企业每年在基础设施上投入数千亿美元,其中约 30% 都花在了内存上。
而且他们必须购买昂贵的 HBM 而非廉价的 DDR。因为高带宽可以减少 GPU 在处理数据时的等待时间。
*事实证明,内存才是 GPU 最贵的部分。*
内存价格可能会持续上涨,除非有人能找到绕过它的办法。价格再涨 2 到 3 倍也不足为奇,因为 SK 海力士和三星控制了 90% 的市场。而对内存的需求还在不断增长。
2 - 能源与数据中心
xAI 证明了数据中心的建设可以非常迅速。
但它们的耗电量堪比一个小城市。当这种庞然大物在半年内突然出现在某个地区时,当地电网根本无法负荷。
出人意料的是,Dylan Patel 对能源并不那么担心。虽然新建发电厂、变电站和输电塔耗时较长,但在电网跟上负荷之前,可以用工业燃气轮机为数据中心供电。直接拖上十几辆装满发电机的挂车开到数据中心门口就行了(尽管人们开始担心这离清洁能源的目标太远)。
此外还有活塞式发动机、太阳能配电池、氢反应堆、船舶发动机……基本上,燃油行业历史上发明的每一项技术都能派上用场。再加上更高效的电网调度,这可以提供数百吉瓦的电力。
*目前单是 GPU 就消耗了 13 吉瓦。算上数据中心的其他设备,这个数字还得翻倍。*
阻碍数据中心和反应堆快速建设的瓶颈是熟练工人的短缺,特别是电工。
虽然成本高昂且劳动力密集,但事实证明,这依然比半导体供应链要容易搞定。
3 - 半导体
台积电等代工厂负责生产特定时代的 GPU(基于英伟达或谷歌的设计),比如采用 3 纳米工艺的产品。
然而,工厂盖得还不够多。
这事儿急不来,因为这些工厂是全世界最复杂的工业设施之一。建一座工厂需要 2 到 3 年的时间,以及成堆的精密设备和化学材料。
其中最难搞的是光刻机(EUV 扫描仪)。它们负责将电路刻在晶圆上,然后晶圆与内存封装成模块,最终形成 GPU。
这些机器每台造价约为 3.5 亿美元。全世界只有荷兰的 ASML 一家公司生产,每年产量仅约 50 台。
据粗略估计,到 2030 年,全球将拥有约 700 台此类设备,对应约 200 吉瓦的算力。而到 2025 年底,我们的耗电量约为 27 吉瓦。请注意,这还没算上 2026 年初开始的智能体热潮。
所以增长空间虽然有,但短缺将是常态——受限于工厂建设、晶圆和光刻机。
与内存和数据中心能源不同,这类约束不是靠砸钱就能立刻解决的。
这一点从谷歌的行为就能看得很清楚。
谷歌有自己的芯片设计,但他们依然要从英伟达采购四分之一的算力。他们很想自给自足,但产能不允许。
占比虽然在下降,但考虑到他们自己的芯片性能更好,占比依然可观!
所有的芯片都由台积电代工。当黄仁勋锁定 70% 的 3 纳米产能合同时,同样拥有自家设计的谷歌和亚马逊却反应迟钝,错失了良机。这对台积电是好事——他们处于生产链末端,需要稳定性。
英伟达也过着神仙般的日子,卖出的显卡价格是生产成本的 6 倍。
甚至连谷歌都通过 GCP 把自己的算力产能转卖给了 Anthropic。真是个奇葩公司。
结论是什么?
结论是,行业并没有为智能体爆发做好准备。
因为爆发得太突然了。而在当前的市场上,最终起决定作用的是关于复杂芯片制造基础设施的长效合同。
Anthropic 目前拥有 2.5 吉瓦的算力,但到今年年底他们需要 5 到 6 吉瓦。想要获得这么多算力,唯一的办法就是去“其他”类别里淘。比如 CoreWeave、Bedrock、Vertex 或 Foundry。高价收购任何还没被占用的“残羹冷炙”。
而由于他们想要转型为盈利公司,所以不能无止境地烧钱。
坏消息也因此而来。
最终受苦的可能还是我们用户。
最显而易见的举动就是削减额度并提高价格。
就在前几周,他们把 OpenClaw 移到了 API 端。他们倒是解释得很诚恳:抱歉各位,我们要勒紧裤腰带了,这是补偿给各位的 20 美金。
他们还推出了根据时间段分层的收费模式。我就碰到过几次 Claude 提示算力告罄的情况。即便是在“非高峰”时段,也因为大家都在抢打折 Token 而压力山大。
对此,我为自己总结了两点感悟。
1 - 不要把鸡蛋放在同一个篮子里。
比如,在开发技能时,要确保它在任何模型上都能运行。虽然我是 Claude 的铁粉,但 OpenAI 和谷歌在算力获取方面显然更有优势。
所以我学会了根据任务切换模型。我给每家实验室都支付了最低额度的订阅费,一旦额度用完,就无缝切换。
我目前没在使用中国的开源模型。
2 - 如果你还没能靠 AI 赚钱,那确实该感到焦虑了。
对我来说,神经网络不是直接赚钱的工具。它们属于我的支出项,但由于它们为我争取了更多选择和时间,实际上早已回本。
但如果他们推出每月 1000 美元的会员级别,我就吃不消了。现在听起来很荒谬,但想想之前那个员工薪水的例子。只要 1000 美元的支出能带来 5000 美元的利润,你就赢了。
而那些无法变现的人,就只能守着免费版看广告了。
译者:boxi。