Anthropic发出“狼来了”警告：喊停者跑得最快

递表、喊停、上新，十天之内完成。

向SEC秘密递交了IPO文件三天后，Anthropic突然抛出一篇万字长文，呼吁全世界为前沿AI开发准备一个“刹车”。又过了五天，它上线迄今最强的模型Claude Fable5，同时发布不设限版本Mythos5。

递表、喊停、上新，都发生在十天内。

这篇6月初发表的文章名为《When AI Builds Itself（当AI开始构建自身）》，由Anthropic研究负责人Marina Favaro与政策负责人、联合创始人Jack Clark共同执笔。其核心概念是“递归自我改进”，即AI几乎无需人类介入，就能自行设计、训练并升级出下一代自己。

过去几年，AI流行的风险被视为“AI替代人”。Anthropic这一次把问题往前推了一层，当AI开始替代AI研究者，技术进步就不再只是线性加速，而可能进入自我加速。

另一家AI巨头OpenAI，也加入了这场刹车讨论。

6月8日，OpenAI发布由首席执行官Sam Altman与首席研究官Jakub Pachocki联署的战略愿景文件，提出应建立一个国际组织，协调全球领先AI开发，并在必要时“放缓前沿开发”，让社会韧性、安全和对齐研究跟上技术进步。

一边是估值逼近万亿美元、冲在公开市场最前面的赛车手；一边是提醒全世界“我们手里只有油门，没有刹车”的吹哨人。两种身份，集于一身。

于是问题来了：这究竟是发自良知的警告，还是领先者在为下一程竞争，提前划赛道规则？

01.Anthropic到底在怕什么？

Anthropic这篇长文最令人不安的地方，是它把风险的发生地，从外部世界拉回到了AI公司内部。

在Anthropic内部，一个人资历越深，接到的任务就越开放。打个比方，新人的任务如果是“导出按钮坏了，修一下”；那么资深员工则要查清“为什么高负载下网络会变慢”；更高层的可能要回答“团队下个季度该做什么”。

如果把AI比作一名普通员工，那么它正顺着这个金字塔一步步往上爬。

早期，AI只是补全工具，人类写代码、搭系统、训练模型。后来，它能生成代码片段、修复Bug。再往后，编码智能体开始自己运行代码，把几小时的工作交给另一个智能体完成。Anthropic称之为“闭环”——未来，智能体可能具备自行构建和训练模型的能力。若真如此，Claude的后续版本，将由Claude自己持续改进。

这就是“递归自我改进”。

这并非科幻推演，它来自Anthropic自己的生产数据。

截至2026年5月，Anthropic代码库中合并的代码，超过80%由AI写成；2025年初Claude Code还是研究预览版时，这个比例只有个位数。落到具体的人身上，2026年第二季度，一名典型工程师每天合并的代码量是2024年的8倍。一位员工说，他已大约五个月没有亲手写过一行代码。

Claude写的也不只是简单代码。在最开放、最难定义的任务上，它的成功率在2026年5月达到76%，半年内提升了50个百分点。举个例子：一次例行升级让数万个训练任务接连崩溃，工程师几乎只丢给Claude一段说明和集群权限，它逐个环境变量测试，两小时内揪出一个冷僻的调试参数，复现并修复。这放在以前，通常是两三天的工作量。

更让Anthropic警觉的是研究环节。每次发布新模型，它都让Claude做同一道题：把一段训练小模型的代码改到尽可能快、又不出错。通常来说，一个熟练的人类研究员，要花四到八小时才能做到4倍。2025年5月，Opus4平均提速约3倍，还略逊于人类；到2026年4月，这个数字变成约52倍。不到一年，Claude在这件事上就从接近人类，变成了把人类远远甩在身后。

把这些曲线连起来，是一条人类不断后撤的路径。

即便是这家全球前沿的AI公司内部，员工也经常产生虚无感。一位员工说：“在一切顺利的日子里，我忍不住觉得自己做的事都不重要了。”

今天人类还守得住的，是所谓的研究品味与判断力：判断哪个问题值得做、哪个结果可信、哪条路是死胡同，以及看见眼前任务之外那张更大的图景。但Anthropic对这块最后的阵地也并不乐观。所谓“品味”，或许只是又一项AI先失败一阵，然后就能学会的能力。

基于此，Anthropic拆解了三种未来：其一，趋势停在今天，但现有能力被广泛扩散；其二，AI大量接管开发，人类仍掌着方向盘，组织效率成倍放大；其三，AI具备完整的自我改进能力，开始设计并训练自己的继任者，即“递归自我改进”。

Anthropic说，第三种尚未到来，也并非注定，“但可能比多数机构准备好的时间更早到来”。

那么，该怎么办？

Anthropic的答案是希望世界保留一个选项——必要时能放慢甚至暂停前沿开发，让社会结构和对齐研究跟上技术的脚步。

02.呼吁暂停，但很难暂停

Anthropic设计的暂停键，分三层。

公司内部，设立更严格的安全评估、红线与发布门槛；行业层面，前沿实验室彼此协调，不能一家踩刹车、另一家继续加速；国际层面，让政府、科学家、倡议组织与竞争对手坐到同一张桌前，讨论如何核实“暂停”是否真的发生。

它把自己的态度也写得很清楚：只要这样的验证机制存在，且其他同处前沿的开发者也以可验证的方式停下，它就愿意一起放慢，甚至暂停。

但每一个前提，都指向同一句潜台词，它不会一个人停。

这像是一个囚徒困境。

Anthropic认为，如果没有全球协调机制，公司和政府都会在竞争压力下做安全决策。而训练前沿模型，不像看守一口导弹发射井，算力可以租，任务可以拆，云服务可以跨境调用。只要有人停下，偷偷往前跑的那一方，就可能顺势接过领先位置。

最直接的例子，就是Anthropic和OpenAI的贴身肉搏。

4月23日，OpenAI发布GPT-5.5，同时推出编程助手Codex，正面狙击Anthropic的Claude Code。一个多月后，Anthropic把旗舰模型升级至Opus4.8。外界普遍认为，这一步正是被GPT-5.5和Codex逼出来的。

当地时间6月9日，Anthropic又上线了Fable 5版本，同时发布Mythos5系列模型和新一代智能体开发工具，继续把战线推向代码生成、复杂任务执行和企业级工作流。Anthropic称，Fable5的能力超过它此前公开发布的所有模型。一边警告前沿AI可能失控，一边把最强模型推向市场，中间只隔了五天。

现在，这场竞争已经蔓延到了资本市场。

就在更新Opus 4.8的同一天，Anthropic宣布完成新一轮650亿美元融资，公司投后估值9650亿美元，逼近万亿。6月1日，它抢在OpenAI前面，向SEC秘密递交了IPO文件。OpenAI也很快跟上：6月8日，宣布秘密提交S-1招股书草案，最快9月、最晚今年四季度上市，市场给出的估值预期最高到1万亿美元。

两家公司争的是谁能先成为资本市场上“前沿模型公司”的标杆，在这种量级的资本竞赛里，没人敢主动松油门。

还是拿Anthropic来说，它的最新估值已经超过了OpenAI在3月融资后8520亿美元的估值，但两家的用户规模完全不在一个量级。今年3月，ChatGPT移动端月活约9.61亿，Claude约2350万，相差40倍。撑起这个估值的，是企业客户和单用户价值。按第三方测算，每个Claude用户贡献的年化营收约808美元，是ChatGPT用户的30倍。

它现在的估值、融资能力和IPO预期，都建立在同一个前提上：它能持续推出更强模型，并把模型能力转化成收入、客户和平台地位。如果它真的单方面停下来，估值逻辑会被削弱，企业客户会担心迭代放缓，开发者可能流向OpenAI、Google或其他平台，人才也会重新判断自己是否还站在最前沿。

所以，Anthropic真正呼吁的不是“我先停”，而是“如果大家都能被验证地停，我也停”。

OpenAI的态度也是如此。

在Sam Altman和首席研究官Jakub Pachocki联署文章里，OpenAI提出应建立一个国际组织协调全球领先AI开发，在必要时放缓前沿开发，让社会韧性、安全和对齐研究跟上技术进步。

OpenAI说的是国际协调，不是单方面减速；Anthropic说的是可验证暂停，是确保别人停了我也停。两家公司都承认刹车有必要，但都把前提放在“大家一起踩”上。

更何况，这条赛道上不只有两家公司。它们身后连着云厂商、芯片商、主权AI、军工需求、金融资本和国家战略。模型越强，利益链越长，任何一环都可能成为减速的反对者。在这样的结构里，“暂停”很难是一个简单的道德选择。它更像一份高难度的多方协议，所有人都要相信别人真的停了，也要相信自己不会因为先停而失去未来。

停不下来，却偏偏在这个节点提出来。于是很多人质疑的，不是Anthropic对不对，而是它真不真诚。

NYU教授Gary Marcus的批评颇具代表性。在他看来，Anthropic并不真想暂停，这不过是一场配合IPO的修辞表演，用一个“几乎零成本”的姿态，让人们认真讨论一个它本就没打算执行的选项。

03.为什么一边喊“狼来了”，一边继续加速？

一边警告风险，一边加速迭代，几乎成了前沿AI公司的标准动作。台面上，它们反复谈安全、对齐、监管与社会准备；台面下，模型照发、算力照扩、开发者照抢、融资和上市照常推进。

过去一年，这种矛盾变得越来越明显。

Anthropic的CEO Dario Amodei频繁警告，未来几年内，AI可能获得足以改变社会结构的能力，甚至带来失控风险。他呼吁政府和行业提前建立更严格的安全机制。但与此同时，Anthropic并没有放慢脚步，而是在一年内连续推出更强大的Claude模型，不断刷新上下文长度、代码能力和智能水平，并积极争夺企业客户和开发者市场。

OpenAI的表现同样典型。CEO Sam Altman长期强调超级智能可能带来的巨大风险，多次表示人类需要为AGI做好准备，甚至支持建立针对前沿模型的监管框架。但在现实中，OpenAI持续加快产品发布节奏，从GPT-4到GPT-4o，再到后续更强模型和Agent能力的开放，几乎每隔几个月就把竞争门槛再往前推一步。

围观的人，开始不买账了。

在不少人看来，两家头部模型公司是赶在上市前，先把自己摆到“负责任玩家”的位置。

另一种批评更直接。有媒体称，Anthropic等公司是想把“安全”变成护城河。

当一家已经站在第一梯队、即将进入公开市场的公司反复强调“前沿模型过于危险”，讨论很容易转向更高的准入门槛、更复杂的评估制度、更昂贵的合规成本。对头部公司来说，这些都不难实现，甚至可以变成优势；但对开源社区、中小团队和后发者来说，可能会面临出局的风险。

站在这个角度，问题就从“AI是否危险”变成了“谁有权定义危险”。一旦标准由少数前沿AI公司参与制定，最后被挡在门外的，未必是最危险的玩家，反而可能是最没有话语权的玩家。

这也是为什么英伟达CEO黄仁勋多次批评Dario Amodei等人的灾难叙事。在他看来，把AI说得过于可怕，只会放大社会恐慌。

黄仁勋的观点背后，其实代表着两种生意的对撞。

对英伟达来说，AI越开放、越扩散，芯片、开发者和云生态越繁荣。对Anthropic这样的前沿模型公司来说，AI越被定义为高风险，行业越可能走向许可制、评估制和高合规成本，而头部公司天然更能承受这种成本。

所以，反对者真正介意的，是Anthropic同时占据了三个位置：前沿竞赛的领先者、风险叙事的提出者，以及未来规则的潜在受益者。

哈耶克在《通往奴役之路》中曾写道，人们在努力按照崇高理想塑造未来时，可能在不知不觉中创造出与初衷截然相反的结果。把这句话放到今天的AI行业，几乎像一句精准的预言。

OpenAI在2015年以非营利身份成立，使命是确保AGI“造福全人类”。但随着模型竞赛加速、算力成本膨胀、资金需求上升，它在2019年设立“有限盈利”子公司，随后被更深地卷入商业化、融资和平台竞争。

一个把“为全人类”写进章程的组织，十年里也被竞争和资本不断改写。

Anthropic今天面对的是同一个结构。它可能真心相信AI风险正在逼近，也可能真心想为行业争取时间。但在这个行业里，崇高的初衷很难单独对抗激烈竞争。

前沿AI竞赛的现实是：谁先停，谁就可能失去市场、人才、资本和话语权。于是，所有公司都知道速度危险，却都继续加速；所有公司都讨论刹车，却都希望别人先踩刹车。

因此，Anthropic未必是在撒谎，也未必只是作秀。它可能既害怕自己正在制造的东西，又无法停止制造它。

*文中配图来源于pexels。

本文来自微信公众号“AIX财经”，作者：陈丹，36氪经授权发布。

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

Anthropic“狼来了”：喊停的人，跑得最快

01.Anthropic到底在怕什么？

02.呼吁暂停，但很难暂停

03.为什么一边喊“狼来了”，一边继续加速？