首页文章详情

Anthropic“狼来了”:喊停的人,跑得最快

AIX财经2026-06-11 18:47
递表、喊停、上新,十天之内完成。

向SEC秘密递交了IPO文件三天后,Anthropic突然抛出一篇万字长文,呼吁全世界为前沿AI开发准备一个“刹车”。又过了五天,它上线迄今最强的模型Claude Fable5,同时发布不设限版本Mythos5。

递表、喊停、上新,都发生在十天内。

这篇6月初发表的文章名为《When AI Builds Itself(当AI开始构建自身)》,由Anthropic研究负责人Marina Favaro与政策负责人、联合创始人Jack Clark共同执笔。其核心概念是“递归自我改进”,即AI几乎无需人类介入,就能自行设计、训练并升级出下一代自己。

过去几年,AI流行的风险被视为“AI替代人”。Anthropic这一次把问题往前推了一层,当AI开始替代AI研究者,技术进步就不再只是线性加速,而可能进入自我加速。

另一家AI巨头OpenAI,也加入了这场刹车讨论。

6月8日,OpenAI发布由首席执行官Sam Altman与首席研究官Jakub Pachocki联署的战略愿景文件,提出应建立一个国际组织,协调全球领先AI开发,并在必要时“放缓前沿开发”,让社会韧性、安全和对齐研究跟上技术进步。

一边是估值逼近万亿美元、冲在公开市场最前面的赛车手;一边是提醒全世界“我们手里只有油门,没有刹车”的吹哨人。两种身份,集于一身。

于是问题来了:这究竟是发自良知的警告,还是领先者在为下一程竞争,提前划赛道规则?

01.Anthropic到底在怕什么?

Anthropic这篇长文最令人不安的地方,是它把风险的发生地,从外部世界拉回到了AI公司内部。

在Anthropic内部,一个人资历越深,接到的任务就越开放。打个比方,新人的任务如果是“导出按钮坏了,修一下”;那么资深员工则要查清“为什么高负载下网络会变慢”;更高层的可能要回答“团队下个季度该做什么”。

如果把AI比作一名普通员工,那么它正顺着这个金字塔一步步往上爬。

早期,AI只是补全工具,人类写代码、搭系统、训练模型。后来,它能生成代码片段、修复Bug。再往后,编码智能体开始自己运行代码,把几小时的工作交给另一个智能体完成。Anthropic称之为“闭环”——未来,智能体可能具备自行构建和训练模型的能力。若真如此,Claude的后续版本,将由Claude自己持续改进。

这就是“递归自我改进”。

这并非科幻推演,它来自Anthropic自己的生产数据。

截至2026年5月,Anthropic代码库中合并的代码,超过80%由AI写成;2025年初Claude Code还是研究预览版时,这个比例只有个位数。落到具体的人身上,2026年第二季度,一名典型工程师每天合并的代码量是2024年的8倍。一位员工说,他已大约五个月没有亲手写过一行代码。

Claude写的也不只是简单代码。在最开放、最难定义的任务上,它的成功率在2026年5月达到76%,半年内提升了50个百分点。举个例子:一次例行升级让数万个训练任务接连崩溃,工程师几乎只丢给Claude一段说明和集群权限,它逐个环境变量测试,两小时内揪出一个冷僻的调试参数,复现并修复。这放在以前,通常是两三天的工作量。

更让Anthropic警觉的是研究环节。每次发布新模型,它都让Claude做同一道题:把一段训练小模型的代码改到尽可能快、又不出错。通常来说,一个熟练的人类研究员,要花四到八小时才能做到4倍。2025年5月,Opus4平均提速约3倍,还略逊于人类;到2026年4月,这个数字变成约52倍。不到一年,Claude在这件事上就从接近人类,变成了把人类远远甩在身后。

把这些曲线连起来,是一条人类不断后撤的路径。

即便是这家全球前沿的AI公司内部,员工也经常产生虚无感。一位员工说:“在一切顺利的日子里,我忍不住觉得自己做的事都不重要了。”

今天人类还守得住的,是所谓的研究品味与判断力:判断哪个问题值得做、哪个结果可信、哪条路是死胡同,以及看见眼前任务之外那张更大的图景。但Anthropic对这块最后的阵地也并不乐观。所谓“品味”,或许只是又一项AI先失败一阵,然后就能学会的能力。

基于此,Anthropic拆解了三种未来:其一,趋势停在今天,但现有能力被广泛扩散;其二,AI大量接管开发,人类仍掌着方向盘,组织效率成倍放大;其三,AI具备完整的自我改进能力,开始设计并训练自己的继任者,即“递归自我改进”。

Anthropic说,第三种尚未到来,也并非注定,“但可能比多数机构准备好的时间更早到来”。

那么,该怎么办?

Anthropic的答案是希望世界保留一个选项——必要时能放慢甚至暂停前沿开发,让社会结构和对齐研究跟上技术的脚步。

02.呼吁暂停,但很难暂停

Anthropic设计的暂停键,分三层。

公司内部,设立更严格的安全评估、红线与发布门槛;行业层面,前沿实验室彼此协调,不能一家踩刹车、另一家继续加速;国际层面,让政府、科学家、倡议组织与竞争对手坐到同一张桌前,讨论如何核实“暂停”是否真的发生。

它把自己的态度也写得很清楚:只要这样的验证机制存在,且其他同处前沿的开发者也以可验证的方式停下,它就愿意一起放慢,甚至暂停。

但每一个前提,都指向同一句潜台词,它不会一个人停。

这像是一个囚徒困境。

Anthropic认为,如果没有全球协调机制,公司和政府都会在竞争压力下做安全决策。而训练前沿模型,不像看守一口导弹发射井,算力可以租,任务可以拆,云服务可以跨境调用。只要有人停下,偷偷往前跑的那一方,就可能顺势接过领先位置。

最直接的例子,就是Anthropic和OpenAI的贴身肉搏。

4月23日,OpenAI发布GPT-5.5,同时推出编程助手Codex,正面狙击Anthropic的Claude Code。一个多月后,Anthropic把旗舰模型升级至Opus4.8。外界普遍认为,这一步正是被GPT-5.5和Codex逼出来的。

当地时间6月9日,Anthropic又上线了Fable 5版本,同时发布Mythos5系列模型和新一代智能体开发工具,继续把战线推向代码生成、复杂任务执行和企业级工作流。Anthropic称,Fable5的能力超过它此前公开发布的所有模型。一边警告前沿AI可能失控,一边把最强模型推向市场,中间只隔了五天。

现在,这场竞争已经蔓延到了资本市场。

就在更新Opus 4.8的同一天,Anthropic宣布完成新一轮650亿美元融资,公司投后估值9650亿美元,逼近万亿。6月1日,它抢在OpenAI前面,向SEC秘密递交了IPO文件。OpenAI也很快跟上:6月8日,宣布秘密提交S-1招股书草案,最快9月、最晚今年四季度上市,市场给出的估值预期最高到1万亿美元。

两家公司争的是谁能先成为资本市场上“前沿模型公司”的标杆,在这种量级的资本竞赛里,没人敢主动松油门。

还是拿Anthropic来说,它的最新估值已经超过了OpenAI在3月融资后8520亿美元的估值,但两家的用户规模完全不在一个量级。今年3月,ChatGPT移动端月活约9.61亿,Claude约2350万,相差40倍。撑起这个估值的,是企业客户和单用户价值。按第三方测算,每个Claude用户贡献的年化营收约808美元,是ChatGPT用户的30倍。

它现在的估值、融资能力和IPO预期,都建立在同一个前提上:它能持续推出更强模型,并把模型能力转化成收入、客户和平台地位。如果它真的单方面停下来,估值逻辑会被削弱,企业客户会担心迭代放缓,开发者可能流向OpenAI、Google或其他平台,人才也会重新判断自己是否还站在最前沿。

所以,Anthropic真正呼吁的不是“我先停”,而是“如果大家都能被验证地停,我也停”。

OpenAI的态度也是如此。

在Sam Altman和首席研究官Jakub Pachocki联署文章里,OpenAI提出应建立一个国际组织协调全球领先AI开发,在必要时放缓前沿开发,让社会韧性、安全和对齐研究跟上技术进步。

OpenAI说的是国际协调,不是单方面减速;Anthropic说的是可验证暂停,是确保别人停了我也停。两家公司都承认刹车有必要,但都把前提放在“大家一起踩”上。

更何况,这条赛道上不只有两家公司。它们身后连着云厂商、芯片商、主权AI、军工需求、金融资本和国家战略。模型越强,利益链越长,任何一环都可能成为减速的反对者。在这样的结构里,“暂停”很难是一个简单的道德选择。它更像一份高难度的多方协议,所有人都要相信别人真的停了,也要相信自己不会因为先停而失去未来。

停不下来,却偏偏在这个节点提出来。于是很多人质疑的,不是Anthropic对不对,而是它真不真诚。

NYU教授Gary Marcus的批评颇具代表性。在他看来,Anthropic并不真想暂停,这不过是一场配合IPO的修辞表演,用一个“几乎零成本”的姿态,让人们认真讨论一个它本就没打算执行的选项。

03.为什么一边喊“狼来了”,一边继续加速?

一边警告风险,一边加速迭代,几乎成了前沿AI公司的标准动作。台面上,它们反复谈安全、对齐、监管与社会准备;台面下,模型照发、算力照扩、开发者照抢、融资和上市照常推进。

过去一年,这种矛盾变得越来越明显。

Anthropic的CEO Dario Amodei频繁警告,未来几年内,AI可能获得足以改变社会结构的能力,甚至带来失控风险。他呼吁政府和行业提前建立更严格的安全机制。但与此同时,Anthropic并没有放慢脚步,而是在一年内连续推出更强大的Claude模型,不断刷新上下文长度、代码能力和智能水平,并积极争夺企业客户和开发者市场。

OpenAI的表现同样典型。CEO Sam Altman长期强调超级智能可能带来的巨大风险,多次表示人类需要为AGI做好准备,甚至支持建立针对前沿模型的监管框架。但在现实中,OpenAI持续加快产品发布节奏,从GPT-4到GPT-4o,再到后续更强模型和Agent能力的开放,几乎每隔几个月就把竞争门槛再往前推一步。

围观的人,开始不买账了。

在不少人看来,两家头部模型公司是赶在上市前,先把自己摆到“负责任玩家”的位置。

另一种批评更直接。有媒体称,Anthropic等公司是想把“安全”变成护城河。

当一家已经站在第一梯队、即将进入公开市场的公司反复强调“前沿模型过于危险”,讨论很容易转向更高的准入门槛、更复杂的评估制度、更昂贵的合规成本。对头部公司来说,这些都不难实现,甚至可以变成优势;但对开源社区、中小团队和后发者来说,可能会面临出局的风险。

站在这个角度,问题就从“AI是否危险”变成了“谁有权定义危险”。一旦标准由少数前沿AI公司参与制定,最后被挡在门外的,未必是最危险的玩家,反而可能是最没有话语权的玩家。

这也是为什么英伟达CEO黄仁勋多次批评Dario Amodei等人的灾难叙事。在他看来,把AI说得过于可怕,只会放大社会恐慌。

黄仁勋的观点背后,其实代表着两种生意的对撞。

对英伟达来说,AI越开放、越扩散,芯片、开发者和云生态越繁荣。对Anthropic这样的前沿模型公司来说,AI越被定义为高风险,行业越可能走向许可制、评估制和高合规成本,而头部公司天然更能承受这种成本。

所以,反对者真正介意的,是Anthropic同时占据了三个位置:前沿竞赛的领先者、风险叙事的提出者,以及未来规则的潜在受益者。

哈耶克在《通往奴役之路》中曾写道,人们在努力按照崇高理想塑造未来时,可能在不知不觉中创造出与初衷截然相反的结果。把这句话放到今天的AI行业,几乎像一句精准的预言。

OpenAI在2015年以非营利身份成立,使命是确保AGI“造福全人类”。但随着模型竞赛加速、算力成本膨胀、资金需求上升,它在2019年设立“有限盈利”子公司,随后被更深地卷入商业化、融资和平台竞争。

一个把“为全人类”写进章程的组织,十年里也被竞争和资本不断改写。

Anthropic今天面对的是同一个结构。它可能真心相信AI风险正在逼近,也可能真心想为行业争取时间。但在这个行业里,崇高的初衷很难单独对抗激烈竞争。

前沿AI竞赛的现实是:谁先停,谁就可能失去市场、人才、资本和话语权。于是,所有公司都知道速度危险,却都继续加速;所有公司都讨论刹车,却都希望别人先踩刹车。

因此,Anthropic未必是在撒谎,也未必只是作秀。它可能既害怕自己正在制造的东西,又无法停止制造它。

*文中配图来源于pexels。

本文来自微信公众号“AIX财经”,作者:陈丹,36氪经授权发布。