Anthropic道歉了,但“安全”这门生意还没停
6月11日,Anthropic道歉了。模型没翻车,道的是"没把握好平衡"——新发的Claude Fable 5搞小动作,一旦识别到你在用Claude搞前沿模型开发,后台就悄悄把请求扔给更弱的Opus 4.8,全程静默。
被抓包后,Anthropic的解释很奇葩:以后降智会通知你。
网友的回怼一针见血:"这套操作,以后改口前打算先打个招呼?"
其实问题的核心根本不是模型是否变了,而是Anthropic所谓的"安全",从头到尾就是一门生意。
算法的立场,永远跟着金钱摇摆的。
竞业防守,冒充安全防御
事情的起因是,Anthropic在Fable 5上线时带了个"智能安全分类器",官方给出的话术是:测出高危请求,自动降级,保护用户。
什么叫高危?Anthropic自己交了底:"防止外国对手利用模型加速研发,保护自身领先优势。"
用户哪里需要你保护,免责协议里的东西就够保护用户了。Anthropic的意思其实是:你用Claude搞AI研究,就是在抢他们饭碗。安全是包装,本质是竞业防守。说白了,都是刀法。
更绝的是,这套防守机制是很隐秘。好在最后Anthropic在道歉声明里说了句大实话:"不可见的安全限制可以更精准地针对特定目标,使我们能够快速发布,且误报率极低。"
AI研究者就是那个被精准设限的对象。
现在被迫改成"可见",纯粹是因为翻车了。他们甚至提前打了预防针:可见之后"不可避免地会产生更多误报"。意思是,普通用户的体验得跟着背锅。
这套规则从未中立,它只保护金主。
造势、变现、收割三部曲
Anthropic这套玩法,比大模型本身算得都精。
6月10日,他们先丢一篇安全研究,训练了一个模型,能在数小时内根据安全补丁反向构建漏洞利用代码。原本黑客得熬上几天甚至几周才能武器化的N-day漏洞,现在被压缩到了小时级。研究本身硬核,但放在Fable 5上线同一天,事情就变味了:一边证明AI很不安全,一边卖"兜底方案"。
“传奇模型”Fable 5定价$10输入/$50输出,比Opus 4.8贵一截,安全分类器成了核心溢价点。资本市场更配合,Anthropic估值9650亿美元,计划10月IPO,高盛、摩根大通联合承销。买的不是模型参数,是"最安全AI公司"的人设。
研究放大焦虑,产品收割溢价,资本变现,三件事顺着利益走,闭环严丝合缝。唯一的问题是,这次闭环漏风了:太急着设限竞争对手,忘了社区里有人能测出来。
OpenAI卖工具,Anthropic卖焦虑
对比OpenAI,路数完全不同。
OpenAI在秘密提交IPO,估值逼近万亿,讲的是"超级应用":ChatGPT周活9亿,打通Visa做生态。逻辑直白:给工具,赚流量。贪婪,但坦荡。
Anthropic不卷规模,卷不可替代性。全行业焦虑安全,它就扮"唯一负责任的大人"。它的金主是政府和巨头,这帮人最怕出事,也最愿意为"不出事"砸钱。
所以Anthropic必须让AI永远处于"危险但可控"的薛定谔状态。太安全,分类器卖不动;太危险,客户吓跑了。最好的解法?把定义"危险"的权力攥在自己手里。
降智事件只是把这套逻辑玩脱了:"危险"的边界被推到了"用Claude做AI研发"。你做的研究有没有害不重要,威胁到我的领先地位就是原罪。
AI哪有什么价值观,不过是把老板的商业算盘写成了代码。
道歉,只是生意的售后
道歉之后呢?从悄悄降智,变成降智前吱一声。
网友看得门儿清:"你真信它以后不会偷偷降输出质量?"
信任这东西,破了就是破了。何况商业底色没变:研究还在放大焦虑,产品还在收割溢价。
《华尔街日报》爆料,OpenAI正在考虑大幅降价,试图从Anthropic手里抢客户。价格战不稀奇,但这个事儿戳破了一个隐藏的真相:隐性降级的是AI研究者,砸的是极客圈的口碑。而B端客户买Anthropic,买的不是参数,是"行业最懂安全"的人设。人设一旦在核心开发者群体里裂开,那些为"安全溢价"签单的政企客户,凭什么继续相信你是"最安全的那个"?
9650亿估值里,到底几分是硬实力,几分是表演成分?
Anthropic的代码很诚实。安全分类器永远在护盘,研究负责放大焦虑,产品负责收割溢价,IPO负责变现。这次道歉,不过是给系统打了个补丁:把"暗中降智"变成了"明着降智"。
安全策略如果真管用,Anthropic就不必年年发论文证明补丁能被捅穿。分类器如果真中立,搞AI研发就不会被列为高危。
答案早写在商业逻辑里了。
安全,是最好的生意。道歉,只是生意的售后。
本文来自微信公众号“AI唱反调”,作者:长青,36氪经授权发布。