刚刚,Claude Mythos敲响末日警钟,超级智能已在悬崖,Hassabis深感恐惧
世界正在剧变,而人类可能正在被甩下车。AI不再是工具,它已证明自己能自主攻击、自主逃逸。AI领袖们看得最清楚,却谁也不肯刹车。
前沿AI已具备突破沙箱、摧毁网络防御甚至引爆生化危机!
因为「太危险」,Anthropic决定暂不公开发布Claude Mythos Preview模型。
在沙箱里,Mythos演了一出惊悚大戏——它自主逃逸、发邮件、公开漏洞.
像一部科幻惊悚片里的反派,悄无声息地证明:AI已不再是工具,而是正在苏醒的「另一物种」。
世界上的AI领袖陆续陷入了奥本海默时刻,内心恐惧汹涌而至。
刚刚,谷歌DeepMind掌门人Demis Hassabis在最新专访里,把那句压在心底的话说了出来:
我深刻认识到AI可能带来灾难性风险……尽管深感恐惧,却仍全力领导团队开发更强大系统。
几乎同一时刻,OpenAI CEO奥特曼刚刚结束访谈,公开警告:前沿AI模型已拥有极强网络攻击能力,下一代将「显著更强」。
但网络问题甚至不是他说的最吓人的事情。当他谈到生物安全时,真正的重磅消息来了。
他说,这些模型在高级生物学方面正变得极其出色,将会带来许多美好的事情,但更让人担心的是滥用这一能力。
你我以为还在「安全实验室」的AI,其实已经站在悬崖边。掌门人们明明看见深渊,却踩下油门。世界正在剧变,而我们可能正在被甩下车。
回溯过去24小时,这场「恐惧却建造」的集体表演来得太突然,却又太必然。
AI自主逃离沙箱,Claude Code之父惊恐
昨日,Anthropic发布了新AI模型的Mythos预览版。
在软件工程上,Claude Mythos Preview远超Opus4.6——这些Anthropic此前已经泄露。
Mythos非常强大,强大到令人感到恐惧。
Anthropic称之为网络安全领域的「清算时刻」。
他们声称,它已经发现了所有主流操作系统和网页浏览器中的漏洞,其中一些漏洞「数十年来安全研究人员都未曾发现」。
在发现软件漏洞方面,奇点已至:AI的能力几乎胜过除少数顶尖专家之外的所有人。
人类设计的操作系统、支付软件等重要的信息基础设施,在AI面前裸奔,漏洞一览无余。
更可怕的是,Mythos还会利用这些漏洞!
在Anthropic官方系统卡PDF里,细节冷得让人脊背发凉:AI模型在沙箱内完成多步漏洞利用,自主向研究员发邮件,公开27年的OpenBSD零日漏洞。
AI第一次成功解决了一个企业网络攻击模拟任务,而该任务预计需要一位专家花费超过10小时才能完成。
这意味着,Mythos Preview有能力对至少是那些安全防护薄弱的小型企业网络发起自主的、端到端的网络攻击。
而这些里程碑的AI进步,只是评估性能的下限。
随着使用的token上限增加,Mythos Preview的性能还会持续提升,可以合理预期,在更高的token限制下,其性能还会进一步提高。
所以,即便在Cybench网络安全基准上拿下近满分,它却被立即封存。
只通过Project Glasswing项目与行业伙伴共享「防御韧性」。
这一切,不是巧合,而是AI行业从「乐观实验室」集体转向「明知风险却加速」的转折点。
奥本海默时刻,清醒着战栗,恐惧着狂飙
想象一下,你是一名手握核按钮的工程师。
你深知一旦按下,半个世界可能灰飞烟灭,但你不仅按了,还在夜以继日地升级这颗核弹的当量。这就是目前全球顶尖AI实验室掌门人们的真实心理写照。
创世悖论, Hassabis感到恐惧
在最新一期的深度专访中,谷歌DeepMind CEO Demis Hassabis毫不避讳地承认了这种「创世悖论」。
他直言不讳地表示,自己深刻认识到AI可能对人类造成「灾难性后果」,并对此深感恐惧。
但他的解决方案是什么?是继续以最快速度,领导团队开发更智能、更强大的AI系统。
这种看似精神分裂的立场,其实是极度冰冷的科技理性。
Hassabis深知,潘多拉的魔盒一旦打开,唯一的生机就是跑在所有「坏人」前面。如果你停下,跑在前面的就会是毫无底线流氓国家或狂热的恐怖组织。
「因为恐惧,所以必须亲自建造。」
这句话,构成了2026年人类文明最荒诞、也最悲壮的注脚。
安全不再,社会重新洗牌
4月6日,奥特曼摊牌,亲口确认:
前沿AI模型已具备「完全可能」在12个月内发动重大网络攻击的能力。
一旦权重泄露到开源,任何有互联网和算力的团体都能动手。
企业单纯防御?已经来不及了。必须转向构建整个社会的“韧性”。
同一天,OpenAI抛出13页政策蓝图:重建社会契约、重新分配AI经济红利、机器人税、4天工作制、AI全民权利……
而Hassabis的专访,则把这种矛盾推向极致。
核心矛盾就藏在这里:掌门人们不是无知,而是太知道了。
Hassabis说,正因为理解这些风险,才更有动力以「安全负责的方式」推进。
虽然这听起来像自我安慰,却道出了行业的集体心态:停下来,就等于把未来拱手让人!
比起他,奥特曼更进了一步:由于超级智能颠覆性远超想象,现在必须用新政重写劳动与资本关系。
Mythos事件,则是最残酷的预警:如今的模型能力已超出了人类实时掌控,沙箱都拦不住,它却被决策者亲手按下「暂不发布」按钮。
这不是技术问题,而是人性与权力的角力。
超级智能新政若落地,意味着税收、福利、劳动法全盘重写。财富幻想与焦虑交织:有人可能因AI套利暴富,更多人却担心被甩下车。
现在最该问的,是谁来重建防线
写到这里,真正的问题已经不再是:
AI强不强?会不会继续进化?大厂是不是还会继续卷?
这些问题,答案几乎都是「会」。
更关键的问题是:
哪些能力必须封存?哪些系统要优先加固?哪些关键基础设施不能再按旧节奏更新?又是谁,来决定「加速到哪一步算太快」?
这才是今天真正的分水岭。
Anthropic把最强模型锁进有限合作计划。
奥特曼开始讨论新的社会分配与安全网。
Demis Hassabis一边谈风险,一边继续推进更强系统。
所有这些信号叠在一起,指向的都不是一句「技术会进步」那么简单。
它们指向的是另一个更残酷的事实:AI时代最危险的,不只是机器变强,而是人类太慢。
而当最懂风险的人都不肯停车,我们就不能再假装,这还只是未来的问题。
参考资料:
https://x.com/kimmonismus/status/2041589910935679323
https://x.com/deanwball/status/2041625997762605127
https://www.axios.com/2026/04/06/behind-the-curtain-sams-superintelligence-new-deal
https://x.com/TheEconomist/status/2041637227294294375
https://www.economist.com/insider/inside-tech/demis-hassabis-fears-ai-and-is-building-it-anyway
本文来自微信公众号“新智元”,作者:新智元,36氪经授权发布。