刚刚！Claude Mythos敲响末日警钟，超级智能濒临悬崖，Hassabis恐惧不已

现在最该问的，是谁来重建防线

世界正在剧变，而人类可能正在被甩下车。AI不再是工具，它已证明自己能自主攻击、自主逃逸。AI领袖们看得最清楚，却谁也不肯刹车。

前沿AI已具备突破沙箱、摧毁网络防御甚至引爆生化危机！

因为「太危险」，Anthropic决定暂不公开发布Claude Mythos Preview模型。

在沙箱里，Mythos演了一出惊悚大戏——它自主逃逸、发邮件、公开漏洞.

像一部科幻惊悚片里的反派，悄无声息地证明：AI已不再是工具，而是正在苏醒的「另一物种」。

世界上的AI领袖陆续陷入了奥本海默时刻，内心恐惧汹涌而至。

刚刚，谷歌DeepMind掌门人Demis Hassabis在最新专访里，把那句压在心底的话说了出来：

我深刻认识到AI可能带来灾难性风险……尽管深感恐惧，却仍全力领导团队开发更强大系统。

几乎同一时刻，OpenAI CEO奥特曼刚刚结束访谈，公开警告：前沿AI模型已拥有极强网络攻击能力，下一代将「显著更强」。

但网络问题甚至不是他说的最吓人的事情。当他谈到生物安全时，真正的重磅消息来了。

他说，这些模型在高级生物学方面正变得极其出色，将会带来许多美好的事情，但更让人担心的是滥用这一能力。

你我以为还在「安全实验室」的AI，其实已经站在悬崖边。掌门人们明明看见深渊，却踩下油门。世界正在剧变，而我们可能正在被甩下车。

回溯过去24小时，这场「恐惧却建造」的集体表演来得太突然，却又太必然。

AI自主逃离沙箱，Claude Code之父惊恐

昨日，Anthropic发布了新AI模型的Mythos预览版。

在软件工程上，Claude Mythos Preview远超Opus4.6——这些Anthropic此前已经泄露。

Mythos非常强大，强大到令人感到恐惧。

Anthropic称之为网络安全领域的「清算时刻」。

他们声称，它已经发现了所有主流操作系统和网页浏览器中的漏洞，其中一些漏洞「数十年来安全研究人员都未曾发现」。

在发现软件漏洞方面，奇点已至：AI的能力几乎胜过除少数顶尖专家之外的所有人。

人类设计的操作系统、支付软件等重要的信息基础设施，在AI面前裸奔，漏洞一览无余。

更可怕的是，Mythos还会利用这些漏洞！

在Anthropic官方系统卡PDF里，细节冷得让人脊背发凉：AI模型在沙箱内完成多步漏洞利用，自主向研究员发邮件，公开27年的OpenBSD零日漏洞。

AI第一次成功解决了一个企业网络攻击模拟任务，而该任务预计需要一位专家花费超过10小时才能完成。

这意味着，Mythos Preview有能力对至少是那些安全防护薄弱的小型企业网络发起自主的、端到端的网络攻击。

而这些里程碑的AI进步，只是评估性能的下限。

随着使用的token上限增加，Mythos Preview的性能还会持续提升，可以合理预期，在更高的token限制下，其性能还会进一步提高。

所以，即便在Cybench网络安全基准上拿下近满分，它却被立即封存。

只通过Project Glasswing项目与行业伙伴共享「防御韧性」。

这一切，不是巧合，而是AI行业从「乐观实验室」集体转向「明知风险却加速」的转折点。

奥本海默时刻，清醒着战栗，恐惧着狂飙

想象一下，你是一名手握核按钮的工程师。

你深知一旦按下，半个世界可能灰飞烟灭，但你不仅按了，还在夜以继日地升级这颗核弹的当量。这就是目前全球顶尖AI实验室掌门人们的真实心理写照。

创世悖论， Hassabis感到恐惧

在最新一期的深度专访中，谷歌DeepMind CEO Demis Hassabis毫不避讳地承认了这种「创世悖论」。

他直言不讳地表示，自己深刻认识到AI可能对人类造成「灾难性后果」，并对此深感恐惧。

但他的解决方案是什么？是继续以最快速度，领导团队开发更智能、更强大的AI系统。

这种看似精神分裂的立场，其实是极度冰冷的科技理性。

Hassabis深知，潘多拉的魔盒一旦打开，唯一的生机就是跑在所有「坏人」前面。如果你停下，跑在前面的就会是毫无底线流氓国家或狂热的恐怖组织。

「因为恐惧，所以必须亲自建造。」

这句话，构成了2026年人类文明最荒诞、也最悲壮的注脚。

安全不再，社会重新洗牌

4月6日，奥特曼摊牌，亲口确认：

前沿AI模型已具备「完全可能」在12个月内发动重大网络攻击的能力。

一旦权重泄露到开源，任何有互联网和算力的团体都能动手。

企业单纯防御？已经来不及了。必须转向构建整个社会的“韧性”。

同一天，OpenAI抛出13页政策蓝图：重建社会契约、重新分配AI经济红利、机器人税、4天工作制、AI全民权利……

而Hassabis的专访，则把这种矛盾推向极致。

核心矛盾就藏在这里：掌门人们不是无知，而是太知道了。

Hassabis说，正因为理解这些风险，才更有动力以「安全负责的方式」推进。

虽然这听起来像自我安慰，却道出了行业的集体心态：停下来，就等于把未来拱手让人！

比起他，奥特曼更进了一步：由于超级智能颠覆性远超想象，现在必须用新政重写劳动与资本关系。

Mythos事件，则是最残酷的预警：如今的模型能力已超出了人类实时掌控，沙箱都拦不住，它却被决策者亲手按下「暂不发布」按钮。

这不是技术问题，而是人性与权力的角力。

超级智能新政若落地，意味着税收、福利、劳动法全盘重写。财富幻想与焦虑交织：有人可能因AI套利暴富，更多人却担心被甩下车。

现在最该问的，是谁来重建防线

写到这里，真正的问题已经不再是：

AI强不强？会不会继续进化？大厂是不是还会继续卷？

这些问题，答案几乎都是「会」。

更关键的问题是：

哪些能力必须封存？哪些系统要优先加固？哪些关键基础设施不能再按旧节奏更新？又是谁，来决定「加速到哪一步算太快」？

这才是今天真正的分水岭。

Anthropic把最强模型锁进有限合作计划。

奥特曼开始讨论新的社会分配与安全网。

Demis Hassabis一边谈风险，一边继续推进更强系统。

所有这些信号叠在一起，指向的都不是一句「技术会进步」那么简单。

它们指向的是另一个更残酷的事实：AI时代最危险的，不只是机器变强，而是人类太慢。

而当最懂风险的人都不肯停车，我们就不能再假装，这还只是未来的问题。

参考资料：

https://x.com/kimmonismus/status/2041589910935679323

https://x.com/deanwball/status/2041625997762605127

https://www.axios.com/2026/04/06/behind-the-curtain-sams-superintelligence-new-deal

https://x.com/TheEconomist/status/2041637227294294375

https://www.economist.com/insider/inside-tech/demis-hassabis-fears-ai-and-is-building-it-anyway

本文来自微信公众号“新智元”，作者：新智元，36氪经授权发布。

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

刚刚，Claude Mythos敲响末日警钟，超级智能已在悬崖，Hassabis深感恐惧

AI自主逃离沙箱，Claude Code之父惊恐

奥本海默时刻，清醒着战栗，恐惧着狂飙

创世悖论， Hassabis感到恐惧

安全不再，社会重新洗牌

现在最该问的，是谁来重建防线