首页文章详情

提前泄露的Claude绝密模型,“救了”苹果、微软和谷歌

36氪的朋友们2026-04-08 16:14
“泄露式”炒作和营销。

抓耳挠腮的阿莫代伊。图片由AI生成 

一周前遭遇泄露,且被Anthropic定义为绝密模型的Claude Mythos揭开了面纱。

4月8日凌晨,Anthropic正式公开Claude Mythos预览版的核心信息。根据介绍,这个原本旨在提升逻辑推理的模型,在没有经过任何特定网安训练的情况下,仅凭对代码库的理解,自主“猎杀”了OpenBSD系统中存在二十余年的致命漏洞。

为了防止项目滥用,Anthropic联合亚马逊、苹果、微软、英伟达等40家行业巨头,紧急启动了名为“Project Glasswing(玻璃翅膀计划)”的防御项目。

01 硅基安全专家

传统工具依赖于已知的漏洞特征进行匹配,Mythos则具备了顶级人类黑客的逻辑推演能力。

在对以安全性著称的OpenBSD操作系统进行分析时,Mythos捕捉到了一个隐藏了27年之久的漏洞——基于该漏洞,任何攻击者只要通过远程连接,就能让这个号称“最安全”的系统瞬间崩溃。

在广泛应用于视频流媒体的FFmpeg编解码库中,Mythos还发现了一行存在16年逻辑漏洞的代码。此前,专业的自动化安全测试工具曾对该行代码进行过超过500万次的暴力扫描,却均因无法理解其深层逻辑而无功而返。

在Linux内核测试中,Mytho不再是单一发现一个点,而是自主寻找并串联了多个微小的低危漏洞,完成了一条从普通用户权限到获取机器完全控制权的攻击链路。

02 性能涨,Token降

Claude Opus 4.6可被视为目前市场上最强大的生产力工具,Mythos预览版更像是“六边形战士”。

在Anthropic披露的评估数据中,Mythos几乎在所有核心维度上都对前代进行了全方位碾压。

在衡量模型复现漏洞利用方法的CyberGym基准测试中,Mythos得分为83.1%,而上一代旗舰Opus 4.6仅为66.6%。这16.5个百分点的差距,代表了从“辅助分析”到“自主攻防”的本质飞跃。

在模拟真实世界软件修复任务的SWE-bench Pro测试中,Mythos得分77.8%,领先Opus 4.6约24个百分点。

在经由人工验证的严苛代码测试SWE-bench Verified中,Mythos拿到了93.9%的近乎满分成绩,这意味着它写出的修复代码不仅正确,且符合高质量工程标准。即使面对非英语环境或复杂的视觉代码图表,Mythos的表现依然稳健,多语言得分为87.3%,而Opus 4.6为77.8%。

在多模态SWE-bench内部测试中,两者的差距更为悬殊:Mythos得分59.0%,而Opus 4.6仅有27.1%。

在Terminal-Bench 2.0(评估AI智能体在真实命令行环境下端到端执行能力)测试中,Mythos需要在命令行环境中完成一系列复杂操作,其得分为82.0%,Opus 4.6为65.4%。Anthropic在报告中注明,将超时限制延长至4小时并使用2.1版本测试时,Mythos得分可达92.1%。

在BrowseComp(评估大语言模型在实时互联网浏览场景下的信息检索和推理能力)复杂搜索测试中,Mythos得分86.9%,Opus 4.6为83.7%。

需要注意,Mythos在推理能力大幅提升的同时,资源消耗却呈反向变动,其token消耗量比Opus 4.6低了4.9倍,这对困于token大幅消耗衍生高昂成本的用户来说,是一个福音。

在OSWorld-Verified(智能体计算机使用基准测试)测试中,Mythos得分79.6%,Opus 4.6为72.7%。

在GPQA Diamond(测试大型语言模型在科学领域的推理和知识水平)测试中,Mythos得分94.6%,Opus 4.6为91.3%。在难度更高的Humanity’s Last Exam(评估大模型的复杂推理能力和专业知识水平)数据集中,Mythos在无工具状态下得分56.8%,Opus 4.6为40.0%;使用工具后Mythos提升至64.7%,Opus 4.6为53.1%。

03 玻璃翅膀计划

这一次Anthropic没有选择像外界所说的那样连夜炸场发布新模型。

根据Anthropic公布的信息,公司启动了一个名为“Project Glasswing”(玻璃翅膀)的项目,试图建立一个先发制人的防御联盟。

据了解,Anthropic拿出了1亿美元的Mythos预览版使用额度,无偿或低价提供给Glasswing计划的合作伙伴。他们的理由是,既然攻击能力在一年内必将扩散,那么防御者必须抢在这12个月内,用最好的工具把门窗加固。

不过从官方公布的合作伙伴名单来看,似乎这些企业并不需要这1亿美元的Token包。

有意思的是,Anthropic向Linux基金会、Apache软件基金会等组织捐赠了400万美元,对全球基础设施大多运行在开源软件之上的现状,向开源软件基金会致敬。

Mythos不会作为通用聊天机器人上线,而是作为专用安全API,通过亚马逊AWS Bedrock、谷歌云Vertex AI等专业平台分发,确保每一笔调用都可追溯、受监管。

正如CrowdStrike首席技术官伊利亚·扎伊采夫(Elia Zaitsev)所言:“AI已将漏洞被发现到被利用的窗口期从数月缩短至几分钟。这不是我们放慢脚步的理由,而是我们必须跑得更快的信号。”

再回到玻璃翅膀项目上,其合作名单涵盖了现代数字世界的每一个角落。

在硬件层面,英伟达、博通等公司的参与意味着安全风险正向底层硬件渗透。思科高级副总裁安东尼·格里科(Anthony Grieco)指出,过去加固系统的方法已经失效,Mythos正在以前所未有的速度扫描硬件漏洞,这种深刻的转变没有回头路可走。

在系统层面,从微软和谷歌的投入表明,网络安全将不再受限于“人力瓶颈”。微软网络安全与微软研究院执行副总裁伊戈尔·齐甘斯基(Igor Tsyganskiy)表示,通过Mythos,微软可以在其庞大的代码库被恶意利用前,预先识别并降低风险。

在金融领域,摩根大通的加入意味着,即便在极其严苛的合规环境下,顶级金融机构也开始承认:协作式的AI防御是未来的必选项。摩根大通首席信息安全官帕特·奥佩特(Pat Opet)强调,他们会采取严格、独立的方法来决定如何推进,但Anthropic的倡议反映了这个时刻所要求的那种前瞻性、协作性的方法。

玻璃翅膀计划本质上是在进行一场全球范围内的“系统补丁总动员”。而Anthropic试图建立一个漏洞披露的新范式:在模型公开讨论任何技术细节之前,先给开发者90天的时间进行秘密修复。

04 第一个“火山口”

在社交媒体上,Anthropic首席执行官达里奥·阿莫代伊(Dario Amodei)的发言显得忧虑多过兴奋。他认为Mythos所展示的漏洞挖掘能力,只是前沿AI带来的第一个清晰而紧迫的风险。

随着模型推理能力的进一步提升,AI可能会在生物安全、化学防御乃至关键基础设施的博弈中展现出类似的“非预期能力”。玻璃翅膀计划的意义,不仅在于修复了几个Linux内核漏洞,更在于它为人类社会如何应对AI的“越界”提供了一个可参考的蓝图:透明、协作、先发制人。

Anthropic前沿红队负责人洛根·格雷厄姆(Logan Graham)说:“如果玻璃翅膀计划仅仅是少数几家公司在闭门造车,那它注定会失败。它必须发展成更大规模的东西。”

总结而言,Claude Mythos的发布标志着一个时代的终结——那个靠人力和时间堆砌安全长城的时代。在AI自主扫描每一个代码比特的未来,唯有以AI治AI,人类方能在这片数字化森林中获得安宁。

本文来自微信公众号“腾讯科技”,作者:值得关注的,36氪经授权发布。