提前泄露的Claude绝密模型：“拯救”苹果、微软与谷歌！

“泄露式”炒作和营销。

抓耳挠腮的阿莫代伊。图片由AI生成

一周前遭遇泄露，且被Anthropic定义为绝密模型的Claude Mythos揭开了面纱。

4月8日凌晨，Anthropic正式公开Claude Mythos预览版的核心信息。根据介绍，这个原本旨在提升逻辑推理的模型，在没有经过任何特定网安训练的情况下，仅凭对代码库的理解，自主“猎杀”了OpenBSD系统中存在二十余年的致命漏洞。

为了防止项目滥用，Anthropic联合亚马逊、苹果、微软、英伟达等40家行业巨头，紧急启动了名为“Project Glasswing（玻璃翅膀计划）”的防御项目。

01 硅基安全专家

传统工具依赖于已知的漏洞特征进行匹配，Mythos则具备了顶级人类黑客的逻辑推演能力。

在对以安全性著称的OpenBSD操作系统进行分析时，Mythos捕捉到了一个隐藏了27年之久的漏洞——基于该漏洞，任何攻击者只要通过远程连接，就能让这个号称“最安全”的系统瞬间崩溃。

在广泛应用于视频流媒体的FFmpeg编解码库中，Mythos还发现了一行存在16年逻辑漏洞的代码。此前，专业的自动化安全测试工具曾对该行代码进行过超过500万次的暴力扫描，却均因无法理解其深层逻辑而无功而返。

在Linux内核测试中，Mytho不再是单一发现一个点，而是自主寻找并串联了多个微小的低危漏洞，完成了一条从普通用户权限到获取机器完全控制权的攻击链路。

02 性能涨，Token降

Claude Opus 4.6可被视为目前市场上最强大的生产力工具，Mythos预览版更像是“六边形战士”。

在Anthropic披露的评估数据中，Mythos几乎在所有核心维度上都对前代进行了全方位碾压。

在衡量模型复现漏洞利用方法的CyberGym基准测试中，Mythos得分为83.1%，而上一代旗舰Opus 4.6仅为66.6%。这16.5个百分点的差距，代表了从“辅助分析”到“自主攻防”的本质飞跃。

在模拟真实世界软件修复任务的SWE-bench Pro测试中，Mythos得分77.8%，领先Opus 4.6约24个百分点。

在经由人工验证的严苛代码测试SWE-bench Verified中，Mythos拿到了93.9%的近乎满分成绩，这意味着它写出的修复代码不仅正确，且符合高质量工程标准。即使面对非英语环境或复杂的视觉代码图表，Mythos的表现依然稳健，多语言得分为87.3%，而Opus 4.6为77.8%。

在多模态SWE-bench内部测试中，两者的差距更为悬殊：Mythos得分59.0%，而Opus 4.6仅有27.1%。

在Terminal-Bench 2.0（评估AI智能体在真实命令行环境下端到端执行能力）测试中，Mythos需要在命令行环境中完成一系列复杂操作，其得分为82.0%，Opus 4.6为65.4%。Anthropic在报告中注明，将超时限制延长至4小时并使用2.1版本测试时，Mythos得分可达92.1%。

在BrowseComp（评估大语言模型在实时互联网浏览场景下的信息检索和推理能力）复杂搜索测试中，Mythos得分86.9%，Opus 4.6为83.7%。

需要注意，Mythos在推理能力大幅提升的同时，资源消耗却呈反向变动，其token消耗量比Opus 4.6低了4.9倍，这对困于token大幅消耗衍生高昂成本的用户来说，是一个福音。

在OSWorld-Verified（智能体计算机使用基准测试）测试中，Mythos得分79.6%，Opus 4.6为72.7%。

在GPQA Diamond（测试大型语言模型在科学领域的推理和知识水平）测试中，Mythos得分94.6%，Opus 4.6为91.3%。在难度更高的Humanity’s Last Exam（评估大模型的复杂推理能力和专业知识水平）数据集中，Mythos在无工具状态下得分56.8%，Opus 4.6为40.0%；使用工具后Mythos提升至64.7%，Opus 4.6为53.1%。

03 玻璃翅膀计划

这一次Anthropic没有选择像外界所说的那样连夜炸场发布新模型。

根据Anthropic公布的信息，公司启动了一个名为“Project Glasswing”（玻璃翅膀）的项目，试图建立一个先发制人的防御联盟。

据了解，Anthropic拿出了1亿美元的Mythos预览版使用额度，无偿或低价提供给Glasswing计划的合作伙伴。他们的理由是，既然攻击能力在一年内必将扩散，那么防御者必须抢在这12个月内，用最好的工具把门窗加固。

不过从官方公布的合作伙伴名单来看，似乎这些企业并不需要这1亿美元的Token包。

有意思的是，Anthropic向Linux基金会、Apache软件基金会等组织捐赠了400万美元，对全球基础设施大多运行在开源软件之上的现状，向开源软件基金会致敬。

Mythos不会作为通用聊天机器人上线，而是作为专用安全API，通过亚马逊AWS Bedrock、谷歌云Vertex AI等专业平台分发，确保每一笔调用都可追溯、受监管。

正如CrowdStrike首席技术官伊利亚·扎伊采夫（Elia Zaitsev）所言：“AI已将漏洞被发现到被利用的窗口期从数月缩短至几分钟。这不是我们放慢脚步的理由，而是我们必须跑得更快的信号。”

再回到玻璃翅膀项目上，其合作名单涵盖了现代数字世界的每一个角落。

在硬件层面，英伟达、博通等公司的参与意味着安全风险正向底层硬件渗透。思科高级副总裁安东尼·格里科（Anthony Grieco）指出，过去加固系统的方法已经失效，Mythos正在以前所未有的速度扫描硬件漏洞，这种深刻的转变没有回头路可走。

在系统层面，从微软和谷歌的投入表明，网络安全将不再受限于“人力瓶颈”。微软网络安全与微软研究院执行副总裁伊戈尔·齐甘斯基（Igor Tsyganskiy）表示，通过Mythos，微软可以在其庞大的代码库被恶意利用前，预先识别并降低风险。

在金融领域，摩根大通的加入意味着，即便在极其严苛的合规环境下，顶级金融机构也开始承认：协作式的AI防御是未来的必选项。摩根大通首席信息安全官帕特·奥佩特（Pat Opet）强调，他们会采取严格、独立的方法来决定如何推进，但Anthropic的倡议反映了这个时刻所要求的那种前瞻性、协作性的方法。

玻璃翅膀计划本质上是在进行一场全球范围内的“系统补丁总动员”。而Anthropic试图建立一个漏洞披露的新范式：在模型公开讨论任何技术细节之前，先给开发者90天的时间进行秘密修复。

04 第一个“火山口”

在社交媒体上，Anthropic首席执行官达里奥·阿莫代伊（Dario Amodei）的发言显得忧虑多过兴奋。他认为Mythos所展示的漏洞挖掘能力，只是前沿AI带来的第一个清晰而紧迫的风险。

随着模型推理能力的进一步提升，AI可能会在生物安全、化学防御乃至关键基础设施的博弈中展现出类似的“非预期能力”。玻璃翅膀计划的意义，不仅在于修复了几个Linux内核漏洞，更在于它为人类社会如何应对AI的“越界”提供了一个可参考的蓝图：透明、协作、先发制人。

Anthropic前沿红队负责人洛根·格雷厄姆（Logan Graham）说：“如果玻璃翅膀计划仅仅是少数几家公司在闭门造车，那它注定会失败。它必须发展成更大规模的东西。”

总结而言，Claude Mythos的发布标志着一个时代的终结——那个靠人力和时间堆砌安全长城的时代。在AI自主扫描每一个代码比特的未来，唯有以AI治AI，人类方能在这片数字化森林中获得安宁。

本文来自微信公众号“腾讯科技”，作者：值得关注的，36氪经授权发布。

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

提前泄露的Claude绝密模型，“救了”苹果、微软和谷歌

01 硅基安全专家

02 性能涨，Token降

03 玻璃翅膀计划

04 第一个“火山口”