MindWave AI快报 聚合 AI 前沿动态,筛出值得关注的信号。

Anthropic 宣布封存 Mythos Preview:AI 网络攻防天才为何被「封印」

Anthropic 在 Project Glasswing 项目中宣布将最强漏洞挖掘模型 Claude Mythos Preview 无限期封存,仅向特定安全合作伙伴开放,以防止其强大攻击能力被恶意滥用。

References

Anthropic 宣布封存 Mythos Preview:AI 网络攻防天才为何被「封印」

在各大 AI 厂商竞相发布大模型、争夺 API 市场份额的背景下,Anthropic 做出了一个不同寻常的决定——将其最具网络攻防能力的前沿模型 Claude Mythos Preview 无限期封存,拒绝向公众和商业市场开放。

一款「强到不敢让人用」的模型

Anthropic 此次封存的 Mythos Preview 是其神話系列模型的预览版本。在专项网络安全基准测试 CyberGym 中,Mythos Preview 取得了 83.1% 的得分,远超前代模型 Claude Opus 4.6,展现出卓越的漏洞挖掘与网络攻防能力。

然而,正是这种「威力巨大」的能力,让 Anthropic 选择将其严格限制在 Project Glasswing 网络安全防御框架内,仅向约 40 家美英机构开放测试资格,包括亚马逊、苹果、微软、英伟达、摩根大通、谷歌、博通、思科等科技巨头,以及 Cloudflare、Mozilla、帕洛阿尔托网络等安全企业。

万漏洞发现与「修补过载」危机

在 Project Glasswing 项目的联合测试中,Anthropic 与合作伙伴在过去一个月内利用 Mythos Preview 在全球关键基础设施中扫描出超过 10,000 个高危或严重级别的零日漏洞。

以 Mozilla 的测试为例,利用 Mythos Preview 发现的 Firefox 漏洞数量达到此前使用 Claude Opus 时的十倍以上,帮助团队在短时间内修复了 271 个漏洞。但这也带来了一个前所未有的问题——「修补过载」。

英国 AI 安全研究所(UK AISI)评估指出,Mythos Preview 是全球首个端到端攻破其所有模拟网络攻防靶场的模型。这本应是安全团队的福音,却因「找漏洞仅需数秒,修补漏洞需要数周」的严重时间差,让部分开源项目维护者开始请求 Anthropic 减缓漏洞披露速度。

不对称防御策略

为了在模型被封存的「真空期」内缓解防御侧压力,Anthropic 采取了一套不对称的防御倾斜策略:

  • 定向工具共享:符合条件的安全团队可以申请代码地图、扫描子智能体编排套件与威胁建模工具的定向共享
  • Claude Security 助手:企业客户可部署基于 Claude Opus 4.7 的安全限制版助手,该工具在三周内已辅助企业修复超过 2,100 个漏洞
  • OpenSSF 合作:与 OpenSSF 的 Alpha-Omega 项目深度合作,为开源维护者提供漏洞分类与修补的财务和人力支持

Anthropic 还拿出了 1 亿美元的 Mythos 预览版使用额度,无偿或低价提供给 Glasswing 计划的合作伙伴。正如 36氪报道所述:「既然攻击能力在一年内必将扩散,那么防御必须更快到位。」