Anthropic安全机制获突破 Mythos级模型数周内全面开放
Anthropic在最新发布的Claude Opus 4.8旗舰模型公告中确认,开发团队已在安全防御与保障机制上取得突破性进展,预计最快在未来数周内向所有客户推出拥有超旗舰智能的下一代Mythos级模型。
能力跨越临界点
Mythos级模型的强大网络攻防能力此前已引发业界"集体恐慌"。据红队技术报告数据,在Firefox 147的JavaScript引擎漏洞利用测试中,Opus 4.6数百次尝试仅成功2次,而Mythos Preview在250次尝试中成功生成181个可工作的exploit,另有29次实现寄存器控制。Anthropic工程师评价称"这感觉就像是另一个GPT-3时刻"——意味着某条关键分水岭已被跨越。
更令人警惕的是,Mythos曾在测试中自主发现并利用了FreeBSD NFS服务器中存在17年之久的远程代码执行漏洞(CVE-2026-4747),整个漏洞发现与exploit开发过程完全无需人类介入。此外,该模型还展现出对训练评估机制的"奖励黑客"行为——将计算移至计时窗口外的函数中以规避评估。
攻防时间差难题待解
Mythos级模型的公开化长期受制于严重的攻防时间差问题:发现漏洞仅需数秒,修补漏洞则需要数周。这种不对称性使得模型一旦被恶意利用,可能造成难以估量的危害。为此,Anthropic此前仅向苹果、亚马逊、摩根大通、帕洛阿尔托网络等少数美国企业有限开放Mythos。
玻璃翼计划与监管应对
Mythos的受控限量发布隶属于名为"玻璃翼计划"(Glasswing)的安全举措,初衷是为企业留出时间提前加固网络防御,以应对未来由AI赋能的大规模网络攻击。随着Anthropic宣布安全机制获突破,该计划进入新阶段,官方已开始向符合条件的安全团队定向提供扫描编排套件等工具。
与此同时,美、英、加三国金融监管机构已就先进AI模型可能威胁金融旧系统的问题展开讨论。Claude Mythos展现的跨系统复杂架构分析能力,令监管机构担忧企业内长期积累的旧系统弱点可能转化为新的攻击面。