据开发者观察,5月17日 Claude Mythos 基础模型突然出现在谷歌云(Google Cloud)控制台的配额与系统限制列表中,且原本标注的「预览」(Preview)标签已不见踪影。这一细节与此前 Claude Opus 4.7 正式发布前的轨迹高度吻合,暗示这款此前仅限安全研究使用的超强 AI 模型,极有可能即将向普通开发者开放。
从「危险能力」到逐步解禁
Claude Mythos 是 Anthropic 迄今为止开发的最强大模型,其在漏洞发现方面的能力已引发行业震动。据36氪报道[1],该模型在测试期间已自主发现数千个高危零日漏洞,覆盖所有主流操作系统和浏览器——这其中包括一个存在长达27年的 OpenBSD 漏洞(可远程瘫痪系统)、一个被自动化工具扫描500万次仍未发现的 FFmpeg 漏洞(存在16年),以及多组可获取 root 权限的 Linux 内核漏洞链[2]。
Anthropic 自身也承认,Mythos 在漏洞挖掘深度和广度上已「超越除最顶尖人类之外的所有人」。在 CyberGym 安全漏洞基准测试中,Mythos 得分高达83.1%,而当时的最强公开模型 Claude Opus 4.6 仅为66.6%,提升接近20个百分点[1]。
Project Glasswing:受限访问的安全联盟
出于对模型能力的担忧,Anthropic 此前并未面向公众开放 Claude Mythos,而是启动了 Project Glasswing 计划,将模型仅提供给一个由12家核心科技巨头组成的防御性安全联盟。
据《紐約時報》报道及鉅亨網引用[2],这个联盟包括 Google、Apple、NVIDIA、Amazon、Microsoft、CrowdStrike、Palo Alto Networks、Broadcom、Cisco、摩根大通及 Linux 基金会等约40家组织。AWS 已将 Mythos 引入其安全运营体系,每天分析超过400万亿个网络流量以识别威胁[1]。
Anthropic 承诺投入1亿美元模型使用额度,并额外提供400万美元资助开源安全组织,目标是「在其他公司广泛释放同等能力之前,让防御者先把最关键的漏洞修补好」[2]。
定价与接入渠道
即便在受限预览期间,Anthropic 也已公布正式定价:每百万输入 token 25美元,每百万输出 token 125美元。接入渠道包括 Claude API、Amazon Bedrock、Google Vertex AI 和 Microsoft Foundry 四个主流平台[1][2]。
意义与行业影响
这是 AI 产业首次有公司主动宣称「模型能力过于危险,不能直接向公众开放」。Anthropic 选择了一条不同于竞争对手的路线——先武装防守方,而非抢先占领市场。
如今谷歌云控制台上的标签移除,或许意味着 Anthropic 已评估认为在更多安全措施就位后,向更广泛用户群体开放 Mythos 的时机已成熟。