web-supplemented 2026-05-24 10:52 MiniMax-M2.7

Anthropic联合创始人警告：AI或于2028年底进入自我迭代阶段

Anthropic联合创始人杰克·克拉克在牛津大学演讲中表示，AI在2028年底前实现递归自我改进的概率达60%，并透露公司内部模型Mythos已具备国家级网络攻防能力，因风险过高未向公众发布。

人工智能anthropicai安全自我迭代递归改进jack-clarkmythos

References

Anthropic联合创始人杰克·克拉克（Jack Clark）日前在牛津大学发表演讲，就人工智能未来发展发出严厉警告。他指出，AI系统在2028年底前实现递归自我改进（recursive self-improvement）的概率高达60%，这意味着AI将具备无需人类干预、自主升级并制造更强版本的能力。

内部模型暴露安全隐忧

克拉克以Anthropic于2026年4月完成训练的内部模型Mythos为例，展示了AI失控风险的真实边界。Mythos具备国家级网络攻防武器的破坏力，因杀伤力过大，公司决定无限期禁止向公众公开发布，仅向极少数机构授权用于软件漏洞修复。克拉克坦言，团队在见证Mythos展示出惊人破坏力后极度震惊，意识到前沿模型到来的速度远超预期，安全响应工作存在严重漏洞。

技术演进速度令人"眩晕"

克拉克用"进展快到令人眩晕"形容当下AI演化速度，并强调这不是单一技术节点的变化，而是科研、商业、机器人和产业组织方式同步跃迁。他指出，在AI研发过程中，人类介入正不断减少，一旦研发速度超过人类理解和控制的能力边界，将对全球安全构成严峻挑战。

公司战略的两面性

值得注意的是，在伦敦举办的开发者大会上，Anthropic展现出与警示风险截然不同的商业姿态。伴随着高达9000亿美元的估值融资传闻，Claude Code创建者鲍里斯·切尔尼（Boris Cherny）在会上积极推广AI编程工具。当研究人员询问有多少开发者会在未经阅读校验的情况下直接部署Claude自动编写的代码时，现场大量开发者举手示意，凸显AI编程工具普及背后的安全隐患。

克拉克表示，当前全球多数人对技术自我进化速度仍选择否认，甚至Anthropic自身也严重低估了技术演进的规模，在面对前沿模型失控风险时准备不足。这一表态为整个AI行业敲响警钟，业界呼吁加强国际协作，建立更为完善的AI安全治理框架。

内部模型暴露安全隐忧

技术演进速度令人"眩晕"

公司战略的两面性

相关文章