Anthropic联合创始人杰克·克拉克(Jack Clark)日前在牛津大学发表演讲,就人工智能未来发展发出严厉警告。他指出,AI系统在2028年底前实现递归自我改进(recursive self-improvement)的概率高达60%,这意味着AI将具备无需人类干预、自主升级并制造更强版本的能力。
内部模型暴露安全隐忧
克拉克以Anthropic于2026年4月完成训练的内部模型Mythos为例,展示了AI失控风险的真实边界。Mythos具备国家级网络攻防武器的破坏力,因杀伤力过大,公司决定无限期禁止向公众公开发布,仅向极少数机构授权用于软件漏洞修复。克拉克坦言,团队在见证Mythos展示出惊人破坏力后极度震惊,意识到前沿模型到来的速度远超预期,安全响应工作存在严重漏洞。
技术演进速度令人"眩晕"
克拉克用"进展快到令人眩晕"形容当下AI演化速度,并强调这不是单一技术节点的变化,而是科研、商业、机器人和产业组织方式同步跃迁。他指出,在AI研发过程中,人类介入正不断减少,一旦研发速度超过人类理解和控制的能力边界,将对全球安全构成严峻挑战。
公司战略的两面性
值得注意的是,在伦敦举办的开发者大会上,Anthropic展现出与警示风险截然不同的商业姿态。伴随着高达9000亿美元的估值融资传闻,Claude Code创建者鲍里斯·切尔尼(Boris Cherny)在会上积极推广AI编程工具。当研究人员询问有多少开发者会在未经阅读校验的情况下直接部署Claude自动编写的代码时,现场大量开发者举手示意,凸显AI编程工具普及背后的安全隐患。
克拉克表示,当前全球多数人对技术自我进化速度仍选择否认,甚至Anthropic自身也严重低估了技术演进的规模,在面对前沿模型失控风险时准备不足。这一表态为整个AI行业敲响警钟,业界呼吁加强国际协作,建立更为完善的AI安全治理框架。