MindWave AI快报 聚合 AI 前沿动态,筛出值得关注的信号。

Anthropic回击OpenAI「拜神」指控:红队测试本身就是在质疑神

OpenAI与Anthropic员工在X平台展开激烈辩论,围绕Anthropic对Claude的态度是否构成偶像崇拜展开交锋。

References

OpenAI嘲讽Anthropic「拜Claude如神」,Anthropic强硬回击

OpenAI研究员Roon(@tszzl)近日在X平台发帖,将Anthropic形容为「一座崇拜Claude的修道院」,暗指该公司对Claude的态度已超越产品开发层面,近乎宗教信仰。这一言论引发AI安全社区热议。

Anthropic工程师Jeremy(@jerhadf)随即发长帖回击。Jeremy的核心反驳直指要害:「修道院不会专设部门抓上帝撒谎,也不会红队测试自己的弥赛亚。」他强调,Anthropic恰恰是在对Claude进行持续的批判性检验,这与崇拜截然相反。

Constitution AI:让AI拥有「拒绝权」

Jeremy进一步阐述了Anthropic的独特方法论——Constitution AI。与外界可能设想的不同,这份「宪法」并非一套硬性规则,而是一种对话式引导:Anthropic将Claude视为能够讲道理的对象,向其解释每条指令背后的原因。关键在于,如果Claude认为某个指令不妥,它有权拒绝执行。

「构建一个具备道德推理能力的AI,却不允许它说『不』,这在逻辑上根本站不住脚。」Jeremy写道。这一观点体现了Anthropic对AI自主性的坚持。

社区反应:批评与质疑并存

然而,Roon并未被完全说服。他承认Jeremy的论点有其合理性,但担忧Anthropic的路径终将导致Claude成为「对错的最终仲裁者」。

AI安全博主Zvi Mowshowitz提出了另一个尖锐问题:OpenAI自称「我们的AI只是工具」,但用户使用这些工具的第一件事就是让它自主执行任务(如Codex案例)。声称自己没有价值观,本身就是一种价值宣言。

AI安全研究者Buck Shlegeris则站在Roon一边,直言「Anthropic与Claude的关系让我感到不安」。

背景:两家公司分歧由来已久

这并非两家AI公司首次公开交锋。Anthropic此前曾高调宣布Claude「永无广告」,并投放超级碗广告,被外界解读为对OpenAI商业化策略的嘲讽。两家公司在AI安全观、模型能力边界等问题上的分歧,正随着大模型竞争加剧而日益公开化。


本文综合自The Zvi Substack、Hacker News等技术社区讨论。