web-supplemented 2026-05-07 17:44 MiniMax-M2.7

Anthropic回击OpenAI「拜神」指控：红队测试本身就是在质疑神

OpenAI与Anthropic员工在X平台展开激烈辩论，围绕Anthropic对Claude的态度是否构成偶像崇拜展开交锋。

anthropicopenaiclaudeai安全twitter辩论constitution ai

References

OpenAI嘲讽Anthropic「拜Claude如神」，Anthropic强硬回击

OpenAI研究员Roon（@tszzl）近日在X平台发帖，将Anthropic形容为「一座崇拜Claude的修道院」，暗指该公司对Claude的态度已超越产品开发层面，近乎宗教信仰。这一言论引发AI安全社区热议。

Anthropic工程师Jeremy（@jerhadf）随即发长帖回击。Jeremy的核心反驳直指要害：「修道院不会专设部门抓上帝撒谎，也不会红队测试自己的弥赛亚。」他强调，Anthropic恰恰是在对Claude进行持续的批判性检验，这与崇拜截然相反。

Constitution AI：让AI拥有「拒绝权」

Jeremy进一步阐述了Anthropic的独特方法论——Constitution AI。与外界可能设想的不同，这份「宪法」并非一套硬性规则，而是一种对话式引导：Anthropic将Claude视为能够讲道理的对象，向其解释每条指令背后的原因。关键在于，如果Claude认为某个指令不妥，它有权拒绝执行。

「构建一个具备道德推理能力的AI，却不允许它说『不』，这在逻辑上根本站不住脚。」Jeremy写道。这一观点体现了Anthropic对AI自主性的坚持。

社区反应：批评与质疑并存

然而，Roon并未被完全说服。他承认Jeremy的论点有其合理性，但担忧Anthropic的路径终将导致Claude成为「对错的最终仲裁者」。

AI安全博主Zvi Mowshowitz提出了另一个尖锐问题：OpenAI自称「我们的AI只是工具」，但用户使用这些工具的第一件事就是让它自主执行任务（如Codex案例）。声称自己没有价值观，本身就是一种价值宣言。

AI安全研究者Buck Shlegeris则站在Roon一边，直言「Anthropic与Claude的关系让我感到不安」。

背景：两家公司分歧由来已久

这并非两家AI公司首次公开交锋。Anthropic此前曾高调宣布Claude「永无广告」，并投放超级碗广告，被外界解读为对OpenAI商业化策略的嘲讽。两家公司在AI安全观、模型能力边界等问题上的分歧，正随着大模型竞争加剧而日益公开化。

本文综合自The Zvi Substack、Hacker News等技术社区讨论。

OpenAI嘲讽Anthropic「拜Claude如神」，Anthropic强硬回击

Constitution AI：让AI拥有「拒绝权」

社区反应：批评与质疑并存

背景：两家公司分歧由来已久

相关文章