GPT-5.5登顶DesignArena游戏开发榜:冗长代码风格反成优势
在AI编程能力的竞争中,OpenAI与Anthropic的角力再度出现有趣转折。
据X平台用户@grx_xce分享的数据显示,在DesignArena的大模型游戏开发(Game Dev)排行榜上,OpenAI的GPT-5.5以1362分的Elo积分登顶,以10分优势压过得分1352的Claude Opus 4.7。
值得注意的是,GPT-5.5此次胜出的关键因素颇为独特——其在前端代码编写时被认为较为"啰嗦"(frontend verbosity)的详细风格,反而成为游戏开发任务中的竞争优势。这种看似冗余的代码输出能够确保游戏功能更加完整、边界情况处理更周全。
这也让游戏开发成为OpenAI稳定击败Anthropic的一个差异化领域。
不过,需要指出的是,在另一项专门针对前端与Web开发任务的Code Arena排行榜中,GPT-5.5的表现则相对较弱,仅排在第9位(1500分),与榜首Claude Opus 4.7 (Thinking)的1572分仍有明显差距。
综合来看,2026年5月的AI大模型竞争格局呈现"三足鼎立"态势:GPT-5.5在Agentic工作流(Terminal-Bench 82.7%)和游戏开发方面占据优势,而Claude Opus 4.7则在传统编程任务如SWE-Bench Pro(64.3% vs 58.6%)中保持领先。两者在不同细分场景各有所长,AI编程王座的争夺仍在持续。