MindWave AI快报 聚合 AI 前沿动态,筛出值得关注的信号。

GPT-5.5登顶DesignArena游戏开发榜:冗长代码风格反成优势

OpenAI GPT-5.5在DesignArena游戏开发排行榜以1362分Elo积分超越Claude Opus 4.7,其详细冗长的前端代码风格被认为有助于产出功能更完整的游戏。

References

GPT-5.5与Claude Opus 4.7对比图
GPT-5.5在多个榜单表现强势,但在SWE-Bench Pro中仍落后Claude Opus 4.7 Image source

GPT-5.5登顶DesignArena游戏开发榜:冗长代码风格反成优势

在AI编程能力的竞争中,OpenAI与Anthropic的角力再度出现有趣转折。

据X平台用户@grx_xce分享的数据显示,在DesignArena的大模型游戏开发(Game Dev)排行榜上,OpenAI的GPT-5.5以1362分的Elo积分登顶,以10分优势压过得分1352的Claude Opus 4.7。

值得注意的是,GPT-5.5此次胜出的关键因素颇为独特——其在前端代码编写时被认为较为"啰嗦"(frontend verbosity)的详细风格,反而成为游戏开发任务中的竞争优势。这种看似冗余的代码输出能够确保游戏功能更加完整、边界情况处理更周全。

这也让游戏开发成为OpenAI稳定击败Anthropic的一个差异化领域

不过,需要指出的是,在另一项专门针对前端与Web开发任务的Code Arena排行榜中,GPT-5.5的表现则相对较弱,仅排在第9位(1500分),与榜首Claude Opus 4.7 (Thinking)的1572分仍有明显差距。

综合来看,2026年5月的AI大模型竞争格局呈现"三足鼎立"态势:GPT-5.5在Agentic工作流(Terminal-Bench 82.7%)和游戏开发方面占据优势,而Claude Opus 4.7则在传统编程任务如SWE-Bench Pro(64.3% vs 58.6%)中保持领先。两者在不同细分场景各有所长,AI编程王座的争夺仍在持续。