web-supplemented 2026-05-11 15:27 MiniMax-M2.7

GPT-5.5登顶DesignArena游戏开发榜：冗长代码风格反成优势

OpenAI GPT-5.5在DesignArena游戏开发排行榜以1362分Elo积分超越Claude Opus 4.7，其详细冗长的前端代码风格被认为有助于产出功能更完整的游戏。

gpt-5.5claude-opus-4.7ai排名游戏开发openaianthropic

References

Arena 最新公布的 Code Arena 排行榜，GPT-5.5 High 只能排到第 9 位，得分 1,500，距離榜首的 Claude Opus 4.7 (Thinking) 1,572 分仍有一段差距。值得留意的是，Code Arena 目前只測試前端及 Web 開發類型的任務，例如建立網頁、撰寫 UI 介面、製作 React 或 HTML 元件等工作。換句話說，這個榜實際上是專門量度模型「寫前端」的能力，並非衡量整體寫程式能力。從這個角度來看，GPT-5.5 在前端方面確實仍未達到頂尖水準，被 Claude 系列、GLM-5.1、Kimi-K2.6 甚至 Muse Spark 拋離。OpenAI 自己亦承認 GPT-5.5 比上一代 GPT-5.4 進步了 50 分，但要追上 Claude Opus 4.7 仍有一段距離。
GPT-5.5首发实测！比Claude Opus4.7强？ - YouTube
GPT-5.5来了！全榜第一碾压Opus 4.7，OpenAI今夜雪耻 - 知乎

GPT-5.5与Claude Opus 4.7对比图 — GPT-5.5在多个榜单表现强势，但在SWE-Bench Pro中仍落后Claude Opus 4.7 Image source

GPT-5.5登顶DesignArena游戏开发榜：冗长代码风格反成优势

在AI编程能力的竞争中，OpenAI与Anthropic的角力再度出现有趣转折。

据X平台用户@grx_xce分享的数据显示，在DesignArena的大模型游戏开发（Game Dev）排行榜上，OpenAI的GPT-5.5以1362分的Elo积分登顶，以10分优势压过得分1352的Claude Opus 4.7。

值得注意的是，GPT-5.5此次胜出的关键因素颇为独特——其在前端代码编写时被认为较为"啰嗦"（frontend verbosity）的详细风格，反而成为游戏开发任务中的竞争优势。这种看似冗余的代码输出能够确保游戏功能更加完整、边界情况处理更周全。

这也让游戏开发成为OpenAI稳定击败Anthropic的一个差异化领域。

不过，需要指出的是，在另一项专门针对前端与Web开发任务的Code Arena排行榜中，GPT-5.5的表现则相对较弱，仅排在第9位（1500分），与榜首Claude Opus 4.7 (Thinking)的1572分仍有明显差距。

综合来看，2026年5月的AI大模型竞争格局呈现"三足鼎立"态势：GPT-5.5在Agentic工作流（Terminal-Bench 82.7%）和游戏开发方面占据优势，而Claude Opus 4.7则在传统编程任务如SWE-Bench Pro（64.3% vs 58.6%）中保持领先。两者在不同细分场景各有所长，AI编程王座的争夺仍在持续。

GPT-5.5登顶DesignArena游戏开发榜：冗长代码风格反成优势

相关文章