web-supplemented 2026-05-20 08:23 MiniMax-M2.7

谷歌I/O 2026发布Gemini 3.5 Flash：轻量级模型速度超越旗舰4倍

谷歌在I/O 2026开发者大会上推出轻量旗舰模型Gemini 3.5 Flash，以每秒289个token的生成速度创下行业纪录，同时在编码和智能体基准测试中超越自家旗舰及竞品。

谷歌Gemini人工智能大模型I/O 2026benchmark速度测试

References

Gemini 3.5 Flash发布现场 — 谷歌在I/O 2026大会上发布Gemini 3.5 Flash Image source

轻量级模型重新定义「性价比」

在今日凌晨举行的Google I/O 2026开发者大会主题演讲中，谷歌CEO桑达尔·皮查伊（Sundar Pichai）正式发布轻量旗舰模型Gemini 3.5 Flash。这款定位「轻量级」的模型不仅在速度上大幅领先，更在多项关键基准测试中超越谷歌自家的前代旗舰Gemini 3.1 Pro，以及OpenAI的GPT-5.5和Anthropic的Claude Opus 4.7。

速度突破：289 tokens/秒

Gemini 3.5 Flash最大的亮点在于其极致的生成速度。根据第三方评测机构Artificial Analysis的实测数据，该模型生成速度达到289 tokens/秒，分别是GPT-5.5（71 tokens/s）和Claude Opus 4.7（67 tokens/s）的4倍以上，也达到前代中端模型Gemini 3.1 Pro（135 tokens/s）的2倍以上。

智能体能力全面超越

尽管主打速度，Gemini 3.5 Flash在智能体任务上的表现同样亮眼：

MCP Atlas测试：83.6%准确率，超越GPT-5.5（75.3%）和Claude Opus 4.7（79.1%）
Terminal-Bench 2.1编码测试：76.2%表现，击败Gemini 3.1 Pro（70.3%）和Claude Opus 4.7（66.1%）
GDPval-AA长期任务测试：1656分，较前代1314分显著提升

100万Token上下文与亲民定价

新模型支持100万token上下文窗口，可处理超长文档和复杂多轮对话。在定价方面，Gemini 3.5 Flash走亲民路线：

输入：每百万token 1.50美元
输出：每百万token 9.00美元

这一定价仅为竞品旗舰模型的数分之一。

全平台同步开放

Gemini 3.5 Flash现已面向三类用户全面开放：

普通用户：Gemini网页应用、Google搜索AI模式
开发者：Google AI Studio、Android Studio、Antigravity平台API
企业用户：Google Agent Development Kit智能体平台

皮查伊在演讲中表示，定位更高端的Gemini 3.5 Pro将于下月发布，届时将为开发者和企业用户提供更强大的复杂推理能力。

轻量级模型重新定义「性价比」

速度突破：289 tokens/秒

智能体能力全面超越

100万Token上下文与亲民定价

全平台同步开放

相关文章