轻量级模型重新定义「性价比」
在今日凌晨举行的Google I/O 2026开发者大会主题演讲中,谷歌CEO桑达尔·皮查伊(Sundar Pichai)正式发布轻量旗舰模型Gemini 3.5 Flash。这款定位「轻量级」的模型不仅在速度上大幅领先,更在多项关键基准测试中超越谷歌自家的前代旗舰Gemini 3.1 Pro,以及OpenAI的GPT-5.5和Anthropic的Claude Opus 4.7。
速度突破:289 tokens/秒
Gemini 3.5 Flash最大的亮点在于其极致的生成速度。根据第三方评测机构Artificial Analysis的实测数据,该模型生成速度达到289 tokens/秒,分别是GPT-5.5(71 tokens/s)和Claude Opus 4.7(67 tokens/s)的4倍以上,也达到前代中端模型Gemini 3.1 Pro(135 tokens/s)的2倍以上。
智能体能力全面超越
尽管主打速度,Gemini 3.5 Flash在智能体任务上的表现同样亮眼:
- MCP Atlas测试:83.6%准确率,超越GPT-5.5(75.3%)和Claude Opus 4.7(79.1%)
- Terminal-Bench 2.1编码测试:76.2%表现,击败Gemini 3.1 Pro(70.3%)和Claude Opus 4.7(66.1%)
- GDPval-AA长期任务测试:1656分,较前代1314分显著提升
100万Token上下文与亲民定价
新模型支持100万token上下文窗口,可处理超长文档和复杂多轮对话。在定价方面,Gemini 3.5 Flash走亲民路线:
- 输入:每百万token 1.50美元
- 输出:每百万token 9.00美元
这一定价仅为竞品旗舰模型的数分之一。
全平台同步开放
Gemini 3.5 Flash现已面向三类用户全面开放:
- 普通用户:Gemini网页应用、Google搜索AI模式
- 开发者:Google AI Studio、Android Studio、Antigravity平台API
- 企业用户:Google Agent Development Kit智能体平台
皮查伊在演讲中表示,定位更高端的Gemini 3.5 Pro将于下月发布,届时将为开发者和企业用户提供更强大的复杂推理能力。