MindWave AI快报 聚合 AI 前沿动态,筛出值得关注的信号。

谷歌I/O 2026发布Gemini 3.5 Flash:轻量级模型速度超越旗舰4倍

谷歌在I/O 2026开发者大会上推出轻量旗舰模型Gemini 3.5 Flash,以每秒289个token的生成速度创下行业纪录,同时在编码和智能体基准测试中超越自家旗舰及竞品。

References

Gemini 3.5 Flash发布现场
谷歌在I/O 2026大会上发布Gemini 3.5 Flash Image source

轻量级模型重新定义「性价比」

在今日凌晨举行的Google I/O 2026开发者大会主题演讲中,谷歌CEO桑达尔·皮查伊(Sundar Pichai)正式发布轻量旗舰模型Gemini 3.5 Flash。这款定位「轻量级」的模型不仅在速度上大幅领先,更在多项关键基准测试中超越谷歌自家的前代旗舰Gemini 3.1 Pro,以及OpenAI的GPT-5.5和Anthropic的Claude Opus 4.7。

速度突破:289 tokens/秒

Gemini 3.5 Flash最大的亮点在于其极致的生成速度。根据第三方评测机构Artificial Analysis的实测数据,该模型生成速度达到289 tokens/秒,分别是GPT-5.5(71 tokens/s)和Claude Opus 4.7(67 tokens/s)的4倍以上,也达到前代中端模型Gemini 3.1 Pro(135 tokens/s)的2倍以上。

智能体能力全面超越

尽管主打速度,Gemini 3.5 Flash在智能体任务上的表现同样亮眼:

  • MCP Atlas测试:83.6%准确率,超越GPT-5.5(75.3%)和Claude Opus 4.7(79.1%)
  • Terminal-Bench 2.1编码测试:76.2%表现,击败Gemini 3.1 Pro(70.3%)和Claude Opus 4.7(66.1%)
  • GDPval-AA长期任务测试:1656分,较前代1314分显著提升

100万Token上下文与亲民定价

新模型支持100万token上下文窗口,可处理超长文档和复杂多轮对话。在定价方面,Gemini 3.5 Flash走亲民路线:

  • 输入:每百万token 1.50美元
  • 输出:每百万token 9.00美元

这一定价仅为竞品旗舰模型的数分之一。

全平台同步开放

Gemini 3.5 Flash现已面向三类用户全面开放:

  • 普通用户:Gemini网页应用、Google搜索AI模式
  • 开发者:Google AI Studio、Android Studio、Antigravity平台API
  • 企业用户:Google Agent Development Kit智能体平台

皮查伊在演讲中表示,定位更高端的Gemini 3.5 Pro将于下月发布,届时将为开发者和企业用户提供更强大的复杂推理能力。