web-supplemented 2026-05-17 09:28 MiniMax-M2.7

Gemini 3.2 Flash曝光：推理成本仅GPT-5.5二十分之一，谷歌下周I/O剑指性价比王座

谷歌轻量级模型Gemini 3.2 Flash现身云端控制台，据悉编码与推理能力达GPT-5.5的92%，但成本仅为其二十分之一，延迟低于200毫秒，业内预计将在5月20日I/O大会正式发布。

googlegeminiai模型性价比google-ioopenaigpt-5.5

References

Gemini 3.2 Flash曝光 — Gemini 3.2 Flash被业内视为谷歌的刺客级产品，主打极致性价比 Image source

谷歌轻量模型Gemini 3.2 Flash现身云端控制台，剑指极致性价比

近日，Gemini 3.2 Flash 悄然出现在谷歌云控制台的模型筛选列表中，引发业内广泛关注。这个被冠以 "lite" 与 "live" 后缀的基础模型选项，显示谷歌正积极布局针对极低延迟实时交互场景的特化版本。

性能逼近GPT-5.5，成本仅二十分之一

据Abacus.AI首席执行官Bindu Reddy透露，Gemini 3.2 Flash在编码与推理任务上已能达到GPT-5.5的92%性能，而受益于蒸馏加稀疏化技术，其推理成本仅为后者的十五至二十分之一。这意味着用户可以以极低的成本获得接近旗舰级模型的体验。

更令人印象深刻的是，该模型的大多数查询延迟低于200毫秒，足以满足实时对话、翻译、内容分类等对延迟敏感的应用场景需求。

轻量级战略：谷歌的"刺客产品"

Gemini 3.2 Flash被业内视为谷歌的"刺客产品"——用极高的性价比切入市场，与OpenAI的GPT-5.5正面竞争。回顾此前发布的Gemini 3.1 Flash-Lite，其定位即为"速度最快、成本最低"的模型，针对高频、低延迟任务进行优化。3.2版本延续了这一策略，并在性能上进一步提升。

或于I/O大会正式发布

随着云端接口提前曝光，业内普遍预期这款主打极致性价比的轻量模型将在5月20日的谷歌I/O大会上正式发布。届时，谷歌有望进一步明确其在大模型推理市场的定位，为开发者和企业用户提供更具竞争力的选择。

参考消息：多家来源表明Gemini 3.2 Flash已在谷歌云平台出现，预计下周I/O大会正式发布，性能达GPT-5.5的92%但成本仅其1/20。

谷歌轻量模型Gemini 3.2 Flash现身云端控制台，剑指极致性价比

性能逼近GPT-5.5，成本仅二十分之一

轻量级战略：谷歌的"刺客产品"

或于I/O大会正式发布

相关文章