MindWave AI快报 聚合 AI 前沿动态,筛出值得关注的信号。

Gemini 3.2 Flash曝光:推理成本仅GPT-5.5二十分之一,谷歌下周I/O剑指性价比王座

谷歌轻量级模型Gemini 3.2 Flash现身云端控制台,据悉编码与推理能力达GPT-5.5的92%,但成本仅为其二十分之一,延迟低于200毫秒,业内预计将在5月20日I/O大会正式发布。

References

Gemini 3.2 Flash曝光
Gemini 3.2 Flash被业内视为谷歌的刺客级产品,主打极致性价比 Image source

谷歌轻量模型Gemini 3.2 Flash现身云端控制台,剑指极致性价比

近日,Gemini 3.2 Flash 悄然出现在谷歌云控制台的模型筛选列表中,引发业内广泛关注。这个被冠以 "lite" 与 "live" 后缀的基础模型选项,显示谷歌正积极布局针对极低延迟实时交互场景的特化版本。

性能逼近GPT-5.5,成本仅二十分之一

据Abacus.AI首席执行官Bindu Reddy透露,Gemini 3.2 Flash在编码与推理任务上已能达到GPT-5.5的92%性能,而受益于蒸馏加稀疏化技术,其推理成本仅为后者的十五至二十分之一。这意味着用户可以以极低的成本获得接近旗舰级模型的体验。

更令人印象深刻的是,该模型的大多数查询延迟低于200毫秒,足以满足实时对话、翻译、内容分类等对延迟敏感的应用场景需求。

轻量级战略:谷歌的"刺客产品"

Gemini 3.2 Flash被业内视为谷歌的"刺客产品"——用极高的性价比切入市场,与OpenAI的GPT-5.5正面竞争。回顾此前发布的Gemini 3.1 Flash-Lite,其定位即为"速度最快、成本最低"的模型,针对高频、低延迟任务进行优化。3.2版本延续了这一策略,并在性能上进一步提升。

或于I/O大会正式发布

随着云端接口提前曝光,业内普遍预期这款主打极致性价比的轻量模型将在5月20日的谷歌I/O大会上正式发布。届时,谷歌有望进一步明确其在大模型推理市场的定位,为开发者和企业用户提供更具竞争力的选择。


参考消息:多家来源表明Gemini 3.2 Flash已在谷歌云平台出现,预计下周I/O大会正式发布,性能达GPT-5.5的92%但成本仅其1/20。