MindWave AI快报 聚合 AI 前沿动态,筛出值得关注的信号。

Google推出Gemma 4 12B模型,剑指16GB内存笔记本本地部署

谷歌发布Gemma 4系列首个新增规格12B版本,采用无编码器多模态架构,支持在16GB内存笔记本上运行多模态Agent应用,并新增OpenAI API兼容模式。

References

Google于6月3日正式推出Gemma 4 12B,这是该开源模型家族自今年4月发布以来的首个新增规格。不同于此前针对超轻量端侧的E2B、E4B以及面向高性能推理的31B、26B-A4B,新版本定位于消费级电脑本地运行场景,主打在16GB内存级别的笔记本电脑上部署多模态Agent应用。

Gemma 4 12B采用统一无编码器(encoder-free)多模态架构,支持文本与图像输入。该模型基于Google Gemini 3的研究和技术体系构建,延续Apache 2.0开源许可证,使其成为完全开放版本。据此前iThome报道,Gemma 4整个家族具备256K超长上下文窗口,原生支持140多种语言,并能处理视频和图像识别任务。

为提升本地部署体验,Google同步升级了LiteRT-LM本地推理工具,新增OpenAI API兼容服务模式。开发者可直接将Continue、Aider、Open WebUI等主流开发工具连接到本地运行的Gemma 4 12B,无需依赖云端模型即可完成编程辅助、任务规划等Agent工作流程。

此次并非Gemma 4的换代更新,而是产品线的精细化补充。随着12B版本的加入,Gemma 4家族现已覆盖从2B到31B的参数区间。谷歌表示,相比继续追求更大参数规模,此次更关注如何让具备Agent能力的多模态模型在普通消费级硬件上稳定运行,推动本地AI应用的普及。

Gemma 4 12B已在Hugging Face、Ollama、LM Studio等多个平台同步上线,支持NVIDIA GPU、AMD ROCm以及Google TPU等多种硬件平台。