web-supplemented 2026-06-04 07:56 MiniMax-M2.7

Google推出Gemma 4 12B模型，剑指16GB内存笔记本本地部署

谷歌发布Gemma 4系列首个新增规格12B版本，采用无编码器多模态架构，支持在16GB内存笔记本上运行多模态Agent应用，并新增OpenAI API兼容模式。

gemma 4google开源模型本地部署多模态ai agent

References

Google于6月3日正式推出Gemma 4 12B，这是该开源模型家族自今年4月发布以来的首个新增规格。不同于此前针对超轻量端侧的E2B、E4B以及面向高性能推理的31B、26B-A4B，新版本定位于消费级电脑本地运行场景，主打在16GB内存级别的笔记本电脑上部署多模态Agent应用。

Gemma 4 12B采用统一无编码器（encoder-free）多模态架构，支持文本与图像输入。该模型基于Google Gemini 3的研究和技术体系构建，延续Apache 2.0开源许可证，使其成为完全开放版本。据此前iThome报道，Gemma 4整个家族具备256K超长上下文窗口，原生支持140多种语言，并能处理视频和图像识别任务。

为提升本地部署体验，Google同步升级了LiteRT-LM本地推理工具，新增OpenAI API兼容服务模式。开发者可直接将Continue、Aider、Open WebUI等主流开发工具连接到本地运行的Gemma 4 12B，无需依赖云端模型即可完成编程辅助、任务规划等Agent工作流程。

此次并非Gemma 4的换代更新，而是产品线的精细化补充。随着12B版本的加入，Gemma 4家族现已覆盖从2B到31B的参数区间。谷歌表示，相比继续追求更大参数规模，此次更关注如何让具备Agent能力的多模态模型在普通消费级硬件上稳定运行，推动本地AI应用的普及。

Gemma 4 12B已在Hugging Face、Ollama、LM Studio等多个平台同步上线，支持NVIDIA GPU、AMD ROCm以及Google TPU等多种硬件平台。

相关文章