MindWave AI快报 聚合 AI 前沿动态,筛出值得关注的信号。

Meta发布Muse Spark大模型:子智能体并行+多模态感知,直指个性化超级智能

Meta正式推出Muse Spark多模态推理模型,由新成立的Meta Superintelligence Labs从零打造,初期仅在美国上线,支持WhatsApp、Instagram、Facebook等核心产品及智能眼镜。

References

Meta Muse Spark模型发布
Meta推出全新Muse系列首代模型Muse Spark Image source

Meta于今年4月正式发布全新AI模型Muse Spark,这是Meta Superintelligence Labs自成立以来交出的首份成绩单,也标志着Meta AI战略从早期的开源社群导向正式升级为产品驱动模式。

从Llama到Muse:Meta AI战略转型

Muse Spark定位为原生多模态推理模型,支持工具调用、视觉思维链和多智能体编排(Multi-Agent Orchestration)。与此前侧重开源的Llama系列不同,Muse Spark初期采用封闭策略,仅在美国通过Meta AI应用及网站以「私人预览」形式上线,合作伙伴需获邀请才能率先体验。

值得关注的是,Meta去年高薪聘请前Scale AI首席执行官Alexandr Wang组建超级智能团队,并斥资从零重建AI技术架构,投入规模之大被业内视为一场豪赌——Llama 4早期表现曾令市场失望,Meta急需一款旗舰模型重振其在AI领域的竞争力。

子智能体并行:AI从单线到多线程

Muse Spark引入的**「深思模式」(Contemplating Mode)**是本次升级的核心亮点。该模式允许系统同时调度多个子智能体分头执行任务,例如用户规划旅行时,一个Agent排行程、一个对比目的地优劣、第三个搜索适合儿童的活动,最终汇总结果——这种并行处理机制可大幅缩短复杂任务的等待时间。

多模态感知与智能眼镜深度整合

在交互层面,Muse Spark为Meta补全了实时多模态感知能力。用户可通过手机镜头或Ray-Ban Meta、Oakley Meta智能眼镜,一边注视现实世界一边用自然语音向AI提问,并可随时打断或切换语言。模型能直接读取环境信息,例如扫描机场货架找出蛋白质含量最高的零食,或帮助解读医疗图表。

此外,Muse Spark还支持视觉代码生成,用户只需一句话提示即可生成定制化网页或小游戏。

独立评估:接近头部但编程仍存差距

独立评测显示,Muse Spark在语言理解与视觉推理方面已接近Google、OpenAI、Anthropic等市场领导者水平,但在编程与抽象推理能力上仍有差距,整体排名并列第四。Meta在官方博客中坦言:「这款初始模型追求体积小、速度快,但仍具备推理科学、数学和健康领域复杂问题的能力。它是一个强大的基础,下一代产品已在开发中。」

全面入驻:覆盖超35亿用户

Muse Spark目前已开始在WhatsApp、Instagram、Facebook、Messenger等产品中全量推送,并将很快全面驱动Meta智能眼镜的各项AI功能,触及超过35亿用户。Meta正利用其庞大的软硬件生态,将大模型转化为无处不在的基础设施,与依赖独立App的竞争对手形成差异化竞争。