Meta于今年4月正式发布全新AI模型Muse Spark,这是Meta Superintelligence Labs自成立以来交出的首份成绩单,也标志着Meta AI战略从早期的开源社群导向正式升级为产品驱动模式。
从Llama到Muse:Meta AI战略转型
Muse Spark定位为原生多模态推理模型,支持工具调用、视觉思维链和多智能体编排(Multi-Agent Orchestration)。与此前侧重开源的Llama系列不同,Muse Spark初期采用封闭策略,仅在美国通过Meta AI应用及网站以「私人预览」形式上线,合作伙伴需获邀请才能率先体验。
值得关注的是,Meta去年高薪聘请前Scale AI首席执行官Alexandr Wang组建超级智能团队,并斥资从零重建AI技术架构,投入规模之大被业内视为一场豪赌——Llama 4早期表现曾令市场失望,Meta急需一款旗舰模型重振其在AI领域的竞争力。
子智能体并行:AI从单线到多线程
Muse Spark引入的**「深思模式」(Contemplating Mode)**是本次升级的核心亮点。该模式允许系统同时调度多个子智能体分头执行任务,例如用户规划旅行时,一个Agent排行程、一个对比目的地优劣、第三个搜索适合儿童的活动,最终汇总结果——这种并行处理机制可大幅缩短复杂任务的等待时间。
多模态感知与智能眼镜深度整合
在交互层面,Muse Spark为Meta补全了实时多模态感知能力。用户可通过手机镜头或Ray-Ban Meta、Oakley Meta智能眼镜,一边注视现实世界一边用自然语音向AI提问,并可随时打断或切换语言。模型能直接读取环境信息,例如扫描机场货架找出蛋白质含量最高的零食,或帮助解读医疗图表。
此外,Muse Spark还支持视觉代码生成,用户只需一句话提示即可生成定制化网页或小游戏。
独立评估:接近头部但编程仍存差距
独立评测显示,Muse Spark在语言理解与视觉推理方面已接近Google、OpenAI、Anthropic等市场领导者水平,但在编程与抽象推理能力上仍有差距,整体排名并列第四。Meta在官方博客中坦言:「这款初始模型追求体积小、速度快,但仍具备推理科学、数学和健康领域复杂问题的能力。它是一个强大的基础,下一代产品已在开发中。」
全面入驻:覆盖超35亿用户
Muse Spark目前已开始在WhatsApp、Instagram、Facebook、Messenger等产品中全量推送,并将很快全面驱动Meta智能眼镜的各项AI功能,触及超过35亿用户。Meta正利用其庞大的软硬件生态,将大模型转化为无处不在的基础设施,与依赖独立App的竞争对手形成差异化竞争。