图灵奖得主、前Meta首席AI科学家杨立昆(Yann LeCun)联合Mila研究所、布朗大学、牛津大学及LanceDB等机构,于近日正式发布开源平台stable-worldmodel(简称swm)。该项目由Mila研究所博士生Lucas Maes担任第一作者,AMI Labs研究员Randall Balestriero担任通讯作者,旨在为具身智能领域的世界模型研究提供一个标准化、高复现性的统一底座。
破解世界模型研究的三大瓶颈
近年来,世界模型作为实现通用人工智能(AGI)的关键路径受到广泛关注。然而,该领域长期面临三大核心挑战:
- 代码库碎片化:不同研究团队往往需要从零构建专属的数据流与核心算法,导致大量重复开发;
- 数据加载效率低下:视频数据处理成为训练瓶颈;
- 缺乏统一基准:难以对不同方法进行公平比较与复现验证。
stable-worldmodel正是为解决这些问题而生。
核心特性:高性能数据层与多算法集成
据arXiv论文(2605.21800)披露,stable-worldmodel引入了基于Lance格式的高性能数据层,提供针对MP4视频、HDF5以及LeRobot机器人数据集的专用转换工具,大幅提升数据加载效率。
在算法层面,该平台集成了多种主流世界模型基线:
| 基线算法 | 描述 |
|---|---|
| DINO-WM | 基于自监督DINOv2特征的隐世界模型 |
| PLDM | 预测式语言-动作-视觉模型 |
| LeWM | 学习型世界模型 |
| GCBC | 基于图像的动作条件预测 |
| GCIVL/GCIQL | 基于对比学习的交互式视觉-语言模型 |
此外,平台还提供CEM、MPPI及基于梯度的规划求解器,支持模型预测控制(MPC)评估。
标准化评估体系
stable-worldmodel支持来自DeepMind Control Suite、OGBench以及经典世界模型基准(如Two-Room、PushT)的大量环境。每个环境均可定制视觉、几何及物理因子的变化,使研究人员能够系统性地评估模型的动力学理解、控制性能、表示质量及分布外泛化能力。
战略背景:杨立昆的"世界模型"野心
2026年3月,杨立昆离开深耕12年的Meta,创办AMI Labs(先进机器智能实验室),并完成了欧洲史上最大规模的10.3亿美元种子轮融资,投前估值达35亿美元。杨立昆始终认为,以ChatGPT为代表的大语言模型(LLM)路线无法实现真正的AGI,必须赋予AI对物理世界的理解能力——即构建内部世界模型。
此次推出stable-worldmodel,正是其推动世界模型商业化与技术标准化的重要一步。通过在单一框架下整合完整数据流与评估体系,该平台有望大幅降低世界模型的研发门槛,为具身智能研究提供一个可复现的标准化基础设施。
项目已在GitHub开源,代码仓库为galilai-group/stable-worldmodel,并提供pip安装包。