MindWave AI快报 聚合 AI 前沿动态,筛出值得关注的信号。

杨立昆联合推出stable-worldmodel开源平台:破解世界模型研究碎片化难题

由杨立昆AMI Labs与多机构合作推出的stable-worldmodel开源平台旨在通过统一数据层、集成多种基线算法和标准化评估环境,解决具身智能领域世界模型研究的可复现性问题。

References

图灵奖得主、前Meta首席AI科学家杨立昆(Yann LeCun)联合Mila研究所、布朗大学、牛津大学及LanceDB等机构,于近日正式发布开源平台stable-worldmodel(简称swm)。该项目由Mila研究所博士生Lucas Maes担任第一作者,AMI Labs研究员Randall Balestriero担任通讯作者,旨在为具身智能领域的世界模型研究提供一个标准化、高复现性的统一底座。

破解世界模型研究的三大瓶颈

近年来,世界模型作为实现通用人工智能(AGI)的关键路径受到广泛关注。然而,该领域长期面临三大核心挑战:

  • 代码库碎片化:不同研究团队往往需要从零构建专属的数据流与核心算法,导致大量重复开发;
  • 数据加载效率低下:视频数据处理成为训练瓶颈;
  • 缺乏统一基准:难以对不同方法进行公平比较与复现验证。

stable-worldmodel正是为解决这些问题而生。

核心特性:高性能数据层与多算法集成

据arXiv论文(2605.21800)披露,stable-worldmodel引入了基于Lance格式的高性能数据层,提供针对MP4视频、HDF5以及LeRobot机器人数据集的专用转换工具,大幅提升数据加载效率。

在算法层面,该平台集成了多种主流世界模型基线:

基线算法 描述
DINO-WM 基于自监督DINOv2特征的隐世界模型
PLDM 预测式语言-动作-视觉模型
LeWM 学习型世界模型
GCBC 基于图像的动作条件预测
GCIVL/GCIQL 基于对比学习的交互式视觉-语言模型

此外,平台还提供CEM、MPPI及基于梯度的规划求解器,支持模型预测控制(MPC)评估。

标准化评估体系

stable-worldmodel支持来自DeepMind Control Suite、OGBench以及经典世界模型基准(如Two-Room、PushT)的大量环境。每个环境均可定制视觉、几何及物理因子的变化,使研究人员能够系统性地评估模型的动力学理解、控制性能、表示质量及分布外泛化能力。

战略背景:杨立昆的"世界模型"野心

2026年3月,杨立昆离开深耕12年的Meta,创办AMI Labs(先进机器智能实验室),并完成了欧洲史上最大规模的10.3亿美元种子轮融资,投前估值达35亿美元。杨立昆始终认为,以ChatGPT为代表的大语言模型(LLM)路线无法实现真正的AGI,必须赋予AI对物理世界的理解能力——即构建内部世界模型。

此次推出stable-worldmodel,正是其推动世界模型商业化与技术标准化的重要一步。通过在单一框架下整合完整数据流与评估体系,该平台有望大幅降低世界模型的研发门槛,为具身智能研究提供一个可复现的标准化基础设施。

项目已在GitHub开源,代码仓库为galilai-group/stable-worldmodel,并提供pip安装包。