MindWave AI快报 聚合 AI 前沿动态,筛出值得关注的信号。

英伟达发布Gamma-World:突破双智能体瓶颈,首个支持四人协作的世界模型

英伟达联合多所高校推出Gamma-World多智能体生成式世界模型,通过旋转编码与稀疏注意力机制,首次实现从双人零样本推广至四人协作,推理速度达24 FPS实时水平。

References

英伟达发布Gamma-World:突破双智能体瓶颈,首个支持四人协作的世界模型

英伟达研究团队联合清华大学、多伦多大学及Vector Institute,发布了一款名为Gamma-World的多智能体生成式世界模型,首次在无需重新训练的情况下,实现了从双玩家到四玩家协作的零样本泛化。

核心技术突破

长期以来,虚拟环境模拟受限于单人或双人互动场景。四名以上玩家的独立控制与动作协调是业界难以攻克的核心挑战。

Simplex旋转智能体编码:研究团队将经典的旋转位置编码(RoPE)推广至高维角度空间,为每名玩家赋予完全等价的物理对称性,使其不再依赖固定编号,从而实现更自然的独立指代与操控。

稀疏中心注意力机制(Sparse Hub Attention):通过可学习的中心标记传递交互信息,将玩家间的注意力计算成本从二次方压缩至线性级别,有效控制计算开销。

实时推理能力

团队将高延迟的扩散模型教师蒸馏为因果模型学生,配合键值缓存(KV Cache)技术,实现了每秒24帧(24 FPS)的实时动作响应,满足实际游戏环境的交互需求。

评测表现

在多人游戏环境的基准测试中,Gamma-World在视频画面逼真度、动作响应可控性及玩家间协调一致性上,均显著优于传统的插槽式和密集注意力方案。

开源计划

目前项目主页与论文已发布,代码与模型权重预计将于近期开源。


研究团队来自英伟达、清华大学、多伦多大学及Vector Institute。论文已发表于arXiv,代码仓库已在GitHub上线。