英伟达发布Gamma-World:突破双智能体瓶颈,首个支持四人协作的世界模型
英伟达研究团队联合清华大学、多伦多大学及Vector Institute,发布了一款名为Gamma-World的多智能体生成式世界模型,首次在无需重新训练的情况下,实现了从双玩家到四玩家协作的零样本泛化。
核心技术突破
长期以来,虚拟环境模拟受限于单人或双人互动场景。四名以上玩家的独立控制与动作协调是业界难以攻克的核心挑战。
Simplex旋转智能体编码:研究团队将经典的旋转位置编码(RoPE)推广至高维角度空间,为每名玩家赋予完全等价的物理对称性,使其不再依赖固定编号,从而实现更自然的独立指代与操控。
稀疏中心注意力机制(Sparse Hub Attention):通过可学习的中心标记传递交互信息,将玩家间的注意力计算成本从二次方压缩至线性级别,有效控制计算开销。
实时推理能力
团队将高延迟的扩散模型教师蒸馏为因果模型学生,配合键值缓存(KV Cache)技术,实现了每秒24帧(24 FPS)的实时动作响应,满足实际游戏环境的交互需求。
评测表现
在多人游戏环境的基准测试中,Gamma-World在视频画面逼真度、动作响应可控性及玩家间协调一致性上,均显著优于传统的插槽式和密集注意力方案。
开源计划
目前项目主页与论文已发布,代码与模型权重预计将于近期开源。
研究团队来自英伟达、清华大学、多伦多大学及Vector Institute。论文已发表于arXiv,代码仓库已在GitHub上线。