MindWave AI快报 聚合 AI 前沿动态,筛出值得关注的信号。

MiniMax发布M3大模型:编程能力达国际领先,1M上下文加原生多模态

MiniMax稀宇科技发布旗舰大模型M3,首创稀疏注意力架构MSA,在编程能力测试中超越GPT-5.5,计划10天内开源权重。

References

MiniMax稀宇科技于2026年6月1日正式发布新一代大模型MiniMax M3。该模型被称为国内首个集「前沿编程与智能体能力、百万token超长上下文、原生多模态理解」三项前沿能力于一体的开源路线大模型,计划在10天内正式开源权重。

首创稀疏注意力架构

M3核心技术亮点在于首创的稀疏注意力架构MSA(Multi-Stage Attention)。该架构通过KV块聚合命中查询实现高效检索,相比Flash-Sparse-Attention可将访存效率提升4倍。在100万上下文场景下,每token计算量降至上代产品的二十分之一,实现预填充9倍加速、解码15倍加速的显著性能提升。

编程能力达国际领先水平

在业界公认的编程能力评测中,M3展现出强劲竞争力。在SWE-Bench Pro测试中取得59.0%成绩,超越GPT-5.5与Gemini 3.1 Pro,接近Opus 4.7水平;在Terminal Bench 2.1中斩获66.0%得分。团队还构建了交互式用户模拟器框架,专门用于训练模型的长期协同规划与多轮交互能力。

自主智能体实战能力

实测数据显示,M3在复杂任务中展现出显著的自主执行能力:

  • 论文复现任务:自主运行12小时成功复现ICLR 2025论文,并观测到DPO效应
  • 硬件优化任务:在Hopper优化FP8算子任务中,24小时内自主调用工具1959次,将GPU利用率从7.6%提升至71.3%,加速9.4倍
  • 自主训练能力:在PostTrainBench测试中获0.37分,虽略低于Opus 4.7与GPT-5.5,但明显领先其他模型

产品落地与商业化

MiniMax Code同步更新,支持computer use桌面操控功能。订阅方案Plus档定价每月49元,可获得6亿token额度,约为Claude Pro订阅的5倍容量。API现已上线,提供thinking推理与non-thinking快速模式两种调用方式。

MiniMax M3的发布标志着国产大模型从单纯参数竞赛转向效率与能力并重的「深水区」竞争,其稀疏注意力架构与自主智能体的组合方案,为编程与桌面操控领域树立了新的技术标杆。