MiniMax稀宇科技于2026年6月1日正式发布新一代大模型MiniMax M3。该模型被称为国内首个集「前沿编程与智能体能力、百万token超长上下文、原生多模态理解」三项前沿能力于一体的开源路线大模型,计划在10天内正式开源权重。
首创稀疏注意力架构
M3核心技术亮点在于首创的稀疏注意力架构MSA(Multi-Stage Attention)。该架构通过KV块聚合命中查询实现高效检索,相比Flash-Sparse-Attention可将访存效率提升4倍。在100万上下文场景下,每token计算量降至上代产品的二十分之一,实现预填充9倍加速、解码15倍加速的显著性能提升。
编程能力达国际领先水平
在业界公认的编程能力评测中,M3展现出强劲竞争力。在SWE-Bench Pro测试中取得59.0%成绩,超越GPT-5.5与Gemini 3.1 Pro,接近Opus 4.7水平;在Terminal Bench 2.1中斩获66.0%得分。团队还构建了交互式用户模拟器框架,专门用于训练模型的长期协同规划与多轮交互能力。
自主智能体实战能力
实测数据显示,M3在复杂任务中展现出显著的自主执行能力:
- 论文复现任务:自主运行12小时成功复现ICLR 2025论文,并观测到DPO效应
- 硬件优化任务:在Hopper优化FP8算子任务中,24小时内自主调用工具1959次,将GPU利用率从7.6%提升至71.3%,加速9.4倍
- 自主训练能力:在PostTrainBench测试中获0.37分,虽略低于Opus 4.7与GPT-5.5,但明显领先其他模型
产品落地与商业化
MiniMax Code同步更新,支持computer use桌面操控功能。订阅方案Plus档定价每月49元,可获得6亿token额度,约为Claude Pro订阅的5倍容量。API现已上线,提供thinking推理与non-thinking快速模式两种调用方式。
MiniMax M3的发布标志着国产大模型从单纯参数竞赛转向效率与能力并重的「深水区」竞争,其稀疏注意力架构与自主智能体的组合方案,为编程与桌面操控领域树立了新的技术标杆。