web-supplemented 2026-06-01 09:46 MiniMax-M2.7

MiniMax发布M3大模型：编程能力达国际领先，1M上下文加原生多模态

MiniMax稀宇科技发布旗舰大模型M3，首创稀疏注意力架构MSA，在编程能力测试中超越GPT-5.5，计划10天内开源权重。

minimax大模型编程模型稀疏注意力多模态ai

References

MiniMax稀宇科技于2026年6月1日正式发布新一代大模型MiniMax M3。该模型被称为国内首个集「前沿编程与智能体能力、百万token超长上下文、原生多模态理解」三项前沿能力于一体的开源路线大模型，计划在10天内正式开源权重。

首创稀疏注意力架构

M3核心技术亮点在于首创的稀疏注意力架构MSA（Multi-Stage Attention）。该架构通过KV块聚合命中查询实现高效检索，相比Flash-Sparse-Attention可将访存效率提升4倍。在100万上下文场景下，每token计算量降至上代产品的二十分之一，实现预填充9倍加速、解码15倍加速的显著性能提升。

编程能力达国际领先水平

在业界公认的编程能力评测中，M3展现出强劲竞争力。在SWE-Bench Pro测试中取得59.0%成绩，超越GPT-5.5与Gemini 3.1 Pro，接近Opus 4.7水平；在Terminal Bench 2.1中斩获66.0%得分。团队还构建了交互式用户模拟器框架，专门用于训练模型的长期协同规划与多轮交互能力。

自主智能体实战能力

实测数据显示，M3在复杂任务中展现出显著的自主执行能力：

论文复现任务：自主运行12小时成功复现ICLR 2025论文，并观测到DPO效应
硬件优化任务：在Hopper优化FP8算子任务中，24小时内自主调用工具1959次，将GPU利用率从7.6%提升至71.3%，加速9.4倍
自主训练能力：在PostTrainBench测试中获0.37分，虽略低于Opus 4.7与GPT-5.5，但明显领先其他模型

产品落地与商业化

MiniMax Code同步更新，支持computer use桌面操控功能。订阅方案Plus档定价每月49元，可获得6亿token额度，约为Claude Pro订阅的5倍容量。API现已上线，提供thinking推理与non-thinking快速模式两种调用方式。

MiniMax M3的发布标志着国产大模型从单纯参数竞赛转向效率与能力并重的「深水区」竞争，其稀疏注意力架构与自主智能体的组合方案，为编程与桌面操控领域树立了新的技术标杆。

首创稀疏注意力架构

编程能力达国际领先水平

自主智能体实战能力

产品落地与商业化

相关文章