蚂蚁集团旗下百灵大模型团队(inclusionAI)于2026年5月9日正式发布万亿级旗舰思考模型 Ring-2.6-1T(总参数万亿级、激活参数630亿)。该模型面向Agent、工程开发、科研分析及企业工作流等真实复杂任务场景,核心创新在于首次引入**「动态思考强度」(Dynamic Thinking Intensity)**机制。
双档运行模式:效率与深度的灵活平衡
Ring-2.6-1T 提供 high 与 xhigh 两种运行模式,开发者和企业可根据任务需求灵活切换,在认知深度、Token成本与执行速度之间取得最优平衡:
- Agent模式(high):主打多步执行和工具调用,适用于代码生成、API协同、多轮交互等高频场景。在此模式下,模型PinchBench跑分达 87.60,高于GPT-5.4 xHigh和Gemini-3.1-Pro high,ClawEval测试得分63.82。
- 深度思考模式(xhigh):针对数学推理和科研分析等需要强推理能力的场景。在AIME 2026上得分 95.83,GPQA Diamond得分 88.27。
技术路线:效率优先的「快思考」
与行业普遍追求「慢思考」多步推理不同,Ring-2.6-1T 采用MLA(Multi-head Latent Attention)与LinearAttention混合架构设计,旨在以极低Token开销直达结果,显著压缩输出成本和推理延迟。
这一设计思路与4月24日发布的Ling-2.6-1T(非推理旗舰)形成互补:Ling系列主打「快思考」即时执行,Ring系列则引入可调节思考深度,两条产品线与Ming多模态模型共同构成蚂蚁百灵从轻量部署到综合旗舰的完整产品矩阵。
开放与生态
即日起,Ring-2.6-1T 联合Novita在OpenRouter平台提供为期一周的免费API试用(至5月15日)。此外,官方表示模型将于近期开源权重,进一步丰富开源社区的推理模型选择。