百度于5月9日正式发布了文心大模型5.1。该模型基于今年1月发布的文心5.0训练而来,核心技术亮点在于参数量大幅压缩:总参数量降至文心5.0的约三分之一,激活参数缩减至约二分之一,而预训练算力成本仅为同规模模型的约6%。
这一突破源于百度提出的**「多维弹性预训练」(Once-for-All)框架**。传统做法需要分别为不同规模的模型单独跑预训练,而文心5.0通过一次预训练、动态采样的方式同时优化大量不同大小的子模型,再从中提取最优结构直接继承知识,省去了从头训练的高昂算力开销。
在基准测试方面,文心5.1表现强劲:
- AIME26数学竞赛(使用工具)得分达99.6,仅次于Gemini-3.1 Pro,位列全球第二;
- Agent能力超越DeepSeek-V4-Pro;
- Arena搜索榜以1223分排名全球第四、国内第一。
值得注意的是,早在今年4月30日,文心5.1 Preview版已在LMArena文本榜以1476分登顶国内第一,正式版进一步巩固了领先地位。
目前,用户可直接在文心一言官网体验文心5.1,企业和开发者则可通过百度千帆大模型平台调用API接口。