xAI宣布Grok V9基础模型训练完成:1.5万亿参数剑指高难编程场景
模型规模跃升三倍,预计数周内公测
据多家外媒报道,马斯克旗下人工智能公司xAI于5月24日宣布,Grok V9基础模型已完成内部训练阶段。该模型拥有1.5万亿参数,规模达到当前生产环境主力模型v8-small(0.5万亿参数)的三倍。马斯克本人也在X平台透露,模型预计在2至3周内面向公众发布。
引入Cursor代码数据,主打编程能力升级
此次Grok V9最显著的改进之一在于训练数据的重构。xAI团队在补充训练阶段引入了大量Cursor代码数据,后续还将持续注入更多高质量编程样本。据市场传闻,xAI与Cursor之间存在深度合作,甚至有消息指出xAI计划以200亿美元估值将Cursor收入麾下,实现"算力换场景、数据养模型"的深度绑定。
这一战略布局表明,xAI正试图将Grok V9打造成编程领域的强力竞争者,直接对标OpenAI Claude等以代码能力见长的模型。
Blackwell架构GPU优化,硬件层面全面升级
与前代模型运行在Hopper架构GPU不同,Grok V9专门针对NVIDIA Blackwell架构GPU进行了针对性优化。这一硬件层面的升级配合增强的数据筛选机制和更新的训练配方,理论上将带来显著的性能提升。
xAI在Colossus超算集群上部署了大量Blackwell芯片,为Grok V9提供了强大的算力支撑。
马斯克坦承v8-small存在严重缺陷
值得注意的是,Grok V9的推出在某种程度上是对前代模型的"自我纠错"。马斯克此前公开承认,现行公测版本Grok 4.2所基于的V8基础模型在训练数据质量、数据全面性以及比例配置上存在严重缺陷。这也成为推动团队快速迭代至V9的重要动因。
内部早期评估显示,Grok V9相较V8的提升幅度被形容为**"天壤之别"**(gigantic)。目前模型已进入监督微调阶段,强化学习训练将在数日内启动。
市场竞争加剧,xAI加速追赶
在Anthropic Claude和OpenAI GPT系列持续领跑的背景下,Grok V9的推出被视为xAI缩小差距的关键一步。随着模型发布临近,AI编程助手市场的竞争格局或将进一步洗牌。