1.5T参数Grok V9训练完成,Cursor代码数据救急
xAI首席执行官埃隆·马斯克(Elon Musk)于5月16日在X平台宣布,1.5T(1.5万亿)参数的Grok V9内部第9版基础模型已完成训练,预计将在3至4周内正式发布。马斯克称新版模型将带来"炸裂"级别的体验提升。
数据缺陷引发的紧急调整
在此之前,马斯克公开承认现役模型存在数据缺陷问题。为弥补这一短板,V9接下来将进入"补充训练"阶段,专门吸纳AI编程工具Cursor的海量代码数据。xAI内部已规划好后续流程:在完成底层知识灌输后,再交由监督微调(SFT)和强化学习(RL)进一步打磨模型能力。
多代模型并行推进
根据现有披露的信息,xAI当前正在Colossus 2超算上同时训练7款模型,形成密集的发布节奏:
| 模型 | 参数规模 | 预计发布时间 |
|---|---|---|
| Grok 4.4 | 1T(万亿) | 2026年5月初 |
| Grok 4.5 | 1.5T(万亿) | 2026年5月底 |
| Grok 5 | 6T-10T(万亿) | 后续 |
这一策略与此前行业内的推测相符——xAI试图通过快速迭代追上Claude、GPT-5和Gemini 3.1 Pro等竞争对手的表现。
Colossus 2基础设施支撑
值得注意的是,xAI近期经历了重大组织调整:原xAI团队已解散并并入SpaceX,组建为SpaceXAI。与此同时,Anthropic获得了原Colossus 1全部约22万块GPU的算力资源。新的Colossus 2则继续作为xAI训练下一代模型的核心基础设施,采用Blackwell架构主力芯片。
业内分析认为,xAI在企业市场和开发者市场的表现始终不如预期,此番密集发布能否扭转局面,仍有待新模型正式上线后的实际表现验证。