马斯克罕见自揭短板:Grok 4.2 训练数据存在重大缺陷,1.5T 参数内部新版全面升级
埃隆·马斯克(Elon Musk)本周在 X 平台上罕见地公开承认,当前对外开放的 Grok 4.2 存在严重不足。他同时披露了 xAI 旗下 Grok 内外版本号的对应关系:Grok 4.2 基于内部第 8 版基础模型,参数规模仅为 0.5T,在 Hopper 架构 GPU 上完成训练,但在训练数据的质量、全面性和配比上存在"重大缺陷"。
据马斯克透露,内部第 9 版基础模型已完成训练,参数规模扩至 1.5T,团队针对 Blackwell 架构 GPU 做了专项优化,在数据处理、训练配方和模型规模上实现了全面升级。马斯克直言,第 8 版和第 9 版"完全不是一个级别",暗示两者在能力上存在质的跃升。
值得一提的是,马斯克此次首次提及 Cursor 的数据将纳入后续补充训练,这是 SpaceX 拿下 Cursor 后在数据层面整合方面的首次公开表态。此前 The Information 报道,SpaceX AI 预训练团队在负责人离职后仅剩数人,超过 50 名核心研发人员在收购后选择离开。
就在本周,另有报道指出 xAI 预训练团队在核心人员流失后规模大幅缩减。按此前规划,马斯克承诺每两周发布一版新基础模型,原定 5 月初交付的 1T 参数 Grok 4.4 至今未亮相,而本次公布的 1.5T 版本与此前路线图中的 Grok 4.5 参数规格一致,Grok 4.4 是否已被跳过尚不明朗。