xAI 宣布年底开源 Grok 4.2 基座模型
埃隆·马斯克近日在 X 平台上宣布,旗下人工智能公司 xAI 计划在 2026 年年底前开源其现役的 Grok 4.2 基座模型。该模型拥有 5000 亿参数(0.5T),虽然是 Grok 系列中参数规模较小的版本,但马斯克强调开源后对开发者社区仍具极高实用价值。
技术背景与挑战
值得注意的是,马斯克此前曾公开承认,当前的 Grok 4.2 底层模型在训练数据质量、数据全面性以及配方比例上存在一定缺陷,导致模型在应对高难度编程挑战时表现受限。然而,对于常规自然语言处理以及基础推理任务,该模型依然展现出强大的性能优势。
开源战略回顾
开源大模型一直是 xAI 的核心策略之一。2024 年 3 月,xAI 正式开源了拥有 3140 亿参数的 Grok-1 混合专家模型(MoE),其中 25% 的权重用于处理给定标记,一举成为当时全球规模最大的开源语言模型,引发 AI 社区热烈反响,Grok-1 在 GitHub 上迅速获得数万星标。
Grok-1 采用基于 JAX 和 Rust 构建的自定义训练堆栈开发,使用 Apache-2.0 许可证发布基本模型权重和网络架构。英伟达高级科学家 Jim Fan 当时评价称其为「有史以来最大的开源大模型,由世界一流团队训练」。
行业影响
随着 Grok 4.2 开源计划的公布,xAI 的开源布局进一步扩展。此举与 Meta 旗下 Llama 系列的开源策略相呼应,通过开放模型权重吸引开发者构建应用生态,有望为 xAI 带来更多社区贡献和技术迭代动力。