X开源算法仓库迎来第二次重大更新,广告混排逻辑首度露面
距离马斯克今年1月宣布开源X平台推荐算法四个月后,X官方算法仓库于2026年5月15日迎来第二次主提交。相比1月20日的首版,这次更新规模显著扩大:共涉及187个文件,新增18,263行代码,删除926行。核心增量已从"解释推荐架构"推进到"补出可运行推理链路和广告混排逻辑"。
Phoenix推荐模型终获端到端演示
最关键的变化在于Phoenix推荐模型终于有了完整的端到端演示。新增的phoenix/run_pipeline.py可以从导出的checkpoint、用户行为序列和预计算语料出发,依次完成召回和排序:先根据用户历史找出候选内容,再预测点赞、回复、转发、停留等互动概率,最后合成排序分数。这比1月版本仅提供检索和排序模块说明更接近真实推荐流程。
此次更新还新增了约3GB的mini Phoenix模型artifact,用于开箱即跑的示例推理。不过仓库文档存在一处参数冲突:根README标注256维embedding、2层Transformer,而Phoenix文档和参数表写的是128维embedding、4层Transformer,具体配置仍需以artifact解压后的config.json为准。
广告混排逻辑首度公开
更具看点的是广告部分。回顾1月马斯克的原话,承诺开源范围覆盖"所有用于决定向用户推荐自然内容和广告内容的代码",但首版几乎未见广告混排细节。
5月更新补上了home-mixer/ads/目录,代码显示广告插入并非固定位置硬塞,而是会受到安全间隔、相邻内容风险、作者账号、关键词匹配和品牌安全规则等多重因素影响。这一逻辑的公开让研究者得以一窥X平台广告与自然内容如何共存于同一信息流中。
内容理解管线同步完善
此外,X还加入了新的grox/内容理解管线,涵盖垃圾内容识别、帖子分类、政策安全判断和多模态embedding等能力。
整体来看,这次更新真正补强的是推荐系统外围的生产链路:候选内容从哪来、广告怎么插入、内容安全如何拦截、结果如何写回。虽然仍非完整生产代码,但比起1月的"框架说明版",当前版本已更像一套能被研究者拆解的X For You推荐系统样本。
- 信源:GitHub xai-org/x-algorithm
- 相关背景:马斯克于2026年1月宣布将在7天内开源算法,并承诺每四周更新一次