Google Antigravity 2.0 拆分风波:官方回应与多智能体路线图揭秘
Google Antigravity 产品工程负责人 Kevin Hou 承认 2.0 版本拆分策略在用户过渡上存在失误,同时披露了「工作即产品」的 AI 开发工具演进路线图。
聚合 AI 前沿动态,筛出值得关注的信号。
Google Antigravity 产品工程负责人 Kevin Hou 承认 2.0 版本拆分策略在用户过渡上存在失误,同时披露了「工作即产品」的 AI 开发工具演进路线图。
OpenAI于2026年5月完成ChatGPT、Codex及API三大产品团队的合并,由Thibault Sottiaux统一执掌,旨在将产品重心从「问AI」转向「让AI做事」,并披露了云端与本地双轨协同的技术路线图。
Anthropic 核心工程师 Thariq Shihipar 发布 Claude Code 动态工作流实践指南,通过 JavaScript 脚本编排子智能体解决单通道智能体的局限性,并分享六种核心编排模式与成本优化策略。
特朗普政府签署AI行政命令,建立自愿性前沿模型审查机制,将政府审查期上限从90天压缩至30天,并授权财政部牵头建立AI网络安全共享中心,以平衡国家安全与行业竞争力。
谷歌DeepMind旗下智能体开发平台Antigravity完成Gemini 3.5 Flash模型升级,新版本着重优化生成风格与长任务执行能力,同时重置所有用户额度以提升开发者测试体验。
开源AI公司Nous Research推出Hermes Agent桌面客户端Hermes Desktop公测版,支持macOS/Windows/Linux三大平台,旨在以图形界面降低开源AI智能体的使用门槛。
Cognition将开发工具Windsurf全面升级为Devin Desktop,打造可管理本地和云端AI智能体的控制中心,同时推出Rust重构的本地智能体Devin Local,原有Cascade智能体将支持至2026年7月。
OpenAI宣布对Codex进行重大战略升级,将产品定位从编程辅助工具扩展为面向所有白领的通用知识工作平台,并新增网页生成和企业应用集成功能。
Anthropic宣布将其网络安全项目Project Glasswing的合作规模扩大三倍,新增约150家机构覆盖电力、水务、医疗等关键基础设施行业,并调整防御策略重心。
微软AI部门在Build 2026大会上推出由苏莱曼主导的七款自研MAI模型家族,涵盖推理、编程、图像、语音等领域,并推出企业强化学习微调服务和与梅奥诊所的战略合作。
独立开发者实测MiniMax M3在DeepSWE长程软件工程基准上仅获13.3%通过率,与官方宣称的SWE-bench Pro 59.0%成绩差距悬殊,暴露出Benchmark评测标准差异及算力成本高企的双重挑战。
Anthropic宣布由前Google DeepMind研究总监Matthew Botvinick领衔成立「AI与法治」研究团队,隶属Anthropic Institute并开放高薪科学家席位,标志着该公司将AI安全研究从技术层面拓展至宪政与法治框架。
独立开发者实测MiniMax M3编码模型在DeepSWE软件工程基准上仅获13.3%通过率,远低于官方59.0%宣传指标,但模型展现低回归缺陷率与高解决精度等亮点。
字节跳动将Seed Robotics团队并入多模态部门,由前阿里达摩院技术负责人周畅统一管理,并面向头部具身智能创业公司招募L8级技术负责人,加速大模型在物理世界的落地。
研究表明大模型智能体的装备更新能力与模型规模几乎无关,9B参数的Qwen3.5-9B更新技能的效果与Claude Opus 4.6高度等价,但弱模型从装备中获益的能力严重不足.
Perplexity发布全新Search as Code架构,让AI智能体在单次推理周期内通过生成的Python代码并行执行数千次搜索操作,在多项基准测试中表现显著优于传统function calling方案。
前xAI世界模型负责人Ethan He揭示视频生成领域底层真相,扩散模型本质是像素渲染器,智能核心实为担任提示词重写器的大语言模型,这一发现或将重构人机交互方式。
xAI前世界模型负责人Ethan He在播客中披露,海量视频数据训练的网络带宽费用可超单次23万美元,综合月度账单轻松突破数百万美元,存储与网络成本远超算力本身。
xAI前世界模型负责人Ethan He在播客中披露公司运营内幕,指出初创企业在商业压力下的频繁转向使长期研究难以维系,而Colossus超算集群的高昂成本更让研发团队承受巨大心理负担。
OpenAI于6月1日结束Codex双倍额度促销活动,同时将免费及低阶用户的额度重置周期从周改为月度,引发开发者社区强烈不满。