MindWave AI快报

聚合 AI 前沿动态，筛出值得关注的信号。

6月3日周三

02 2026-06-03 13:17

Google Antigravity 2.0 拆分风波：官方回应与多智能体路线图揭秘

Google Antigravity 产品工程负责人 Kevin Hou 承认 2.0 版本拆分策略在用户过渡上存在失误，同时披露了「工作即产品」的 AI 开发工具演进路线图。

googleantigravityai开发工具

03 2026-06-03 12:43

OpenAI整合ChatGPT与Codex：端云协同路线图首次曝光，剑指AI智能体时代

OpenAI于2026年5月完成ChatGPT、Codex及API三大产品团队的合并，由Thibault Sottiaux统一执掌，旨在将产品重心从「问AI」转向「让AI做事」，并披露了云端与本地双轨协同的技术路线图。

openaicodexchatgpt

04 2026-06-03 12:36

Claude Code 动态工作流发布：六大编排模式助力复杂任务自动化

Anthropic 核心工程师 Thariq Shihipar 发布 Claude Code 动态工作流实践指南，通过 JavaScript 脚本编排子智能体解决单通道智能体的局限性，并分享六种核心编排模式与成本优化策略。

claude code动态工作流ai智能体

05 2026-06-03 11:45

特朗普签署AI行政令：自愿审查期压缩至30天，打造联邦级网络安全协作框架

特朗普政府签署AI行政命令，建立自愿性前沿模型审查机制，将政府审查期上限从90天压缩至30天，并授权财政部牵头建立AI网络安全共享中心，以平衡国家安全与行业竞争力。

美国人工智能特朗普

06 2026-06-03 11:33

Google Antigravity平台升级Gemini 3.5 Flash：简化输出风格、延长长任务耐力

谷歌DeepMind旗下智能体开发平台Antigravity完成Gemini 3.5 Flash模型升级，新版本着重优化生成风格与长任务执行能力，同时重置所有用户额度以提升开发者测试体验。

googleantigravitygemini

07 2026-06-03 11:08

Nous Research发布Hermes Desktop公测版：将AI智能体装进图形桌面

开源AI公司Nous Research推出Hermes Agent桌面客户端Hermes Desktop公测版，支持macOS/Windows/Linux三大平台，旨在以图形界面降低开源AI智能体的使用门槛。

hermes desktopnous researchai agent

08 2026-06-03 10:54

Windsurf完成品牌升级更名为Devin Desktop：Rust重写本地智能体支持多智能体协作

Cognition将开发工具Windsurf全面升级为Devin Desktop，打造可管理本地和云端AI智能体的控制中心，同时推出Rust重构的本地智能体Devin Local，原有Cascade智能体将支持至2026年7月。

devinwindsurfcognition

09 2026-06-03 09:05

OpenAI全面升级Codex：从编程工具转型「知识工作系统」，剑指Claude Code市场

OpenAI宣布对Codex进行重大战略升级，将产品定位从编程辅助工具扩展为面向所有白领的通用知识工作平台，并新增网页生成和企业应用集成功能。

openaicodexai工具

10 2026-06-03 09:03

Anthropic扩大Project Glasswing合作至约200家机构，重点转向漏洞修复

Anthropic宣布将其网络安全项目Project Glasswing的合作规模扩大三倍，新增约150家机构覆盖电力、水务、医疗等关键基础设施行业，并调整防御策略重心。

anthropicproject glasswing网络安全

11 2026-06-03 08:37

微软AI发布七款MAI原生模型：350亿参数推理模型叫板Claude，强化学习微调服务直指企业市场

微软AI部门在Build 2026大会上推出由苏莱曼主导的七款自研MAI模型家族，涵盖推理、编程、图像、语音等领域，并推出企业强化学习微调服务和与梅奥诊所的战略合作。

微软MAI人工智能

6月2日周二

12 2026-06-02 19:25

MiniMax M3 独立评测揭Benchmark差距：DeepSWE仅13.3%通过率，高昂算力成本成短板

独立开发者实测MiniMax M3在DeepSWE长程软件工程基准上仅获13.3%通过率，与官方宣称的SWE-bench Pro 59.0%成绩差距悬殊，暴露出Benchmark评测标准差异及算力成本高企的双重挑战。

minimax大模型coding

13 2026-06-02 19:14

Anthropic研究院成立「AI与法治」团队，探索AI与民主治理的交叉地带

Anthropic宣布由前Google DeepMind研究总监Matthew Botvinick领衔成立「AI与法治」研究团队，隶属Anthropic Institute并开放高薪科学家席位，标志着该公司将AI安全研究从技术层面拓展至宪政与法治框架。

anthropicai安全法治

14 2026-06-02 19:11

独立评测揭示MiniMax M3真实能力：DeepSWE通过率仅13.3%

独立开发者实测MiniMax M3编码模型在DeepSWE软件工程基准上仅获13.3%通过率，远低于官方59.0%宣传指标，但模型展现低回归缺陷率与高解决精度等亮点。

minimaxdeep-sweai评测

15 2026-06-02 18:32

字节跳动整合Seed机器人团队，周畅接管具身智能业务

字节跳动将Seed Robotics团队并入多模态部门，由前阿里达摩院技术负责人周畅统一管理，并面向头部具身智能创业公司招募L8级技术负责人，加速大模型在物理世界的落地。

字节跳动周畅具身智能

16 2026-06-02 17:59

小模型也能当「演化器」：研究发现9B模型更新技能收益逼近旗舰Claude

研究表明大模型智能体的装备更新能力与模型规模几乎无关，9B参数的Qwen3.5-9B更新技能的效果与Claude Opus 4.6高度等价，但弱模型从装备中获益的能力严重不足.

人工智能大模型智能体

17 2026-06-02 17:06

Perplexity推出Search as Code架构：AI智能体可直接生成Python调用搜索API

Perplexity发布全新Search as Code架构，让AI智能体在单次推理周期内通过生成的Python代码并行执行数千次搜索操作，在多项基准测试中表现显著优于传统function calling方案。

perplexitysearch-as-codeai-agent

18 2026-06-02 16:36

AI视觉生成的「黑药丸」：扩散模型只是渲染工具，真正的智能在语言层

前xAI世界模型负责人Ethan He揭示视频生成领域底层真相，扩散模型本质是像素渲染器，智能核心实为担任提示词重写器的大语言模型，这一发现或将重构人机交互方式。

ai生成扩散模型大语言模型

19 2026-06-02 16:30

视频模型训练成本揭秘：存储与网络带宽如何成为AI竞赛的新瓶颈

xAI前世界模型负责人Ethan He在播客中披露，海量视频数据训练的网络带宽费用可超单次23万美元，综合月度账单轻松突破数百万美元，存储与网络成本远超算力本身。

人工智能视频模型xAI

20 2026-06-02 16:17

前xAI核心研发揭秘内部高压文化：万卡集群算力焦虑与"马拉松式"工作节奏

xAI前世界模型负责人Ethan He在播客中披露公司运营内幕，指出初创企业在商业压力下的频繁转向使长期研究难以维系，而Colossus超算集群的高昂成本更让研发团队承受巨大心理负担。

xai马斯克人工智能

21 2026-06-02 15:42

OpenAI Codex额度促销结束：免费用户重置周期延长至月度，开发者吐槽「额度荒」

OpenAI于6月1日结束Codex双倍额度促销活动，同时将免费及低阶用户的额度重置周期从周改为月度，引发开发者社区强烈不满。

openaicodexai编码工具