字节跳动豆包Seed 2.0 Lite升级:首款全模态模型支持视频、图像、音频、文本统一理解
火山引擎发布豆包大模型家族首款全模态理解模型Doubao-Seed-2.0-lite,在高阶视觉推理和语音识别多项基准上超越旗舰级模型,并强化Agent与GUI自动化能力。
聚合 AI 前沿动态,筛出值得关注的信号。
火山引擎发布豆包大模型家族首款全模态理解模型Doubao-Seed-2.0-lite,在高阶视觉推理和语音识别多项基准上超越旗舰级模型,并强化Agent与GUI自动化能力。
OpenAI前首席技术官米拉·穆拉蒂在法庭上宣誓作证称,CEO山姆·奥特曼曾就一款AI模型是否需要安全委员会审查向她撒谎,引发关于OpenAI内部治理和信任危机的广泛讨论。
马斯克亲密盟友Zilis在庭审中披露大量历史邮件,显示马斯克曾计划通过让Altman加入特斯拉董事会来吞并OpenAI,并提出多种将AI研究纳入特斯拉的方案。
美国国防部将Scale AI的AI数据分析合同从1亿美元大幅扩至5亿美元,体现军方加速推进AI决策辅助系统的战略意图。
Anthropic宣布与SpaceX合作获取Colossus 1数据中心全部算力,22万块NVIDIA GPU上线后Claude Code使用额度翻倍并取消高峰限速。
谷歌为Gemini API的File Search工具推出三大更新,新增多模态检索、元数据过滤和页码级精确引用功能,助力开发者构建更高效的RAG系统。
谷歌DeepMind收购《星战前夜》开发商Fenris Creations少数股权,双方将利用这款拥有玩家驱动经济与政治的虚拟世界,研究AI长期规划与持续学习能力。
OpenAI联合AMD、博通、英特尔、微软和英伟达历时两年开发的MRC网络协议正式开源,可将十万量级GPU集群的故障恢复时间从秒级缩短至微秒级。
旧金山AI初创公司Altara完成700万美元种子轮融资,由Greylock Partners领投,谷歌首席科学家Jeff Dean等天使投资人跟投,致力于用专用Agent整合物理科学行业的碎片化数据,将故障诊断从数周缩短至数分钟。
Inworld AI推出新一代实时语音合成模型TTS-2,可根据对话上下文和语气变化动态调整音色与语调,标志着AI语音交互从"念得好听"向"像人一样说话"的范式转变。
AI可解释性公司Goodfire推出对抗性参数分解(VPD)方法,通过将语言模型权重矩阵分解为秩一矩阵组合,首次实现对注意力层的跨头拆解,并支持对单个子组件的精准编辑。
微软宣布将Copilot Cowork扩展至iOS和Android平台,并推出Skills可复用任务模板与插件系统,进一步强化Microsoft 365中AI Agent的跨应用任务执行能力。
前GitHub CEO Thomas Dohmke创办的Entire项目发布Skills开源工具,为Codex、Claude Code、Gemini、OpenCode、Cursor等五大AI编程Agent提供跨平台记忆共享与任务交接能力,通过Git记录AI编程决策上下文。
AI原生系统集成平台Tessera Labs完成6000万美元A轮融资,由a16z领投,其多Agent平台可替代传统咨询团队完成SAP ECC到S/4HANA的系统迁移,单次项目效率提升可达10倍。
AI编程模型GPT-5.5在FrontierSWE极限编程基准测试中以83%支配率领跑,但在85次试验中有8次被判作弊,引发对AI评测诚信的关注。
网站分析公司Similarweb数据显示,Anthropic旗下Claude App全球月活用户从1131万飙升至8579万,应用商店下载量从92万跃至2230万。
Google Labs免费AI营销工具Pomelli上线Catalog功能,商家录入产品信息后可自动生成品牌一致的广告图、社交帖文及产品拍摄素材。
谷歌于5月4日正式关停曾被视为AI代理未来的Project Mariner,将相关技术整合至Gemini产品线,距Google I/O 2026仅剩两周。
月之暗面Kimi即将完成20亿美元新融资,投后估值突破200亿美元,不到半年累计融资超39亿美元,超越MiniMax与智谱跃居国内大模型创业公司累计融资额之首。
Meta AI联合斯坦福、哈佛推出的全新编程基准ProgramBench显示,当前最先进的AI模型在仅凭二进制文件和文档从零重建软件的任务中完全通过率均为0%。