Thinking Machines新模型横空出世:音频对话评测战平GPT-Realtime-2
由前OpenAI CTO Mira Murati创立的Thinking Machines Lab发布TML-Interaction-Small模型,在Scale Labs最新Audio MC S2S音频榜单中与OpenAI GPT-Realtime-2并列第一。
聚合 AI 前沿动态,筛出值得关注的信号。
由前OpenAI CTO Mira Murati创立的Thinking Machines Lab发布TML-Interaction-Small模型,在Scale Labs最新Audio MC S2S音频榜单中与OpenAI GPT-Realtime-2并列第一。
OpenAI与微软修订合作协议,将营收分成上限锁定在380亿美元,预计2028年触达,同时取消付款延期特权,导致今明两年现金消耗大幅上升。
Nvidia CEO黄仁勋未能进入特朗普访华商业代表团,折射出中美在高端AI芯片出口限制上的深度博弈陷入僵局。
Anthropic为命令行编程工具Claude Code推出/goal命令,支持跨多轮自主执行长期任务,该设计被指与OpenAI Codex的同类功能高度撞车,引发两家AI编程助手之间的竞争风波。
安全研究人员发现,攻击者通过污染GitHub Actions缓存和滥用OIDC令牌,成功在42个TanStack包中植入恶意代码,这是首个携带合法来源证明的npm供应链攻击。
前端知名框架TanStack的42个官方npm包在5月11日遭供应链攻击,84个恶意版本通过GitHub Actions缓存投毒和OIDC令牌提取绕过正常发布流程,携带有效SLSA构建来源证明,为史上首例。
OpenAI 创始成员 Andrej Karpathy 近日发文力挺 HTML 取代 Markdown 作为 AI 输出格式,并勾勒了一条从纯文本到交互式神经视频的演进路线图,认为这是人机带宽最优解。
Nous Research 推出的开源 AI 助手 Hermes Agent 正式支持 macOS 后台电脑控制功能,借助开源驱动 cua-driver 实现不抢占用户鼠标和键盘焦点的自动化操作,并通过四层上下文压缩机制将 Token 消耗压低 95%。
Hugging Face 宣布与 Nous Research 的开源智能体 Hermes 实现官方级生态整合,提供云端模型路由、本地 GGUF 模型一键接入以及执行轨迹云端可视化三大能力。
Anthropic将今年1月发布的23000字Claude「宪法」(Constitution)制作成有声读物,由哲学博士Amanda Askell和Joe Carlsmith亲自朗读录制。
美国众议院监督委员会正式对 OpenAI CEO Sam Altman 启动利益冲突调查,同时六名共和党州总检察长联名请求 SEC 对其个人投资行为进行审查,为公司预期中的 IPO 蒙上阴影。
估值合计近2万亿美元的OpenAI和Anthropic同步收紧股权政策,以最强硬法律措辞宣告非授权交易无效,意在IPO前清理失控的二级市场。
OpenAI于5月12日发布了Codex的原生开发者插件,将API Key管理、错误诊断和官方文档查询集成到同一工作流中,进一步简化AI应用开发流程。
前OpenAI首席科学家Sutskever在马斯克诉OpenAI案中首度详述推动罢免Altman的全过程,透露他花一年时间撰写52页备忘录记录Altman的「持续说谎模式」,并首次证实Altman被罢免期间董事会曾与Anthropic洽谈合并方案。
微软CEO纳德拉在马斯克诉OpenAI案中出庭作证,透露微软通过双方合作累计产生95亿美元营收,同时曝光其2022年内部邮件显示对「成为IBM被反超」的深度焦虑,并批评Altman被炒事件中董事会的做法「业余得可以」。
人工智能分析机构Artificial Analysis发布首个综合编码智能体基准指数,Cursor CLI搭配Claude Opus 4.7以61分夺魁,力压OpenAI Codex与Anthropic官方Claude Code。
Anthropic宣布在AWS上推出Claude Platform服务,让企业可直接通过AWS IAM身份调用完整Claude原生功能并合并计费,同时保留Amazon Bedrock作为数据驻留合规选项。
Anthropic 发布 Claude Code Agent View 功能,允许开发者通过内置面板调度、挂起和统一管理多个并行 AI 代理,显著提升个人开发者并发处理效率。
OpenAI 于2026年5月正式推出网络安全套件 Daybreak,将 GPT-5.5-Cyber 模型与 Codex 智能体框架深度整合,通过三级权限管控将大模型能力引入企业漏洞扫描与自动修复流程,Cloudflare 成为首批公开测试客户。
前OpenAI首席技术官Mira Murati创立的Thinking Machines Lab发布全新「交互模型」研究预览,采用2760亿参数MoE架构实现200毫秒响应速度,在语音延迟和基准测试中超越GPT-realtime-2.0。