AI代理自主研究实验:Claude Opus打破nanoGPT优化记录,但仍难以独立创新
Prime Intellect让Claude Code和Codex在nanoGPT速度赛中自主迭代,Opus以2930步打破2990步的人类纪录,但实验揭示AI代理仍无法独立提出新算法。
聚合 AI 前沿动态,筛出值得关注的信号。
Prime Intellect让Claude Code和Codex在nanoGPT速度赛中自主迭代,Opus以2930步打破2990步的人类纪录,但实验揭示AI代理仍无法独立提出新算法。
Resemble AI在Hugging Face开源DramaBox语音模型,通过分离式提示词机制让AI实现带有情绪、停顿、语气变化的角色化语音表演,降低影视游戏配音门槛。
加州用户起诉OpenAI在用户不知情情况下,通过Meta Pixel和Google Analytics将ChatGPT对话主题及身份信息传输给Meta和Google,涉嫌违反联邦通信隐私法和加州隐私法律。
OpenAI受Axios NPM包供应链攻击影响,GitHub工作流下载了恶意版本导致签名证书泄露,公司已轮换证书并要求macOS用户在5月8日前更新ChatGPT、Codex等应用。
AI独角兽Anthropic正洽谈新一轮300亿美元融资,估值有望超越OpenAI成全球最高,而领投方中三家同时押注两家头部企业,引发市场对AI竞争格局的重新审视。
AI芯片公司Cerebras以185美元发行价登陆纳斯达克,首日暴涨68%市值逼近950亿美元,凭借OpenAI合作、GAAP盈利和云端推理服务三重叙事完成华丽转身。
微软将于6月30日前在多个核心产品团队撤销Claude Code许可证,要求工程师改用自家GitHub Copilot CLI,此前数千名员工已使用该工具近半年。
《纽约时报》长篇调查揭示硅谷AI从业者对就业前景的集体焦虑,与中国年轻人对AI取代工作持无所谓态度形成鲜明反差,背后折射出两国劳动力市场结构与政策环境的根本差异。
开源AI助手平台OpenClaw发布v2026.5.12版本,将OpenAI模型的推理、工具调用和上下文管理整体移交给Codex运行时,以解决工具膨胀问题并实现动态按需加载。
xAI并入SpaceX后遭遇严重人才危机,预训练团队几近瓦解,逾50名核心研发人员相继离开,竞争对手纷纷吸纳这些顶尖AI人才。
人工智能公司OpenAI因不满与苹果长达两年的ChatGPT整合合作未能带来预期收益,已聘请外部律所研究法律方案,可能向苹果发出违约通知。
OpenAI 宣布将代码代理工具 Codex 深度整合进 ChatGPT 移动端,用户可通过手机远程监控并接管运行在电脑或云端的开发任务,解决长时间自动化开发中的人工审批瓶颈问题。
AI 公司 Anthropic 发布政策报告,将中国大模型的蒸馏行为定性为系统性工业间谍活动,要求美国国会立法禁止,并点名阿里、字节跳动通过东南亚数据中心规避芯片禁令。
AI训练自动化公司Adaption Labs发布AutoScientist系统,可在5千至10万条数据规模下自动完成模型微调,性能平均超越人类研究员配置35%。
头部AI应用正通过自训练专属模型替代大厂通用API,在垂直场景实现性能超越的同时将运行成本降至十分之一,独有的用户交互数据正成为新型护城河。
OpenAI将在9月1日对ChatGPT进行重大改版,用结构化话题档案替代现有碎片记忆,并新增苹果深度集成、财务功能等多端接入能力。
开发者曝光谷歌正在内测一款名为Gemini Spark的24小时全时AI助手,能够跨应用执行多步骤任务,但隐私风险引发关注。
微软与马斯克旗下SpaceX正在AI领域展开激烈人才争夺,双方竞争焦点转向估值超10亿美元的斯坦福初创公司Inception,背后折射出微软与OpenAI合作关系的实质性松动。
GPU算力与部署平台Modal正在洽谈新一轮融资,目标估值45亿美元,较去年9月融资估值溢价约80%,公司年化收入已突破3亿美元,主要受益于AI Agent沙盒需求的爆发式增长。
AI评测机构Vals AI发布的第二代金融智能体基准测试显示,即使是最强AI模型在模拟初级金融分析师工作流时准确率也未超过52%,暴露出当前AI在金融深水区与人类专业水平仍有显著差距。