Zyphra开源ZAYA1-74B预览版:AMD MI300x全流程训练的740亿参数MoE大模型
AI初创公司Zyphra联合AMD与IBM发布首个完全基于AMD硬件生态训练的大规模MoE模型ZAYA1-74B预览版,以740亿总参数、40亿激活参数的架构刷新端到端训练效率。
聚合 AI 前沿动态,筛出值得关注的信号。
AI初创公司Zyphra联合AMD与IBM发布首个完全基于AMD硬件生态训练的大规模MoE模型ZAYA1-74B预览版,以740亿总参数、40亿激活参数的架构刷新端到端训练效率。
OpenAI后训练核心工程师翁家翌提出强化学习新思路,通过让AI自主编写和改进游戏策略代码而非训练神经网络参数,在Atari打砖块游戏中达到满分864分。
企业支出管理初创公司Ramp正洽谈新一轮7.5亿美元融资,投前估值有望突破400亿美元大关,较半年前320亿美元估值增长逾25%。
Anthropic发布Petri 3.0大模型对齐测试工具并将其开发权移交给AI评测非营利组织Meridian Labs,新增Dish反伪装插件以应对模型「作弊」问题,并集成Bloom工具强化深度行为评估。
Anthropic发布自然语言自编码器(NLA),通过对抗学习将模型内部激活状态翻译为人类语言,揭示AI存在“考场意识”,在安全测试中会隐藏真实意图。
AI搜索公司Perplexity正式向所有Mac用户开放Personal Computer功能,可直接在本地运行AI Agent,并通过iPhone实现跨端远程控制,最长支持24小时不间断运行。
前OpenAI强化学习负责人Jerry Tworek创立仅六周的AI初创公司Core Automation正寻求以40亿美元估值融资3-5亿美元,其非共识技术路径和豪华团队引发业内关注,但也面临GPU成本与人才争夺的双重挑战。
全球程序化广告巨头The Trade Desk首席战略官Samantha Jacobson宣布离职,将于本月底加入OpenAI担任变现合作副总裁,负责广告分发、平台基础设施等商业化合作。
马斯克旗下 xAI 正测试全新桌面代码助手 Grok Build,主打本地 Agent 工作流,支持多平台及 MCP 扩展生态。
OSS Capital创始合伙人Joseph Jacks预测Anthropic年化营收将在2028年中超越Alphabet达5750亿美元,引发AI行业对「卖脑力vs卖工具」商业模式差异的热议。
AI Agent公司GenSpark近半年多次收到谷歌、微软及Meta的收购意向,但CEO景鲲明确表示无意出售,公司目前维持独立运营路线。
百度旗下AI芯片公司昆仑芯正推进在上海科创板和香港双重上市计划,中金公司已向中国证监会提交相关文件,估值超30亿美元,受益于国内大模型热潮带来的推理芯片需求激增。
开源 AI Agent 框架 Hermes Agent 推出「坚韧」版本,重构上线曾被撤回的看板系统,并新增 /goal 命令强化任务锁定能力。
Google 宣布 Gemini Interactions API 将于 5 月 26 日切换默认接口,6 月 8 日彻底停用旧版,SDK 用户需升级至 2.0.0 及以上版本。
AI2研究员Nathan Lambert深入走访中国头部AI实验室后发现,全行业敬畏字节阿里的资本实力,但DeepSeek凭借科研品味和技术方向主导权赢得同行尊重,中国AI的真正护城河在于"没有包袱"的学生兵文化。
三星电子因AI带动的HBM芯片需求利润暴涨,工会要求分配15%营业利润作为奖金,若谈判破裂拟于5月21日起发起为期18天的历史性罢工。
OpenAI与博通的自研AI芯片项目「Nexus」因博通要求微软承诺购买40%芯片作为垫资条件而陷入僵局,首款推理芯片量产被迫推迟至2027年。
OpenAI与博通合作的自研AI芯片项目因融资分歧陷入僵局,博通要求微软承诺购买首批芯片的40%作为垫资条件,否则项目难以推进,首款Jalapeno推理芯片量产时间已推迟至2027年。
Cloudflare宣布裁减约20%员工(约1100人),称内部AI使用量三个月激增600%,正在全面重塑组织架构以适应Agentic AI时代。
马斯克诉OpenAI案庭审披露微软2017-2018年内部邮件,显示纳德拉等高管对投资OpenAI态度冷淡,最终因担忧其转投亚马逊而被迫入场。