AllenAI 开源 EMO 模型:打破 MoE 部署壁垒,75% 参数裁剪性能仅降 1%
AllenAI 发布开源 MoE 新范式 EMO,通过文档级专家分组机制实现模型模块化,允许按领域独立部署专家子模型,大幅降低端侧部署门槛。
聚合 AI 前沿动态,筛出值得关注的信号。
AllenAI 发布开源 MoE 新范式 EMO,通过文档级专家分组机制实现模型模块化,允许按领域独立部署专家子模型,大幅降低端侧部署门槛。
Anthropic发布最新对齐研究,详细披露了通过「困难建议」数据集、合成文档微调和提升训练环境多样性三种方法,将Claude模型的「智能体失齐」行为完全消除。
MiniMax技术团队通过排查模型无法输出人名「马嘉祺」的个案,发现近5%词表token在后训练阶段发生显著退化,其中日语退化最严重达29.7%,通过全词表复读训练修复后输出稳定度从0.329升至0.97以上。
蚂蚁集团于5月9日发布万亿参数思考模型Ring-2.6-1T,首次引入可调节的「动态思考强度」机制,通过high与xhigh两档运行模式兼顾效率与深度推理性能,在多项基准测试中超越GPT-5.4和Gemini-3.1-Pro。
Anthropic首任CFO Krishna Rao以反直觉的保守融资策略闻名,一边拒绝市场最高估值,一边面临Claude Code爆火带来的算力锁单抉择。
Google宣布將Fitbit App升級為Google Health,並推出全新Google Health API,整合超過100個舊版端點、31種核心健康數據點,全面遷移至Google Cloud架構,舊版Fitbit Web API將於2026年9月正式關停。
谷歌DeepMind任命芝加哥大学布斯商学院教授Alex Imas为AGI经济学总监,直接向联合创始人Shane Legg汇报,研究通用人工智能对经济系统的深远影响。
Anthropic Claude Code团队成员Thariq宣布已完全停用Markdown,改用AI生成HTML进行日常开发,认为HTML在信息密度和交互性上更胜一筹。
在马斯克起诉OpenAI案中,OpenAI总裁Greg Brockman保存近十年的私人日记被作为法庭证据公开,其中部分内容显示他在2017年曾写下从马斯克处获利的计划,引发硅谷热议。
中国AI行业的爆发正在扭转商业地产颓势,DeepSeek与阿里巴巴的AI转型推动杭州、深圳等科技枢纽甲级写字楼空置率从峰值30%回落至20%左右。
开源AI Agent项目Hermes Agent以2710亿Token单日用量超越OpenClaw,登顶OpenRouter全球应用排行榜,代码与自动化工具占据榜单前四位。
AI 初创公司 Anthropic 与 Akamai 签署为期七年的云服务协议,总金额高达 18 亿美元,创下 Akamai 史上最大单笔交易纪录,带动其股价单日暴涨近三成。
根据Epoch AI最新报告,AI公司Anthropic人均创收约900万美元,领先OpenAI约六成,已超越《福布斯》全球企业2000强中的所有科技公司,标志着AI产业正以突破传统软件企业极限的资本效率重塑产业格局。
苹果与英特尔签署芯片代工初步协议,标志着苹果减少对台积电依赖的战略迈出重要一步,美国政府在其中发挥了关键的撮合作用。
AI独角兽DeepSeek开始从字节跳动等中国科技公司招募产品研发人才,补齐模型商业化的短板,与此前核心研究员被大厂高薪挖走的逆向流动引发行业关注。
据多方消息源透露,DeepSeek与阿里巴巴及腾讯的融资谈判均未能达成一致,核心分歧在于投资方寻求生态整合,而DeepSeek坚持独立发展路线。
xAI在SpaceX收购Cursor选项落地后出现剧烈人事震荡,Mistral联创Devendra Chaplot入职仅一个月便离职,GroK团队亦遭裁员,Cursor员工已开始接管部分内部业务。
阶跃星辰推出端到端实时语音大模型StepAudio 2.5 Realtime,在五项评测中全部第一,主观体验得分80.41,超越GPT-Realtime-1.5近18个百分点。
中国AI独角兽DeepSeek首轮外部融资浮出水面,估值从数周前的200亿美元飙升至超515亿美元,创始人梁文锋个人出资近四成,国家大基金预计成为第二大投资方。
美国四大科技巨头今年AI基础设施投资高达7250亿美元,导致季度自由现金流从疫情以来均值450亿美元骤降至约40亿美元,迫使Alphabet、Meta停回购发债,微软、亚马逊疯狂堆重资产.