小米开源OmniVoice:0.84%中文WER、支持646种语言的零样本语音克隆模型
小米AI实验室k2-fsa团队发布开源多语言语音克隆TTS模型OmniVoice,以0.8B参数和58万小时开源数据训练实现646种语言的零样本语音合成,WER低至0.84%,推理速度比实时快40倍。
聚合 AI 前沿动态,筛出值得关注的信号。
小米AI实验室k2-fsa团队发布开源多语言语音克隆TTS模型OmniVoice,以0.8B参数和58万小时开源数据训练实现646种语言的零样本语音合成,WER低至0.84%,推理速度比实时快40倍。
Google Docs联合创始人Steve Newman分析指出,尽管AI各项基准测试和数据中心建设推动《AI 2027》预测完成度达65%,但最关键的"AI自我研发加速"指标仅完成17%,然而Anthropic营收暴涨与模型能力突破仍预示超级智能可能在近期出现。
OpenAI与Anthropic员工在X平台展开激烈辩论,围绕Anthropic对Claude的态度是否构成偶像崇拜展开交锋。
OpenAI研究副总裁Aidan Clark公开批评Anthropic员工流露的「独造AI」心态,引发双方多轮隔空交锋,多名Anthropic员工随后澄清或否认存在此类立场。
Anthropic于5月6日向Claude Desktop推送1.6259.1版本更新,在Gateway模式中引入模型ID白名单过滤机制,导致用户通过OpenRouter等第三方网关接入GPT、Grok、DeepSeek等非Claude模型的用法全部失效。
在马斯克起诉OpenAI案中,前CTO穆拉蒂视频证词曝光,直指她向董事会提供关键材料推动罢免Altman,事后却试图撇清关系,引发外界对OpenAI内部治理的广泛关注。
总部位于斯德哥尔摩的瑞典初创公司Pit正式亮相,致力于用AI为企业定制内部运营软件以替代Excel和僵化SaaS工具,获a16z领投的1600万美元种子轮融资。
Menlo Ventures合伙人Deedy Das更新AI「Neolab」名单至63家,总估值约3000亿美元,揭示风投正押注由顶级AI研究员创办、追求长期技术突破而非短期商业化的新型态创业公司。
OpenAI 因 3 月底 npm 供应链攻击影响,将于明日(5 月 8 日)正式吊销旧版 macOS 应用的签名证书,未更新用户需尽快升级。
马斯克起诉OpenAI一案庭审披露,2023年11月政变期间被解职的Altman曾向CTO Murati询问能否让微软收购OpenAI,同时微软CEO纳德拉对此态度暧昧。
Sourcegraph旗下编程Agent Amp发布代号Neo的CLI重构版,采用自动上下文管理替代手动Handoff机制,内存占用降低70%,并正式推出Plugin API。
xAI孟菲斯数据中心GPU利用率远低于目标,SpaceX以IPO为由将闲置算力出租给竞争对手Anthropic,被指既是变现手段也是上市叙事包装。
盛大集团创始人陈天桥创办的AI研究公司MiroMind因监管压力,将于5月12日暂停MiroThinker智能体服务在中国大陆、香港、澳门的运营,恢复时间另行通知。
Anthropic为Claude Managed Agents上线“做梦”功能,通过后台自动回顾历史会话提取跨任务模式,同时推出 Outcomes、Webhooks 和多 Agent 编排三项新能力,法律 AI 公司 Harvey 测试显示任务完成率提升约 6 倍。
xAI面向企业开发者推出Grok Imagine Quality Mode图像生成API,通过更深度推理路径实现照片级真实感、多语言文字渲染与品牌一致性。
埃隆·马斯克于5月6日宣布旗下人工智能公司xAI将不再作为独立实体存在,整体并入SpaceX并更名为SpaceXAI,成为SpaceX旗下AI产品线,标志着其“航天+AI”垂直整合战略进入新阶段。
AI推理基础设施公司无问芯穹宣布完成超7亿元新一轮融资,由杭州高新金投集团与惠远资本联合领投,创中国AI原生基础设施公司融资规模之最。
腾讯混元最新大模型Hy3 preview上线仅两周,Token调用量便飙至上一代Hy2的10倍,并在OpenRouter平台斩获调用量与市占率双榜第一,展现出强劲的市场竞争力与技术实力。
中美两国正就在5月习近平-特朗普北京峰会期间启动官方AI对话机制进行密集磋商,旨在为两国AI竞争建立护栏,防止技术失控引发双边及全球性危机。
火山引擎发布豆包大模型家族首款全模态理解模型Doubao-Seed-2.0-lite,在高阶视觉推理和语音识别多项基准上超越旗舰级模型,并强化Agent与GUI自动化能力。