AI初创SubQ发布次二次方大模型:1200万token上下文,算力消耗骤降千倍
AI基础设施初创公司SubQ发布首个基于次二次方稀疏注意力架构的大模型SubQ,宣称在1200万token规模下计算量削减近千倍,并声称在多项基准测试中超越Claude Opus 4.6和GPT-5.4。
聚合 AI 前沿动态,筛出值得关注的信号。
AI基础设施初创公司SubQ发布首个基于次二次方稀疏注意力架构的大模型SubQ,宣称在1200万token规模下计算量削减近千倍,并声称在多项基准测试中超越Claude Opus 4.6和GPT-5.4。
开源推理引擎 SGLang 背后的团队正式成立公司 RadixArk,获得由 Accel 和 Spark Capital 领投的 1 亿美元种子轮融资,同时获得英伟达、AMD、联发科等芯片厂商投资。
OpenAI将售罄的GPT-5.5线下派对转化为面向8000名开发者的月度Codex额度赠送活动,以应对Anthropic在AI编码助手市场的强势竞争。
AI语音平台ElevenLabs年化经常性收入在4个月内从3.5亿美元增长至5亿美元,完成D轮第三次交割,吸引了BlackRock、英伟达及多位好莱坞明星投资人。
持牌保险公司Corgi发布模块化AI保险产品,为企业在生产环境中部署AI系统提供责任保障,填补传统技术险无法覆盖的AI新风险空白。
谷歌、微软及xAI与美国商务部签署协议,同意在AI模型公开发布前接受政府安全评估,至此美国五家头部AI企业已全部加入这一pre-release审查机制。
字节跳动旗下AI编程产品TRAE SOLO推出移动端,用户可通过手机远程操控电脑执行开发任务,并实现跨设备工作接续,标志着AI工作助手进入"口袋时代"。
开源AI助手框架OpenClaw发布新版本,语音Agent全面接入Google Meet与Twilio电话,通过Gemini实时语音桥实现分段音频流传输,显著提升语音响应速度。
天风国际分析师郭明錤更新产业调查,指出OpenAI正加速开发首款AI Agent手机,目标最快2027年上半年量产,联发科有望独家取得处理器订单。
OpenAI工程团队近日公开了支撑ChatGPT语音及Realtime API的底层WebRTC架构设计,采用无状态relay与有状态transceiver分层方案,解决了Kubernetes环境下的高并发端口暴露难题,并聘请了WebRTC协议原始架构师Justin Uberti加盟。
谷歌为 Gemini API 推出事件驱动的 Webhook 推送机制,使 Deep Research、长视频生成等耗时长任务完成后能即时向开发者服务器发送 HTTP POST 通知,无需反复轮询查询进度。
Anthropic 在 Code with Claude 开发者大会上正式发布 Orbit,这是一款面向 Claude Cowork 的主动式简报助手,可连接 Gmail、Slack、GitHub、Calendar、Drive 和 Figma 等六大工作工具,为开发者和设计师提供个性化每日简报。
据《华尔街日报》报道,OpenAI CEO阿尔特曼去年曾讨论将机器人和消费硬件部门独立拆分以减轻核心业务负担,但因认定新实体仍需并入母公司报表而未能实现,此举折射出该公司IPO过程中面临的战略取舍。
AI评估平台Andon Labs发布新版空间推理基准测试,首次记录到大语言模型从2D室内照片中理解真实三维空间的迹象,GPT-5.5、Gemini 3.1 Pro和Claude Opus 4.7位列前三。
彼得·蒂尔领投美国初创公司Panthalassa 1.4亿美元B轮融资,利用海洋波浪能为漂浮AI数据中心供电,估值接近独角兽级别,该公司计划2027年启动商业部署。
两位曾分别在拜登和特朗普政府担任白宫AI特别顾问的专家在《纽约时报》发文,揭示GPT-5.4和Claude Mythos等前沿模型已超越领域专家,并呼吁美国两党合作应对AI国家安全风险。
由OpenAI董事长Bret Taylor联合创办的AI客服平台Sierra完成史上最大单笔融资,以158亿美元估值成为企业AI Agent领域的领军者。
OpenAI在App Store上架了一款专为学校和企业设计的ChatGPT for Intune独立应用,原生支持微软Intune统一终端管理协议,解决大型企业员工在受管控设备上无法合规使用AI功能的核心痛点。