Anthropic于本周初正式发布Claude Opus 4.8后,随即陷入一场因系统缺陷引发的用户信任危机。
据Anthropic官方开发者账号@ClaudeDevs于X平台发布的声明,官方已对全网Pro和Max订阅用户的5小时即时限额及每周使用额度进行全面重置。此举旨在补偿近日因系统故障导致Token被异常消耗的付费用户,同时官方确认故障已修复完毕。
问题根源:非动态工作流所致
此前,大量开发者在社交平台反映,在使用Claude Code时额度消耗速度异常迅速——仅进行数次简单交互,日用配额便宣告见底。开发者社区一度猜测这与新版动态工作流(dynamic workflows)功能有关,该功能因"powerful but expensive"的特性此前已受到官方提醒。
然而,官方在随后的技术说明中澄清了真实原因。故障核心在于系统对新版Opus 4.8请求的处理机制存在缺陷,导致模型在执行时触发了超出设计预期的并发工具调用,产生大量并行子智能体。这与动态工作流功能本身并无直接关联。
Agent时代的Token消耗隐忧
值得注意的是,这一事件折射出AI Agent系统在Token消耗方面的深层挑战。相较于传统聊天场景(每次消耗数百至数千Token),Agent型应用需要读取上下文、拆解任务、规划步骤、调用工具、执行代码、检查结果并可能并行启动多个子智能体,工作模式天然会导致Token消耗激增。
Claude Opus 4.8作为Anthropic专为代理工作设计的主力模型,默认启用高强度模式(high effort),更适合复杂任务但也更消耗配额。Anthropic已同步宣布Pro和Max用户使用限制即时翻倍,Peak Hours限制正式取消,Opus API限额同步提升,以缓解用户的用量焦虑。