阿里云百炼Qwen3.7-Max上线自动隐式缓存,输入成本最高减免80%
阿里Qwen团队宣布在阿里云百炼平台为旗下旗舰模型Qwen3.7-Max默认开启自动隐式缓存功能。开发者无需修改代码或额外指定参数,系统即可自动识别并提取请求中的重复上下文前缀,一旦发生缓存命中,命中部分的输入token费用仅按原单价的20%收取,直接减免八成输入成本。
瞄准长上下文与Agent场景的高额开销
Qwen3.7-Max拥有100万tokens长上下文窗口,在运行自主编码等高阶任务时需要高频、重复读取庞大的代码库或知识文档。据开发者反馈,仅花不到一小时构建坦克大战网页demo,就消耗了近100万tokens。若放手让智能体在后台自主执行代码审查与循环迭代,单日用量轻松冲上数亿tokens,自动隐式缓存正是针对这一痛点而生。
双模式并行:隐式缓存与显式缓存
除自动缓存外,Qwen3.7-Max还保留了需要手动声明cache_control标识的显式缓存模式。相比于自动缓存,显式缓存的命中确定性更高,命中费用低至标准输入单价的10%(一折),但首次创建缓存时需支付125%的溢价,且缓存块仅有5分钟生命周期(每次发生命中可重新计时)。
定价背景:API价格与市场定位
根据公开信息,Qwen3.7-Max在百炼平台的API调用价格为输入12元/百万Tokens、输出36元/百万Tokens。阿里云于2026年5月20日在杭州举办的阿里云峰会上正式发布Qwen3.7-Max,这是国内云厂商首次围绕Agent场景进行全栈产品发布,标志着国产大模型正式迈入智能体时代。阿里云资深副总裁刘伟光当时表示,Agent突破临界点后可24小时不间断工作,对AI和云的需求无穷无尽。
(注:部分竞争对标定价及第三方工具相关信息来自Telegram信源,暂无法通过公开网络检索独立验证。)