web-supplemented 2026-05-26 12:32 MiniMax-M2.7

阿里云百炼Qwen3.7-Max上线自动隐式缓存，输入成本最高减免80%

阿里云百炼平台为旗舰模型Qwen3.7-Max默认开启自动隐式缓存功能，缓存命中部分的输入token费用降至原价的20%，直接减免八成输入成本，瞄准长文本与Agent智能体场景的高额开销痛点。

阿里云Qwen3.7-Max百炼平台隐式缓存大模型定价AI智能体成本优化

References

阿里云百炼Qwen3.7-Max上线自动隐式缓存，输入成本最高减免80%

阿里Qwen团队宣布在阿里云百炼平台为旗下旗舰模型Qwen3.7-Max默认开启自动隐式缓存功能。开发者无需修改代码或额外指定参数，系统即可自动识别并提取请求中的重复上下文前缀，一旦发生缓存命中，命中部分的输入token费用仅按原单价的20%收取，直接减免八成输入成本。

瞄准长上下文与Agent场景的高额开销

Qwen3.7-Max拥有100万tokens长上下文窗口，在运行自主编码等高阶任务时需要高频、重复读取庞大的代码库或知识文档。据开发者反馈，仅花不到一小时构建坦克大战网页demo，就消耗了近100万tokens。若放手让智能体在后台自主执行代码审查与循环迭代，单日用量轻松冲上数亿tokens，自动隐式缓存正是针对这一痛点而生。

双模式并行：隐式缓存与显式缓存

除自动缓存外，Qwen3.7-Max还保留了需要手动声明cache_control标识的显式缓存模式。相比于自动缓存，显式缓存的命中确定性更高，命中费用低至标准输入单价的10%（一折），但首次创建缓存时需支付125%的溢价，且缓存块仅有5分钟生命周期（每次发生命中可重新计时）。

定价背景：API价格与市场定位

根据公开信息，Qwen3.7-Max在百炼平台的API调用价格为输入12元/百万Tokens、输出36元/百万Tokens。阿里云于2026年5月20日在杭州举办的阿里云峰会上正式发布Qwen3.7-Max，这是国内云厂商首次围绕Agent场景进行全栈产品发布，标志着国产大模型正式迈入智能体时代。阿里云资深副总裁刘伟光当时表示，Agent突破临界点后可24小时不间断工作，对AI和云的需求无穷无尽。

（注：部分竞争对标定价及第三方工具相关信息来自Telegram信源，暂无法通过公开网络检索独立验证。）

阿里云百炼Qwen3.7-Max上线自动隐式缓存，输入成本最高减免80%

瞄准长上下文与Agent场景的高额开销

双模式并行：隐式缓存与显式缓存

定价背景：API价格与市场定位

相关文章