谷歌 Gemini 上线六项额度优化,直击用户「限额焦虑」
近日,谷歌 AI 助手 Gemini 因使用限额消耗过快、缺乏可预测性而遭受大量用户投诉。5 月 29 日,谷歌 Gemini 产品副总裁 Josh Woodward 宣布,团队正在紧急推出六项额度优化措施,全面改善用户体验。
核心更新一览
1. Flash-Lite 完全免费
最受关注的改动是轻量级模型 Flash-Lite 的全面免费——用户向该模型发送的所有提示词将不再扣除任何日常使用限额。此举与此前Threads 用户反映的「免费 Tier API 配额被大砍」形成鲜明对比,Flash-Lite 的免费策略被视为谷歌吸引轻度用户的重要举措。
2. 视频扣额修复,订阅用户额度翻倍
多模态视频场景下的额度计算 Bug 已获修复,Gemini Ultra 订阅用户的 Omni 视频生成限额同步提升至原来的两倍。
3. 复杂 Pro 提示词设上限
携带大型文件附件或超长提示词的单个 Pro 模型请求将设立扣除上限,避免高消耗请求“一口吃光”日常额度的情况。
4. 失败请求免计费
网络延迟与系统错误导致的失败请求不再扣费,用户只为成功生成的结果支付限额。
5. 重度任务用量可视化
Deep Research 等高算力任务将配备更详细的用量仪表盘和透支预警机制,提升高负载操作的可控性。
6. 模型选择自动记忆
系统将自动锁定并记忆用户手动选定的具体模型,避免在后续会话中强制切换至轻量版本。
背景:用户积怨已久
此前,有用户在社区反映 Gemini 2.5 Pro 的免费 Tier 已无法使用,2.5 Flash 的每日配额从 250 次骤降至 20 次,引发广泛争议。谷歌此次大规模优化可视为对上述批评的直接回应。
Gemini 3.1 Flash-Lite 作为主打「极速与省成本」的轻量级模型,在性能与成本控制上具备明显优势。此次免费策略的推出,标志着谷歌在 AI 助手市场的竞争策略正从「高大全」向「精准分层」转型。