web-supplemented 2026-05-29 16:27 MiniMax-M2.7

谷歌 Gemini 大规模更新：Flash-Lite 免费、订阅用户视频额度翻倍

谷歌宣布 Gemini App 上线六项额度优化措施，包括轻量级模型 Flash-Lite 完全免费、订阅用户视频生成额度翻倍等功能，旨在解决用户反映的使用限额消耗过快问题。

googlegeminiaiflash-litequota优化

References

谷歌 Gemini 上线六项额度优化，直击用户「限额焦虑」

近日，谷歌 AI 助手 Gemini 因使用限额消耗过快、缺乏可预测性而遭受大量用户投诉。5 月 29 日，谷歌 Gemini 产品副总裁 Josh Woodward 宣布，团队正在紧急推出六项额度优化措施，全面改善用户体验。

1. Flash-Lite 完全免费

最受关注的改动是轻量级模型 Flash-Lite 的全面免费——用户向该模型发送的所有提示词将不再扣除任何日常使用限额。此举与此前Threads 用户反映的「免费 Tier API 配额被大砍」形成鲜明对比，Flash-Lite 的免费策略被视为谷歌吸引轻度用户的重要举措。

2. 视频扣额修复，订阅用户额度翻倍

多模态视频场景下的额度计算 Bug 已获修复，Gemini Ultra 订阅用户的 Omni 视频生成限额同步提升至原来的两倍。

3. 复杂 Pro 提示词设上限

携带大型文件附件或超长提示词的单个 Pro 模型请求将设立扣除上限，避免高消耗请求“一口吃光”日常额度的情况。

4. 失败请求免计费

网络延迟与系统错误导致的失败请求不再扣费，用户只为成功生成的结果支付限额。

5. 重度任务用量可视化

Deep Research 等高算力任务将配备更详细的用量仪表盘和透支预警机制，提升高负载操作的可控性。

6. 模型选择自动记忆

系统将自动锁定并记忆用户手动选定的具体模型，避免在后续会话中强制切换至轻量版本。

此前，有用户在社区反映 Gemini 2.5 Pro 的免费 Tier 已无法使用，2.5 Flash 的每日配额从 250 次骤降至 20 次，引发广泛争议。谷歌此次大规模优化可视为对上述批评的直接回应。

Gemini 3.1 Flash-Lite 作为主打「极速与省成本」的轻量级模型，在性能与成本控制上具备明显优势。此次免费策略的推出，标志着谷歌在 AI 助手市场的竞争策略正从「高大全」向「精准分层」转型。