MindWave AI快报 聚合 AI 前沿动态,筛出值得关注的信号。

Grok Imagine Agent Mode 登陆 iOS:多步图像生成能力正式开放

xAI 为 Grok iOS 应用推出 Imagine Agent Mode,通过多步创意工作流实现跨代角色一致性与电影级视觉叙事,首批面向 Grok 与 X Premium 订阅用户开放。

References

Grok iOS 应用界面
Grok AI 助理 App Store 页面 Image source

xAI 旗下 AI 助手 Grok 的高阶图像生成功能 Imagine Agent Mode 已正式登陆 iOS 客户端。据 Basenor 报道,这项功能基于 Grok 图像生成引擎开发,该引擎已支撑超过 3 亿次图像生成,此次通过 Agent Mode 将能力进一步扩展至需要复杂工作流的创作者场景。

与传统的单次提示词交互不同,Agent Mode 引入了多步创意工作流。依靠自主规划与迭代机制,用户可以在画布中连续生成、编辑并优化图像资产,实现更高级别的创意控制。

iOS 版本的核心升级集中在四个技术维度:

  • 跨代角色一致性:在多次生图中精准保持人物面部与体型特征,适合连载内容创作
  • 同角色多场景延展:可将同一设定的角色放置在不同故事情节中
  • 多镜头视角与环境控制:支持指定特写或全景机位,并可调整环境光影
  • 电影级视觉叙事表达:生成画面在色调与质感上贴近专业故事板

用户可直接在 Grok iOS 应用的输入框旁开启 Agent 开关。功能界面内置了历史故事、虚拟试穿、角色概念等专区入口,方便不同创作需求的用户快速上手。

值得注意的是,Agent Mode 此前已在网页端开放 beta 测试。此次 iOS 版本延续了移动端优化体验,界面专为移动操作设计,用户可随时随地使用复杂的多步图像生成流程。

目前,该功能面向 Grok 与 X Premium 订阅用户开放,普通用户需订阅相关服务方可使用。