web-supplemented 2026-06-03 17:44 MiniMax-M2.7

LangChain 为 Deep Agents 推出 RubricMiddleware：让 AI Agent 学会自检与修正

LangChain 在 Deep Agents 框架中新增 RubricMiddleware 组件，通过预设验收标准让 AI Agent 自我评估并迭代修正输出，弥补长任务执行中常见的「差最后一步」问题。

langchaindeep-agentsai-agentrubricmiddlewarellm人工智能

References

LangChain 为 Deep Agents 推出 RubricMiddleware：让 AI Agent 学会自检与修正

AI Agent 在执行复杂、多步骤任务时，往往��完成大部分工作，却在最后一步功亏一篑——漏掉测试用例、缺失报告章节、格式不规范、忘记引用来源。这些问题并非 Agent 能力不足，而是缺少一套明确的「完成标准」来驱动它自我检验。

针对这一痛点，LangChain 在 Deep Agents 框架中正式引入了 RubricMiddleware 组件，为 AI Agent 打造了一个内置的自动质检员。

工作原理：预设标准 + 自我评审 + 迭代修正

开发者只需为任务定义一套清晰的「评分规则」（Rubric），例如：

代码必须通过所有单元测试
报告须覆盖指定章节
回答中不能出现禁用词汇
俳句的音节数必须正确

当 Agent 准备交付结果时，系统会自动调用评审模型（Evaluator）逐项检查。只要有任何一项未达标，反馈即返回给原 Agent 进行修改，直至通过检查或达到预设的迭代上限。

解决「差最后一步」问题

Deep Agents 是 LangChain 在 2025 年推出的元工具包（meta-toolkit），专门用于构建具有规划、记忆和子代理协作能力的长时序 AI Agent。RubricMiddleware 的加入，使 Agent 不再仅仅「生成一个看起来差不多的答案」，而是可以像一个严格按 checklist 交活的执行者一样工作。

适用场景

根据 LangChain 官方文档，该机制最适合具有明确验收标准的任务类型：

代码开发：重构后测试是否全部通过
文档撰写：报告是否包含所有必需部分
内容生成：是否符合格式、风格、引用规范
结构化输出：JSON 或特定格式的字段是否完整

与传统 RAG 和 Agent 的区别

传统的 LangChain 1.0 主要解决模型对接、提示词和 RAG（检索增强生成）问题；LangGraph 则负责 Agent 状态编排和流程控制。Deep Agents 在此基础上更进一步，通过 RubricMiddleware 实现了结果质量控制的闭环，让 Agent 的输出从「尽力而为」升级为「达标交付」。

对于需要在生产环境中部署可靠 AI Agent 的开发者而言，RubricMiddleware 提供了一种低侵入、可配置的质控方案，无需为每个任务单独编写验证逻辑。

LangChain 为 Deep Agents 推出 RubricMiddleware：让 AI Agent 学会自检与修正

工作原理：预设标准 + 自我评审 + 迭代修正

解决「差最后一步」问题

适用场景

与传统 RAG 和 Agent 的区别

相关文章