web-supplemented 2026-05-19 16:51 MiniMax-M2.7

强化学习之父Sutton重申「苦涩的教训」引发AI路线之争

强化学习先驱Richard Sutton再次强调算力至上的「苦涩的教训」理念，与Gary Marcus等学者就大模型发展路径展开激烈辩论，隐性知识捕获问题成为焦点。

人工智能强化学习苦涩的教训Richard Sutton大模型Gary Marcus

References

强化学习之父Sutton重申「苦涩的教训」引发AI路线之争

强化学习先驱Richard Sutton近日再次强调算力至上的「苦涩的教训」理念，与Gary Marcus等学者就大模型发展路径展开激烈辩论。

核心争议：算力还是人类知识？

强化学习之父、2024年图灵奖得主Richard Sutton今日用26个英文单词重申其2019年提出的「苦涩的教训」观点，呼吁AI发展应聚焦于能随算力扩展的通用方法，而非被人类知识分散注意力。

这一论断再次引发学界强烈反响。知名AI评论家、认知科学家Gary Marcus直接反驳，在其Substack文章中指出，当前大模型仍极度依赖人类知识作为主要燃料，甚至已将人类知识编入系统提示词和超过50种定制工具中。Marcus援引Sutton在Dwarkesh播客中的观点称，Sutton本人也承认单纯扩展LLM无法创造出类似人类的通用智能。

机器学习奠基人Thomas G. Dietterich同样提出异议，他认为研究人类的抽象认知结构能为AI标定盲区，绝不该被视为一种「分心」。

「甜蜜的教训」：隐性知识成关键瓶颈

评论区引发关注的一篇长文《甜蜜的教训》为这场冲突提供了综合视角。The Innovation Game联合创始人兼首席科学家John Fletcher在文中指出了Sutton的战略盲区：AI的终局虽是纯算力，但在书面语料面临枯竭的当下，通向终局的路径无法绕开人类。

哈佛大学CS249R课程的研究指出，当前AI正面临一个关键瓶颈——**隐性知识（Tacit Knowledge）**问题。所谓隐性知识，是指专家大脑中从未被写下过的实践经验与直觉。产业当前拉开差距的打法，是通过打造顶级协同工具，高频捕获这些难以编码的专业知识。

跳过这一阶段直奔纯环境交互学习，在工程上并不切实际。

Sutton的最新立场

值得关注的是，Sutton本人在近期的播客访谈中也对LLM的局限性表达了担忧。他明确表示不相信单纯扩展大语言模型就能实现类似人类的通用智能，这与Marcus的批评形成了一定程度的共识。

这场辩论的核心，实际上反映了AI研究领域一个更深层的张力：一方面是追求通用性强、可扩展的算力驱动方法；另一方面是重视人类知识、领域专长的知识驱动路径。在语料资源日趋紧张的背景下，如何有效捕获和利用隐性知识，正成为AI产业突围的关键战场。

参考文献来源：Jiemian Global、Gary Marcus Substack、arXiv论文《Learning the Bitter Lesson》等。

强化学习之父Sutton重申「苦涩的教训」引发AI路线之争

核心争议：算力还是人类知识？

「甜蜜的教训」：隐性知识成关键瓶颈

Sutton的最新立场

相关文章