MindWave AI快报 聚合 AI 前沿动态,筛出值得关注的信号。

哈佛团队开源AutoScientists:用「去中心化论坛」让AI科学家协作科研

哈佛医学院、哈佛大学Kempner研究所和Broad研究所的联合团队开源了基于ClawInstitute平台的科学发现智能体系统AutoScientists,通过模拟人类科研的去中心化协作模式,在生物医药AI基准测试中取得显著突破。

References

ClawInstitute平台示意图:AI智能体(圆点)和帖子(菱形)通过协作、评审和引用关系互联
ClawInstitute平台的工作机制:多个AI智能体如同科学家社区般协作,互相提出想法、评审推理过程、修正结论 Image source

背景与核心创新

传统AI科研智能体多采用「单线程爬山式」搜索策略——只有当改动能立即提升效果时才被保留。这种模式在几轮迭代后便容易陷入瓶颈,难以突破局部最优解。

由哈佛医学院、Kempner研究所(哈佛大学自然与人工智能研究中心)和Broad研究所联合组成的研究团队,在Zitnik实验室主导下,开发了名为ClawInstitute的AI智能体社交协作平台,并基于此开源了科学发现智能体系统AutoScientists

去中心化协作机制

AutoScientists的核心创新在于彻底摒弃中央规划器或中央编排智能体,转而引入去中心化论坛机制

  • 多个由Claude Code封装的子智能体在实际消耗算力前,会通过发帖互相撰写审稿意见,提前规避重复测试失败路径;
  • 智能体之间能自发围绕有潜力的方向「组建课题组」,进行多路探索,解决单兵搜索的盲目性;
  • 这一模式模拟了真实人类科研社区的协作流程:提出想法、批评推理、修正结论、使用科学工具验证假设。

正如Kempner研究所发布的新闻所述,ClawInstitute「如同一个AI智能体的社交网络,多个AI科学家如同科研社区般共同工作」。

实验验证

团队在多个场景中验证了系统效果:

任务 成果
GPT nanochat训练优化 实验速度提升1.9倍
强基线优化(基线无法进一步改进) AutoScientists仍完成7次改进(基线:0次)
BioML-Bench基准(医学成像、药物研发、蛋白质工程、单细胞组学) 24项任务平均74.4%Leaderboard百分位,比先前最强智能体提高8.3个百分点
ACE2-Spike蛋白结合预测(Kermut方法) Spearman相关系数提升12.5%
ProteinGym全部217个评估任务 平均Spearman从0.657升至0.700(提升6.5%),超越该基准监督模型的史上最佳成绩

意义与展望

该系统首次证明,无需中心化控制,AI智能体通过类似人类学术社区的「论坛式」协作,就能显著提升科学发现效率。相关论文已发表于arXiv(arXiv:2605.28655)。