
Reddit r/artificial 一个标题为”Multi-agent AI systems are now automating science”的讨论帖在 5 月 22 日热度持续上涨。发帖人引用了几篇近期论文,主要观点是:多智能体系统已经能自主完成一部分科研工作流——提出假设、设计实验、分析数据、迭代下一轮假设。讨论里被反复提到的具体例子包括 Stanford 一个材料科学 Agent 项目、MIT 一个化学反应路径自动搜索系统、以及 Google DeepMind 的 AI Scientist。
多 Agent 自动科研的实际能力边界
把”AI 自动做科学”这个命题拆开看,实际能跑通的环节有限但具体。文献综述、提出候选假设、批量做模拟实验、统计分析数据、写实验报告——这些是当前多 Agent 系统能做到 60% 以上自动化的环节。真正卡住的是物理实验本身(合成材料、培养细胞、运行加速器)和最终判断”这个发现是否重要”的科学品味。
讨论帖里被点赞最多的一条评论引用了几个数字:MIT 化学合成 Agent 在闭环操作下能在 24 小时内尝试上百种反应组合,是博士生人工的几十倍速度;Stanford 材料 Agent 在三个月里发现了几个有意思的金属化合物候选。这些数字真实存在,但需要区分:是”加速了实验筛选”还是”自己产出了科学发现”。前者已经做到,后者还差很远。
“科研效率提高一千倍”是讨论帖里被反复辩论的说法
发帖人原文用了”thousand-fold productivity increase”的表述。这个数字在讨论里被反对的声音不少。反对的核心论点是——科研效率不是单纯的实验通量。一个真正有意义的科学发现需要的不只是大量实验,还要有正确的问题、正确的假设、对结果的正确解读。这些环节里 Agent 的贡献远没有”千倍”那么夸张。
更靠谱的说法是”在某些可计算密集环节,Agent 能把人的时间从月级别压缩到天级别”,这是合理的提速倍数。把整个科研周期统一计算的话,速度提升可能在 5-10 倍之间。这仍然是巨大的变化,但不是”千倍”那种科幻级别。
Agent 自动科研对科研伦理体系的挑战
讨论帖里有一段评论指出了被忽视的层面——当 Agent 提出的假设被证实后,论文该怎么署名?这件事看似细节,实际是科研体系的根基。署名权决定了荣誉、基金、晋升、聘任。如果 Agent 的贡献被全部归功于背后的人类研究者,那么真正的”作者”就被隐藏了;如果 Agent 被列为合著作者,又会动摇”科研工作者”的传统定义。
这个问题不是哲学问题,是几年内就要做出制度化回答的实操问题。Nature 期刊已经在审稿要求里加入了”AI 工具使用披露”的栏目,ACL、NeurIPS 这些会议也在跟进。但披露和署名是两回事,前者只是透明度,后者关乎贡献分配。学术共同体在这件事上还没有共识。
真正的变化是科研工作的密度而不是发现速度
看完一圈讨论后比较冷静的判断是——多 Agent 自动科研最先改变的不是”科研发现速度”,而是”单个研究者的产出密度”。一个能熟练驱动 Agent 团队的研究者,可以同时推进十几个并行项目,每个项目都比过去做得更细致。这种工作方式的转变更像工业化早期工人变成机器操作员,从”亲手做每件事”转向”管理一组工具”。
这也意味着研究者的能力结构会被重新定义。过去一个好研究者要会做实验、写代码、分析数据;未来要在这些之上加一层 Agent 编排能力——选择哪些 Agent、设计什么任务、识别 Agent 输出里的错误。学不会这套新工作流的研究者会逐渐被边缘化。这一点比”AI 取代科学家”的恐慌叙事更现实,也更值得现在就开始适应。
参考资料:
- Reddit r/artificial 讨论帖,Multi-agent AI Systems Are Now Automating Science,2026-05-22