谷歌 DeepMind 发布 Gemini 科学探索平台：多智能体自主提假说

Google DeepMind 在官方账号发出基于 Gemini 的科学探索平台，把原先散落在 AlphaFold、AlphaProteo、AlphaEvolve 等垂直项目里的 agent 能力整合成一个通用工作台，由多个智能体分工跑文献综述、假设生成、实验设计三段流程。谷歌科学探索工具给出的演示是从一个空白研究问题起步，5 分钟内输出可执行的实验提案。

三类核心 agent：文献检索 agent 负责扫 arXiv 与 PubMed，假设生成 agent 跑 chain-of-thought 提多组候选，实验设计 agent 把假设落到具体方案
智能体间通过结构化消息总线协作，每一步推理留有可审计的中间产物
底座是 Gemini 2.5 Pro，长上下文支持单次塞进 200 万 token 级别的领域文献
初期开放给生命科学、材料科学、气候建模三个领域的合作实验室

真正的影响在前端的「冷启动周」

Google DeepMind Gemini 科学探索平台 — Gemini 多智能体科学探索平台首批向生命科学、材料科学、气候建模实验室开放。

科学研究里最难规模化的不是跑实验，是从「我有一个模糊感觉」到「我有 10 个值得做的具体假设」这一段。Google DeepMind CEO Demis Hassabis 在配套博客里强调：「我们不是要替科学家做研究，是把那些应该自动化的早期筛选拿掉，让人类研究者把时间花在判断和设计上。」DeepMind 内部测试给出的数据是：在蛋白质设计任务上，从问题陈述到首批 50 个候选方案的时间从平均 5 个工作日降到 1 个。

需要观察的点是「假说质量」而不是「假说数量」

多智能体生成假设的最大风险是看起来都合理，实际有效命中率远低于人类专家——Stanford HAI 在去年 12 月一份对类似系统的评估里就指出，AI 提出的假说在新颖性维度容易高分，在可验证性维度往往掉队。Gemini 这套平台真正要回答的问题是：在 50 个候选方案里，被实验科学家选中走进湿实验室的比例能稳定在多少。这个数据 DeepMind 还没公开。三个合作领域接下来半年的论文产出，是观察这个平台是不是真有用的最直接信号。

参考链接

谷歌科学探索工具

谷歌发布基于 Gemini 的科学探索平台

真正的影响在前端的「冷启动周」

需要观察的点是「假说质量」而不是「假说数量」

相关推荐