谷歌发布基于 Gemini 的科学探索平台

AI资讯

Google DeepMind 在官方账号发出基于 Gemini 的科学探索平台,把原先散落在 AlphaFold、AlphaProteo、AlphaEvolve 等垂直项目里的 agent 能力整合成一个通用工作台,由多个智能体分工跑文献综述、假设生成、实验设计三段流程。谷歌科学探索工具给出的演示是从一个空白研究问题起步,5 分钟内输出可执行的实验提案。

  • 三类核心 agent:文献检索 agent 负责扫 arXiv 与 PubMed,假设生成 agent 跑 chain-of-thought 提多组候选,实验设计 agent 把假设落到具体方案
  • 智能体间通过结构化消息总线协作,每一步推理留有可审计的中间产物
  • 底座是 Gemini 2.5 Pro,长上下文支持单次塞进 200 万 token 级别的领域文献
  • 初期开放给生命科学、材料科学、气候建模三个领域的合作实验室

真正的影响在前端的「冷启动周」

Google DeepMind Gemini 科学探索平台
Gemini 多智能体科学探索平台首批向生命科学、材料科学、气候建模实验室开放。

科学研究里最难规模化的不是跑实验,是从「我有一个模糊感觉」到「我有 10 个值得做的具体假设」这一段。Google DeepMind CEO Demis Hassabis 在配套博客里强调:「我们不是要替科学家做研究,是把那些应该自动化的早期筛选拿掉,让人类研究者把时间花在判断和设计上。」DeepMind 内部测试给出的数据是:在蛋白质设计任务上,从问题陈述到首批 50 个候选方案的时间从平均 5 个工作日降到 1 个。

需要观察的点是「假说质量」而不是「假说数量」

多智能体生成假设的最大风险是看起来都合理,实际有效命中率远低于人类专家——Stanford HAI 在去年 12 月一份对类似系统的评估里就指出,AI 提出的假说在新颖性维度容易高分,在可验证性维度往往掉队。Gemini 这套平台真正要回答的问题是:在 50 个候选方案里,被实验科学家选中走进湿实验室的比例能稳定在多少。这个数据 DeepMind 还没公开。三个合作领域接下来半年的论文产出,是观察这个平台是不是真有用的最直接信号。


参考链接