智能AI morning

LLM-AutoSciLab:通过法学硕士的主动实验进行闭环科学发现

2026-05-26 1 阅读 Sanchit Kabra, Nikhil Abhyankar, Saaketh Desai, Prasad Iyer, Chandan K Reddy
arXiv:2605.24043v1 公告类型:新 摘要:科学发现是一个闭环过程,其中假设指导数据采集,观察细化假设空间。然而,大多数方法将发现减少为对固定数据集的监督学习,其中有限的观察可以支持适合局部但无法泛化的多种合理机制。因此,关键的挑战是选择信息丰富的观察结果来解决不确定性,将重点从静态推理转移到自适应数据采集。为了解决这个问题,我们提出了 LLM-AutoSciLab,这是一个闭环框架,它将假设生成与假设条件实验选择和机制细化结合起来。 LLM-AutoSciLab 不是将模型与被动收集的数据进行拟合,而是迭代地提出合理的假设,选择信息丰富的实验来区分或完善它们,并使用生成的证据更新其状态。为了通过主动数据采集评估动态、闭环科学发现,我们引入了 ActiveSciBench,其中包含两个数据集:包含 57 个酶动力学任务的 ActiveSciBench-Chem 和包含 45 个基因调控网络任务的 ActiveSciBench-GRN。这些数据集将发现建模为预算受限的过程,需要自适应实验设计、变量选择和真实机制的恢复。在 NewtonBench、ActiveSciBench-Chem 和 ActiveSciBench-GRN 中,LLM-AutoSciLab 的性能优于之前的方法,在 NewtonBench 和 ActiveSciBench-Chem 上分别实现了 67.6% 和 35.1% 的符号准确度,在 ActiveSciBench-GRN 上实现了 31.1% 的精确图形恢复。此外,假设引导的实验的样本效率比最强的竞争基线高 2-5 倍。代码和数据可在以下网址获取:https://github.com/scientific-discovery/LLM-AutoSciLab