LLM-AutoSciLab：通过法学硕士的主动实验进行闭环科学发现

arXiv:2605.24043v1 公告类型：新摘要：科学发现是一个闭环过程，其中假设指导数据采集，观察细化假设空间。然而，大多数方法将发现减少为对固定数据集的监督学习，其中有限的观察可以支持适合局部但无法泛化的多种合理机制。因此，关键的挑战是选择信息丰富的观察结果来解决不确定性，将重点从静态推理转移到自适应数据采集。为了解决这个问题，我们提出了 LLM-AutoSciLab，这是一个闭环框架，它将假设生成与假设条件实验选择和机制细化结合起来。 LLM-AutoSciLab 不是将模型与被动收集的数据进行拟合，而是迭代地提出合理的假设，选择信息丰富的实验来区分或完善它们，并使用生成的证据更新其状态。为了通过主动数据采集评估动态、闭环科学发现，我们引入了 ActiveSciBench，其中包含两个数据集：包含 57 个酶动力学任务的 ActiveSciBench-Chem 和包含 45 个基因调控网络任务的 ActiveSciBench-GRN。这些数据集将发现建模为预算受限的过程，需要自适应实验设计、变量选择和真实机制的恢复。在 NewtonBench、ActiveSciBench-Chem 和 ActiveSciBench-GRN 中，LLM-AutoSciLab 的性能优于之前的方法，在 NewtonBench 和 ActiveSciBench-Chem 上分别实现了 67.6% 和 35.1% 的符号准确度，在 ActiveSciBench-GRN 上实现了 31.1% 的精确图形恢复。此外，假设引导的实验的样本效率比最强的竞争基线高 2-5 倍。代码和数据可在以下网址获取：https://github.com/scientific-discovery/LLM-AutoSciLab

订阅66必读