智能AI morning

长期研究代理的搜索学科

2026-06-11 1 阅读 Adithya Srinivasan, Devesh Paragiri
arXiv:2606.11522v1 公告类型:新 摘要:自动研究代理现在根据指标提出、评估和选择科学候选人,而该指标通常是在区域、切片或群组的异构空间上减少的聚合。我们证明,当科学有效性存在于这种分类结构中时,总体上可能会将错误的候选者排在第一位。标题数字有所改善,而底层结构却发生了倒转,因此对数字做出的决定接受了一个悄悄打破模型的候选者。失败不是特定于域的。它出现在候选者的有效性是多维的但其验证者是单一减少的地方。我们演示了生态系统人口学模型中火灾模型任务的反演。得分最高的候选者和得分稍低的候选者在全球得分上彼此相差不大,但得分最高的候选者摧毁了受保护的北方地区,而另一个则保留了它们。它们的区别在于每个地区的行为,而不是标题数字。这一决定不应留给产生候选人的代理人。优化分数的智能体是最后可能发现分数错误的一方,一旦智能体停止,提示就没有剩余的轮次。我们将决策转移到外部控制循环,该循环审核每个候选者的分类行为,并在代理做出决定后采取行动。它可以将代理本应接受的候选人降级,并且可以重新启动代理已宣布完成的运行。我们的贡献是反演发现本身,以及决定可审查的候选效应证据而不是分数的搜索规则协议。