长期研究代理的搜索学科

arXiv:2606.11522v1 公告类型：新摘要：自动研究代理现在根据指标提出、评估和选择科学候选人，而该指标通常是在区域、切片或群组的异构空间上减少的聚合。我们证明，当科学有效性存在于这种分类结构中时，总体上可能会将错误的候选者排在第一位。标题数字有所改善，而底层结构却发生了倒转，因此对数字做出的决定接受了一个悄悄打破模型的候选者。失败不是特定于域的。它出现在候选者的有效性是多维的但其验证者是单一减少的地方。我们演示了生态系统人口学模型中火灾模型任务的反演。得分最高的候选者和得分稍低的候选者在全球得分上彼此相差不大，但得分最高的候选者摧毁了受保护的北方地区，而另一个则保留了它们。它们的区别在于每个地区的行为，而不是标题数字。这一决定不应留给产生候选人的代理人。优化分数的智能体是最后可能发现分数错误的一方，一旦智能体停止，提示就没有剩余的轮次。我们将决策转移到外部控制循环，该循环审核每个候选者的分类行为，并在代理做出决定后采取行动。它可以将代理本应接受的候选人降级，并且可以重新启动代理已宣布完成的运行。我们的贡献是反演发现本身，以及决定可审查的候选效应证据而不是分数的搜索规则协议。

订阅66必读