智能AI
morning
知道何时提问:分层语言智能体的自控澄清
2026-06-11
1 阅读
Aijing Gao, Yiming Kang, Mengdie Flora Wang, Jae Oh Woo
arXiv:2606.11349v1 公告类型:新摘要:在分层推理中,失败通常源于中间决策点,其中代理提交到错误的分支,而没有意识到它缺少关键信息。我们不将澄清视为外部不确定性触发器,而是提出行动评级,这是一种将其置于智能体行动空间内的公式,与导航共享顺序尺度,以便在每个决策点询问与行动直接竞争,并且在中间状态下可以观察到寻求帮助。代理人自己的评级出现了两种结构上不同的信息寻求模式:强制性(没有可行的分支)和机会主义(尽管有领先的候选人,但仍然存在不确定性)。在统一关税表分类(30,000 个节点分类、三个基准、4 个系列的 9~LLM)方面,我们观察到从强制性澄清到机会主义澄清的制度转变,信息寻求有效性 (ISE) 是一种本地诊断,定义为帮助交互的比例,然后是正确的下一步导航步骤(不是最终任务指标),从 50% 上升到 74%。三种诊断对比无法重现这种结构。可分离性测试表明,当答案质量下降(-18.8% 准确度)时,信息寻求模式(模式分割、ISE 排名)仍然存在,这支持了代理寻求帮助的位置与其收到的帮助的质量之间的经验分离。在受控答案通道下,10位准确率提升达到+16.2%;我们将此视为更好的本地化可以解锁的上限,而不是部署估计。