智能AI
morning
BALAR:用于主动推理的贝叶斯代理循环
2026-05-09
1 阅读
Aymen Echarghaoui, Dongxia Wu, Emily B. Fox
arXiv:2605.05386v1 公告类型:新 摘要:大型语言模型越来越多地在交互式环境中运行,其中解决任务需要与用户进行多轮信息交换。然而,当前的大多数系统都被动地对待对话,并且缺乏原则性的机制来推理缺少哪些信息以及接下来应该问哪个问题。我们提出了 BALAR(主动推理的贝叶斯代理循环),这是一种与任务无关的外循环算法,不需要微调,并且可以在 LLM 代理和用户之间实现结构化的多轮交互。 BALAR 保持对潜在状态的结构化信念,通过最大化预期互信息来选择澄清问题,并在当前状态表示不足时动态扩展其状态表示。我们根据三个不同的基准评估 BALAR:AR-Bench-DC(侦探案例)、AR-Bench-SP(思维难题)和 iCraft-MD(临床诊断)。 BALAR 在所有三个基准测试中均显着优于所有基线,在 AR-Bench-DC 上的准确度提高了 14.6\%$,在 AR-Bench-SP 上提高了 38.5\%$,在 iCraft-MD 上提高了 30.5\%$。