智能AI
morning
多代理法学硕士审议中的隐藏锚点
2026-06-19
1 阅读
Apurba Pokharel, Ram Dantu
arXiv:2606.19494v1 公告类型:新 摘要:多代理 LLM 审议(代理在多轮中交换和修改答案)越来越多地用于提高推理和准确性,但其工作方式和原因却很少被建模。这种深思熟虑反映了人类如何做出决定。作为社会动物,我们既受到群体的拉动,即德格鲁特和弗里德金-约翰森等经典舆论动态模型捕捉到的羊群效应,也受到我们自己的内在信念的拉动,而它们却没有。我们将多智能体协商建模为一个闭环动态系统,其中每个智能体都带有一个隐藏的内部信念,即它的锚,无论其邻居如何,都会不断地拉动自己的意见。我们证明这个锚点可以仅从深思熟虑中恢复,并且它解释了经典共识规则所禁止的行为:代理人对正确答案的信心可以超越任何代理人开始的地方,逃离由初始信念形成的空间(凸包)。检查恢复的锚点是否也预测保留运行(概括),为模型何时真正由此类锚点驱动提供了一个简单的测试。在三个开放权重模型系列中,这是一个范围,而不是全有或全无。所有锚点的影响力大致相同,但它们的不同之处在于锚点所在的位置,只有当锚点远离最初的意见时,深思熟虑才脱离船体,需要完整的闭环模型。