多代理法学硕士审议中的隐藏锚点

摘要

arXiv:2606.19494v1 Announce Type: new Abstract: Multi-agent LLM deliberation, where agents exchange and revise answers over several rounds, is increasingly used to improve reasoning and accuracy, yet

the and agent deliberation anchor

2026-06-19 1 阅读约1分钟阅读 Apurba Pokharel, Ram Dantu

arXiv:2606.19494v1 公告类型：新摘要：多代理 LLM 审议（代理在多轮中交换和修改答案）越来越多地用于提高推理和准确性，但其工作方式和原因却很少被建模。这种深思熟虑反映了人类如何做出决定。作为社会动物，我们既受到群体的拉动，即德格鲁特和弗里德金-约翰森等经典舆论动态模型捕捉到的羊群效应，也受到我们自己的内在信念的拉动，而它们却没有。我们将多智能体协商建模为一个闭环动态系统，其中每个智能体都带有一个隐藏的内部信念，即它的锚，无论其邻居如何，都会不断地拉动自己的意见。我们证明这个锚点可以仅从深思熟虑中恢复，并且它解释了经典共识规则所禁止的行为：代理人对正确答案的信心可以超越任何代理人开始的地方，逃离由初始信念形成的空间（凸包）。检查恢复的锚点是否也预测保留运行（概括），为模型何时真正由此类锚点驱动提供了一个简单的测试。在三个开放权重模型系列中，这是一个范围，而不是全有或全无。所有锚点的影响力大致相同，但它们的不同之处在于锚点所在的位置，只有当锚点远离最初的意见时，深思熟虑才脱离船体，需要完整的闭环模型。

订阅66必读