智能AI
morning
Dr-DCI:通过动态工作空间扩展扩展直接语料库交互
2026-06-16
1 阅读
Yi Lu, Zhuofeng Li, Ping Nie, Haoxiang Zhang, Yuyu Zhang, Kai Zou, Wenhu Chen, Jimmy Lin, Dongfu Jiang, Yu Zhang
arXiv:2606.14885v1 公告类型:新 摘要:大型语料库上的代理搜索依赖于检索器介导的接口(例如 BM25 或 ColBERT)来实现可扩展的候选发现。虽然这些界面可以有效地对相关文档进行排名,但它们仅以排名结果或有界文档视图的形式公开证据,从而限制了代理重新组织材料和验证跨文档约束的能力。直接语料库交互 (DCI) 通过公开 shell 可执行语料库操作以进行灵活的搜索、过滤、比较和验证,从而解决了这一限制。然而,随着语料库的增长,全语料库终端命令变得缓慢且不稳定,从而降低了性能和效率。我们引入了 DR-DCI,这是一个检索器引导的 DCI 框架,它将检索视为用于扩展本地工作空间的代理可调用操作。该代理不是直接在整个语料库上进行操作,而是动态地将相关文档拉入不断变化的工作区并在其中进行 DCI 操作。这种设计将检索器级别的召回率与 DCI 式的精度相结合:检索使探索保持可扩展性,而 DCI 保留了有效证据解析所需的本地操作。实验表明 DR-DCI 在跨尺度上既有效又高效。在 Browsecomp-Plus 上,DR-DCI 的准确度达到 71.2%,与原始 DCI 和消融变体相比提高了 8.3 个百分点,同时减少了工具使用量、工作时间和估计成本。通过保留工作空间的上下文重置,准确率进一步提高到 73.3%。在语料库扩展实验中,DR-DCI 在 100K 到 10M 文档范围内仍然有效,而原始 DCI 变得不稳定,BM25 的表现要差得多。 DR-DCI 还可以扩展到每文档 2000 万个文件的 Wiki-18 QA 设置,在六个基准测试中获得 63.0 的平均分数,并且优于基于检索和经过训练的搜索代理基线。消融分析进一步表明,排名预览和文档间 DCI 是性能的关键。