开发者生态
morning
超越语义相似性
2026-05-12
1 阅读
44za12
计算机科学 > 信息检索 arXiv:2605.05242 (cs) [提交于 2026 年 5 月 3 日] 标题:超越语义相似性:重新思考通过直接语料库交互进行代理搜索的检索 作者:李卓峰、张浩翔、魏丛、潘路、聂平、陆毅、白玉阳、冯尚斌、朱航晓、钟明、Yuyu Zhang、Jianwen Xie、Yejin Choi、James Zou、Jiawei Han、Wenhu Chen、Jimmy Lin、Dongfu Jiang、Yu Zhu 查看题为《超越语义相似性:通过直接语料库交互重新思考代理搜索的检索》论文的 PDF,作者为李卓峰和其他 18 位作者。在推理之前将访问压缩为单个 top-k 检索步骤。这种抽象是有效的,但对于代理搜索来说,它成为一个瓶颈:精确的词汇约束、稀疏线索连词、局部上下文检查和多步假设细化很难通过调用传统的现成检索器来实现,并且早期过滤掉的证据无法通过更强的下游推理来恢复。代理任务进一步加剧了这种限制,因为它们需要代理协调多个步骤,包括发现中间实体、组合薄弱线索以及在观察部分证据后修改计划。为了解决这个限制,我们研究了直接语料库交互(DCI),其中代理使用通用终端工具(例如 grep、文件读取、shell 命令、轻量级脚本)直接搜索原始语料库,而不需要任何嵌入模型、向量索引或检索 API。这种方法不需要离线索引,并且自然地适应不断发展的本地语料库。在 IR 基准测试和端到端代理搜索任务中,这种简单的设置大大优于几个 BRIGHT 和 BEIR 数据集上的强稀疏、密集和重排序基线,并且在 BrowseComp-Plus 和多跳 QA 上获得了很高的准确性,而无需依赖任何传统的语义检索器。我们的结果表明,随着语言代理变得更强,检索质量不仅取决于推理能力,还取决于模型与语料库交互的界面的分辨率,DCI 为代理搜索开辟了更广阔的界面设计空间。主题:信息检索(cs.IR);人工智能 (cs.AI) 引用为:arXiv:2605.05242 [cs.IR](或本版本的 arXiv:2605.05242v1 [cs.IR]) https://doi.org/10.48550/arXiv.2605.05242 重点了解更多通过 DataCite 发布的 arXiv DOI 提交历史 来自:卓峰Li [ 查看电子邮件 ] [v1] 星期日,2026 年 5 月 3 日 19:13:11 UTC (5,193 KB) 全文链接:访问论文:查看标题为“超越语义相似性:重新思考通过直接语料库交互进行代理搜索的检索”的论文的 PDF,作者为 Zhuofeng Li 和其他 18 位作者 查看 PDF TeX 源代码 查看许可证 附加功能 音频摘要 当前浏览上下文:cs.IR下一页 > 新 |最近 | 2026-05 更改为浏览方式:cs cs.AI 参考文献和引文 NASA ADS Google Scholar 语义学者导出 BibTeX 引文 正在加载... BibTeX 格式的引文 × 正在加载... 数据提供者: 书签 书目工具 书目和引文工具 书目浏览器 切换书目浏览器(什么是浏览器?) 已连接论文 切换已连接论文(什么是已连接)论文? ) Litmaps 切换 Litmaps(什么是 Litmaps?) scite.ai 切换 scite 智能引文(什么是智能引文?) 与本文相关的代码、数据、媒体 代码、数据和媒体 alphaXiv 切换 alphaXiv(什么是 alphaXiv?) 代码链接 切换 CatalyzeX 论文代码查找器(什么是 CatalyzeX?) DagsHub 切换 DagsHub (什么是 DagsHub?) GotitPub 切换 Gotit.pub (什么是 GotitPub?) Huggingface 切换拥抱面 (什么是 Huggingface?) ScienceCast 切换 ScienceCast (什么是 ScienceCast?) 演示 演示 复制 切换复制 (什么是复制?) Spaces 切换拥抱面 空间 (什么是空间? ) 空间 切换 TXYZ.AI(什么是 TXYZ.AI?) 相关论文推荐器和搜索工具 链接到 Influence Flower Influence Flower(什么是 Influence Flowers?) 核心推荐器切换 CORE 推荐器(什么是 CORE?) 作者地点 机构 主题 关于 arXivLabs arXivLabs:与社区合作者的实验项目 arXivLabs 是一个允许合作者开发和共享新 arXiv 的框架直接在我们的网站上提供功能。与 arXivLabs 合作的个人和组织都接受并接受了我们开放、社区、卓越和用户数据隐私的价值观。 arXiv 致力于这些价值观,并且只与遵守这些价值观的合作伙伴合作。您有一个可以为 arXiv 社区增加价值的项目想法吗?了解有关 arXivLabs 的更多信息。这篇论文的哪些作者是认可者? |禁用 MathJax(什么是 MathJax?)