财务文档问答的代理检索增强生成

arXiv:2605.05409v1 公告类型：新摘要：财务文档问答 (QA) 需要对分散在公司文件中的异构证据（结构化表格、文本叙述和脚注）进行复杂的多步骤数字推理。现有的检索增强生成（RAG）方法采用单遍检索然后生成范式，该范式与金融分析中普遍存在的组合推理链相矛盾。我们提出了 FinAgent-RAG，这是一种代理 RAG 框架，可以通过自我验证来协调迭代检索推理循环，专门针对金融数字推理的精度要求而设计。该框架集成了三个特定领域的创新：(1) 一个经过硬负挖掘训练的对比金融检索器，以区分语义相似但数字不同的金融段落；(2) 一个思维程序推理模块，为精确算术生成可执行的 Python 代码，而不是依赖于容易出错的基于 LLM 的心理计算；(3) 一个自适应策略路由器，根据问题复杂性动态分配计算资源，在保持准确性的同时，将 FinQA 上的 API 成本降低 41.3%。对三个基准数据集 FinQA、ConvFinQA 和 TAT-QA 的大量实验表明，FinAgent-RAG 的执行准确率分别为 76.81%、78.46% 和 74.96%，比最强基线高出 5.62--9.32 个百分点。消融研究、四名法学硕士的跨骨干评估以及部署成本分析证实了该框架对金融机构的稳健性和实际可行性。