智能AI morning

RMA:研究级数学问题的代理系统

2026-05-25 1 阅读 Zelin Zhao, Bo Yuan, Jaemoo Choi, Yongxin Chen
arXiv:2605.22875v1 公告类型:新 摘要:我们提出 $\textbf{研究数学代理 (RMA)}$,一个用于研究级数学问题自动推理的代理框架。与之前以竞争数学或形式定理证明为中心的研究不同,RMA 针对需要长期推理、文献基础和迭代证明细化的研究级数学问题。 RMA 将研究级证明解决分解为专门的模块,用于问题分析、文献搜索和理解、公平比较、知识库构建和证明验证,所有这些模块均由初始化者、提议者和验证者代理通过共享结构化内存进行协调。在这个统一的框架内,这些代理在多角色、多轮工作流程中运行,通过迭代反馈协作生成、完善和验证候选证明。我们根据 First Proof 基准评估 RMA,该基准由不同领域的专家数学家贡献的十个研究级问题组成。通过全面的专家评估,RMA 的性能优于 First Proof 基准测试的强大基线,包括 GPT-5.2R 和 Aletheia,解决了十分之八的研究问题,并生成了逻辑上更合理、可读性更强的证明。我们全面的消融研究进一步表明,性能提升来自结构化推理模块、迭代细化和基于验证者的反馈的交互,而不是任何单个组件。我们的解决方案和实施将在接受后公开发布。