RMA：研究级数学问题的代理系统

摘要

22875v1 Announce Type: new Abstract: We present $\textbf{Research Math Agents (RMA)}$, an agentic framework for automated reasoning on research-level mathematical problems。

and RMA research level problems

2026-05-25 1 阅读约1分钟阅读 Zelin Zhao, Bo Yuan, Jaemoo Choi, Yongxin Chen

arXiv:2605.22875v1 公告类型：新摘要：我们提出 $\textbf{研究数学代理 (RMA)}$，一个用于研究级数学问题自动推理的代理框架。与之前以竞争数学或形式定理证明为中心的研究不同，RMA 针对需要长期推理、文献基础和迭代证明细化的研究级数学问题。 RMA 将研究级证明解决分解为专门的模块，用于问题分析、文献搜索和理解、公平比较、知识库构建和证明验证，所有这些模块均由初始化者、提议者和验证者代理通过共享结构化内存进行协调。在这个统一的框架内，这些代理在多角色、多轮工作流程中运行，通过迭代反馈协作生成、完善和验证候选证明。我们根据 First Proof 基准评估 RMA，该基准由不同领域的专家数学家贡献的十个研究级问题组成。通过全面的专家评估，RMA 的性能优于 First Proof 基准测试的强大基线，包括 GPT-5.2R 和 Aletheia，解决了十分之八的研究问题，并生成了逻辑上更合理、可读性更强的证明。我们全面的消融研究进一步表明，性能提升来自结构化推理模块、迭代细化和基于验证者的反馈的交互，而不是任何单个组件。我们的解决方案和实施将在接受后公开发布。

订阅66必读