智能AI morning

代理人工智能漫游指南:从基础到系统

2026-06-25 1 阅读 Haggai Roitman
arXiv:2606.24937v1 发布类型:新 摘要:《智能人工智能漫游指南》是构建自主人工智能系统的综合实践者参考。这本书涵盖了从第一原理到生产部署的整个堆栈,围绕一个中心论点组织:构建出色的代理系统需要了解管道的每一层,而不仅仅是一层。本书以 LLM 基础——变压器架构、GPU 系统、训练和微调(SFT、LoRA、MoE)、模型压缩和推理优化——作为基本基础而不是主要焦点开始。然后,它开发对齐和推理层:来自人类反馈的强化学习 (RLHF)、PPO、DPO 及其变体、GRPO、奖励建模以及用于大型推理模型(包括思想链和测试时间缩放)的 RL。下半部分专门讨论代理人工智能本身。主题包括代理训练和基于轨迹的强化学习、检索增强生成(RAG 和 Agentic RAG)、记忆系统(上下文内、外部、情景和语义)、代理工具设计和上下文管理,以及代理设计模式的分类。深入介绍了代理间协调:模型上下文协议 (MCP)、代理技能和工具使用、代理到代理 (A2A) 通信协议以及跨越集中式、分散式和分层拓扑的多代理架构。本书最后介绍了代理开发框架、代理 UI 设计、代理任务的评估方法以及生产部署。每章都将严格的理论基础与实施指南、代码示例和主要文献参考相结合。