代理人工智能漫游指南：从基础到系统

arXiv:2606.24937v1 发布类型：新摘要：《智能人工智能漫游指南》是构建自主人工智能系统的综合实践者参考。这本书涵盖了从第一原理到生产部署的整个堆栈，围绕一个中心论点组织：构建出色的代理系统需要了解管道的每一层，而不仅仅是一层。本书以 LLM 基础——变压器架构、GPU 系统、训练和微调（SFT、LoRA、MoE）、模型压缩和推理优化——作为基本基础而不是主要焦点开始。然后，它开发对齐和推理层：来自人类反馈的强化学习 (RLHF)、PPO、DPO 及其变体、GRPO、奖励建模以及用于大型推理模型（包括思想链和测试时间缩放）的 RL。下半部分专门讨论代理人工智能本身。主题包括代理训练和基于轨迹的强化学习、检索增强生成（RAG 和 Agentic RAG）、记忆系统（上下文内、外部、情景和语义）、代理工具设计和上下文管理，以及代理设计模式的分类。深入介绍了代理间协调：模型上下文协议 (MCP)、代理技能和工具使用、代理到代理 (A2A) 通信协议以及跨越集中式、分散式和分层拓扑的多代理架构。本书最后介绍了代理开发框架、代理 UI 设计、代理任务的评估方法以及生产部署。每章都将严格的理论基础与实施指南、代码示例和主要文献参考相结合。