代理模式 - 66必读

收敛。 Claude Code、OpenAI Codex、Gemini CLI、LangGraph、CrewAI、Google ADK、Amazon Bedrock — 由不同公司、使用不同语言、在不同约束下构建。他们融合了相同的设计。不是因为他们互相抄袭。因为约束是物理的。有限上下文窗口。需要协议的工具。安全性不能依赖于模型的遵守。任务对于单次调用来说过于复杂。任何组建足够长的团队都会到达这里。您正在构建哪种类型的系统？本指南中的模式普遍适用，但它们的权重取决于您正在处理的代理生态系统中的哪个接缝。按照与您的问题相符的顺序阅读。如果您正在构建...您最关心...从域上下文底层（一个MCP服务器，为任何代理提供对一个域的结构化访问：代码库，屏幕，系统）确定性提取，固定本体，安装在用户项目中的行为契约/工具协议，/指令，/反模式个人AI运行时（用户拥有的代理，在后台运行，具有长期运行状态）内存架构，压缩驻留状态，挂钩，调度程序控制的后台工作 /memory 、 /enforcement 、 /multi-agent 多代理 shell（其他人的代理上的协调器，具有聊天平台范围）适配器模式、独立的子代理工具注册表、设置架构、成本控制 /multi-agent 、 /enforcement 、 /cost-management 这些类别并不是无懈可击的 - 许多系统模糊了它们。但知道哪一种是您的承重关注点可以防止您过度应用不适合接缝的图案。八项假设这些不是建议。它们是每个生产代理系统的承重墙。违反它们，你就会重新发现它们存在的原因。 # 假设要做什么 1 从持久指令文件开始在编写任何代理配置之前创建 CLAUDE.md 、 AGENTS.md 或 GEMINI.md 。涵盖约定、堆栈、测试、git 和安全性。将其控制在 200 行以下。 2 在提示之外加强安全将样式首选项放入指令文件中。将绒毛放入挂钩中。将破坏性命令阻止放入权限中。切勿依赖模型记住安全规则。 3 预算上下文窗口预留 10-15% 用于说明，30-40% 用于对话，20-30% 用于工具结果。紧凑 70%。清除 80%。将可缓存内容与可压缩内容分开。 4 在 MCP 上构建工具使用 .mcp.json 进行工具连接。每个主要平台的下载量/月超过 9700 万次。如果您需要跨系统的代理间通信，请添加 A2A — 但从 MCP 开始。 5 通过共享状态进行协调在系统中，代理读取和写入共享状态，而不是相互发送消息。在系统或组织之间，使用消息传递协议 (A2A)。默认状态；仅在必要时才发送消息。 6 在陷入悬崖之前分解长时间的会话后，代理的一致性会降低。阈值随着模型的每一代而变化。不要找到极限——保持在极限以下。将工作分解为在安全区内完成的子任务。 7 从第一天开始跟踪每个任务的成本设置每个会话的代币预算。将简单的工作交给廉价的模型。缓存稳定的提示。以预算的 50%、75% 和 90% 进行监控并发出警报。成本管理是基础设施，而不是优化。 8 以每周增量增加复杂性第 1 周：说明文件。第 2 周：挂钩。第 3 周：MCP 工具。第四周：技能。第 2 个月以上：子代理。如果您的团队具有分布式系统经验，您可以更快地行动，但仍然在添加下一层之前验证每一层。架构谁适合角色您能获得什么代理开发人员指令文件、挂钩、MCP 工具和上下文管理的模式。平台工程师多代理架构、共享状态、委派和成本控制。基础设施团队可观察性、代币会计、安全执行和生产操作手册。工程经理采用路线图、成本模型和风险框架。阅读顺序部分回答的关键问题提示座席在会话开始时阅读什么？线束围绕它编译什么？控制如何在提示之外绑定代理的行为？上下文智能体记得什么？多个Agent如何协调？界面代理如何与工具、代码、网络和编辑器对话？操作您如何在生产中运行它——成本、可观察性、凭证、生命周期？反模式失败是什么样子的——命名且可引用。第一代理？从提示→控制开始。跳过上下文，直到一个代理可靠地工作。缩放？跳转到上下文并进行操作。这就是故障模式存在的地方。

订阅66必读