开发者生态
morning
代理模式
2026-05-26
1 阅读
kinlan
收敛。 Claude Code、OpenAI Codex、Gemini CLI、LangGraph、CrewAI、Google ADK、Amazon Bedrock — 由不同公司、使用不同语言、在不同约束下构建。他们融合了相同的设计。不是因为他们互相抄袭。因为约束是物理的。有限上下文窗口。需要协议的工具。安全性不能依赖于模型的遵守。任务对于单次调用来说过于复杂。任何组建足够长的团队都会到达这里。您正在构建哪种类型的系统?本指南中的模式普遍适用,但它们的权重取决于您正在处理的代理生态系统中的哪个接缝。按照与您的问题相符的顺序阅读。如果您正在构建...您最关心...从域上下文底层(一个MCP服务器,为任何代理提供对一个域的结构化访问:代码库,屏幕,系统)确定性提取,固定本体,安装在用户项目中的行为契约/工具协议,/指令,/反模式个人AI运行时(用户拥有的代理,在后台运行,具有长期运行状态)内存架构,压缩驻留状态,挂钩,调度程序控制的后台工作 /memory 、 /enforcement 、 /multi-agent 多代理 shell(其他人的代理上的协调器,具有聊天平台范围) 适配器模式、独立的子代理工具注册表、设置架构、成本控制 /multi-agent 、 /enforcement 、 /cost-management 这些类别并不是无懈可击的 - 许多系统模糊了它们。但知道哪一种是您的承重关注点可以防止您过度应用不适合接缝的图案。八项假设 这些不是建议。它们是每个生产代理系统的承重墙。违反它们,你就会重新发现它们存在的原因。 # 假设要做什么 1 从持久指令文件开始 在编写任何代理配置之前创建 CLAUDE.md 、 AGENTS.md 或 GEMINI.md 。涵盖约定、堆栈、测试、git 和安全性。将其控制在 200 行以下。 2 在提示之外加强安全 将样式首选项放入指令文件中。将绒毛放入挂钩中。将破坏性命令阻止放入权限中。切勿依赖模型记住安全规则。 3 预算上下文窗口 预留 10-15% 用于说明,30-40% 用于对话,20-30% 用于工具结果。紧凑 70%。清除 80%。将可缓存内容与可压缩内容分开。 4 在 MCP 上构建工具 使用 .mcp.json 进行工具连接。每个主要平台的下载量/月超过 9700 万次。如果您需要跨系统的代理间通信,请添加 A2A — 但从 MCP 开始。 5 通过共享状态进行协调 在系统中,代理读取和写入共享状态,而不是相互发送消息。在系统或组织之间,使用消息传递协议 (A2A)。默认状态;仅在必要时才发送消息。 6 在陷入悬崖之前分解 长时间的会话后,代理的一致性会降低。阈值随着模型的每一代而变化。不要找到极限——保持在极限以下。将工作分解为在安全区内完成的子任务。 7 从第一天开始跟踪每个任务的成本 设置每个会话的代币预算。将简单的工作交给廉价的模型。缓存稳定的提示。以预算的 50%、75% 和 90% 进行监控并发出警报。成本管理是基础设施,而不是优化。 8 以每周增量增加复杂性 第 1 周:说明文件。第 2 周:挂钩。第 3 周:MCP 工具。第四周:技能。第 2 个月以上:子代理。如果您的团队具有分布式系统经验,您可以更快地行动,但仍然在添加下一层之前验证每一层。架构 谁适合角色 您能获得什么 代理开发人员 指令文件、挂钩、MCP 工具和上下文管理的模式。平台工程师 多代理架构、共享状态、委派和成本控制。基础设施团队可观察性、代币会计、安全执行和生产操作手册。工程经理采用路线图、成本模型和风险框架。阅读顺序部分 回答的关键问题 提示 座席在会话开始时阅读什么?线束围绕它编译什么?控制 如何在提示之外绑定代理的行为?上下文 智能体记得什么?多个Agent如何协调?界面 代理如何与工具、代码、网络和编辑器对话?操作 您如何在生产中运行它——成本、可观察性、凭证、生命周期?反模式失败是什么样子的——命名且可引用。第一代理?从提示→控制开始。跳过上下文,直到一个代理可靠地工作。缩放?跳转到上下文并进行操作。这就是故障模式存在的地方。