实现支持 LLM 的代理工作流程的可靠设计：优化延迟-可靠性-成本权衡

摘要

arXiv:2605.23929v1 Announce Type: new Abstract: Modern AI systems increasingly rely on workflows composed of multiple interacting agents, some powered by large language models (LLMs) and others by con

and the LLM workflows agents

2026-05-26 1 阅读约1分钟阅读 Ya-Ting Yang, Quanyan Zhu

arXiv:2605.23929v1 公告类型：新摘要：现代人工智能系统越来越依赖由多个交互代理组成的工作流程，其中一些由大型语言模型 (LLM) 提供支持，另一些则由传统计算模块提供支持。本文分析了支持 LLM 的代理工作流程中延迟、可靠性和成本之间的基本权衡。我们引入了 LLM 和非 LLM 代理的性能模型，捕获计算量和输出质量之间的关系，并使用参数指数可靠性函数纳入 LLM 代理的推理和输出标记的影响。然后，我们研究延迟和成本约束下的顺序工作流程的设计。主要结果包括注水代币分配政策和影子价格方面的最佳工作流程可靠性特征。

订阅66必读