CASCADE：部署期间基于案例的大型语言模型持续适配

arXiv:2605.06702v1 公告类型：新摘要：大型语言模型（LLM）已成为现代人工智能的核心基础，但其生命周期仍然受到训练和部署之间严格分离的限制，在此之后学习实际上就停止了。这种限制与自然智能形成鲜明对比，自然智能通过与环境的相互作用不断适应。在本文中，我们将部署时学习 (DTL) 正式化为 LLM 生命周期的第三阶段，使 LLM 代理能够根据部署期间的经验进行改进，而无需修改模型参数。我们提出了 CASCADE（部署期间基于 CASe 的持续适应），这是一个通用且有原则的框架，为 LLM 代理提供了明确的、不断发展的情景记忆。 CASCADE 将经验重用制定为上下文强盗问题，实现有原则的探索-利用权衡，并在长期交互中建立无悔保证。这种设计允许代理积累、选择和完善与任务相关的案例，将过去的经验转化为可操作的知识。在涵盖医疗诊断、法律分析、代码生成、网络搜索、工具使用和具体交互的 16 种不同任务中，CASCADE 比零样本提示将宏观平均成功率提高了 20.9%，同时始终优于基于梯度和基于内存的基线。通过将部署重新定义为自适应学习过程，这项工作为持续改进人工智能系统奠定了基础。