智能AI
morning
CASCADE:部署期间基于案例的大型语言模型持续适配
2026-05-11
1 阅读
Siyuan Guo, Yali Du, Hechang Chen, Yi Chang, Jun Wang
arXiv:2605.06702v1 公告类型:新 摘要:大型语言模型(LLM)已成为现代人工智能的核心基础,但其生命周期仍然受到训练和部署之间严格分离的限制,在此之后学习实际上就停止了。这种限制与自然智能形成鲜明对比,自然智能通过与环境的相互作用不断适应。在本文中,我们将部署时学习 (DTL) 正式化为 LLM 生命周期的第三阶段,使 LLM 代理能够根据部署期间的经验进行改进,而无需修改模型参数。我们提出了 CASCADE(部署期间基于 CASe 的持续适应),这是一个通用且有原则的框架,为 LLM 代理提供了明确的、不断发展的情景记忆。 CASCADE 将经验重用制定为上下文强盗问题,实现有原则的探索-利用权衡,并在长期交互中建立无悔保证。这种设计允许代理积累、选择和完善与任务相关的案例,将过去的经验转化为可操作的知识。在涵盖医疗诊断、法律分析、代码生成、网络搜索、工具使用和具体交互的 16 种不同任务中,CASCADE 比零样本提示将宏观平均成功率提高了 20.9%,同时始终优于基于梯度和基于内存的基线。通过将部署重新定义为自适应学习过程,这项工作为持续改进人工智能系统奠定了基础。