智能AI
morning
基础模型代理中的部署时记忆
2026-06-10
1 阅读
Lei (Rachel), Chen, Guilin Zhang, Kai Zhao, Dalmo Cirne, Andy Olsen, Xu Chu, Zeke Miller, Alet Blanken, Amine Anoun, Jerry Ting
arXiv:2606.10062v1 公告类型:新 摘要:基础模型代理是越来越长寿的系统,可以在交互过程中记住用户,使记忆成为显式的部署时函数,而不仅仅是模型权重的属性。现有的工作涉及参数化记忆或审核固定内存配置,但没有描述内存设计选择如何共同塑造个性化效用、提取风险和删除保真度。我们将这个表面作为部署时记忆进行研究,将代理记忆制定为通过个性化回忆(PR)和对抗性提取率(AER)来衡量的隐私实用边界,并扫除三个记忆设计旋钮:摘要积极性、检索广度(k)和删除模式。我们进一步引入了遗忘残留分数(FRS)来量化已删除的信息是否仍然可以从派生内存层中恢复。在 LongMemEval 上,关键事实摘要在 Gemma 3 12B 上减少了 76% 的金丝雀提取,在 GPT-4o-mini 上减少了 64%,同时保留了几乎所有的个性化召回;重要的是,一旦内容被压缩,增加 k 就不再恢复泄漏。然而,相同的压缩会导致删除保真度失败:仅原始删除会使派生的摘要副本在大约 20% 的实例中可恢复,并且只有全管道清除或逻辑删除才能将最差层残留物降至零。总之,这些结果表明,持久智能体记忆必须被评估为一流的记忆机制——通过它帮助智能体回忆什么、它可以提取什么以及它可以真正擦除什么来评估。