通过约束流形控制的安全且可推广的分层多智能体强化学习

2026-06-24 1 阅读 Zihao Guo, Jianing Zhao, Ling Li, Hao Liang, Giuseppe Loianno, Yali Du

arXiv:2606.24010v1 公告类型：新摘要：多智能体系统广泛应用于需要在严格安全约束下协调行为的安全关键型应用。现有的方法面临着一个根本性的权衡：基于学习的方法实现了强大的经验性能，但缺乏理论安全保证，而控制理论方法增强了安全性，但往往导致过于保守和低效的行为。我们提出了一种分层多智能体强化学习框架，该框架通过约束流形在低级别的温和假设下强制执行硬安全约束，同时通过高级策略学习实现有效协调。我们的方法在多智能体环境中提供了理论上的安全保证，并产生稳定的学习动态，从而实现稳定和高效的训练。根据经验，我们的方法在保持近乎完美的安全率的同时实现了具有竞争力的性能，并有效地推广到不同数量的代理和障碍物。