智能AI
morning
EMA:基于学习的系统的高效模型适应
2026-05-15
1 阅读
Daiyang Yu, Xinyu Chen, Yihan Zhang, Yan Liang, Yaqi Qiao, Fan Lai
arXiv:2605.13942v1 发布类型:新 摘要:机器学习 (ML) 越来越多地应用于资源管理和网络模拟等任务中优化系统性能。与传统的机器学习任务(例如图像分类)不同,网络系统通常在异构、长时间运行和动态的环境状态下运行,其中输入条件(例如网络负载)和操作目标可能随着时间和设置的不同而变化。现有的基于学习的系统对适应的支持很少,导致模型训练成本高昂、数据收集广泛、系统性能下降和响应缓慢。本文介绍了 EMA,这是第一个支持基于学习的系统的模型适应系统,以最小的运营开销适应不断变化的环境。 EMA 采用系统驱动、以数据为中心的方法,可适应不同的系统和模型设计,同时解决两个关键的部署挑战。首先,它通过引入状态转换器来将新环境的输入状态与以前的类似状态对齐,从而允许模型热启动适应,从而减少昂贵的模型训练。其次,它通过优先标记高效用数据,同时平衡培训和标记成本之间的权衡,解决了经常被忽视但成本高昂的数据标记过程,即收集地面事实以探索和培训各种系统决策。对八个代表性的基于学习的系统的评估表明,EMA 将适应成本(例如 GPU 训练时间)降低了 14.9-42.4%,同时将系统性能(例如网络吞吐量)提高了 6.9-31.3%。