智能AI
morning
STARIXNet:云平台中实时资源分配的多变量和多属性深度学习方法
2026-06-09
1 阅读
Ahmed Abdulaal, Maruf Aytekin, Thilaga kumaran Srinivasan, Tomer Lancewicki
arXiv:2606.07565v1 公告类型:新 摘要:云平台中微服务的智能扩展对于缓解不断上升的计算成本同时避免服务中断至关重要。当前的解决方案仅限于单变量空间,通常仅关注 CPU 使用情况来驱动扩展决策。此外,他们将问题作为纯粹的预测任务来解决,专注于预测精度,而忽略了低估和系统响应延迟的更大风险。替代解决方案计算复杂,使得它们对于大规模实时部署来说不切实际。为了应对这些挑战,我们提出了 STARIXNet,这是一种轻量级神经网络,它通过捕获多个系统指标之间的时空关系来指导多元空间中的资源分配决策。 STARIXNet 对多个准相关属性进行建模,特别是 (S) 季节性、(T) 时间性、(A) 自动-(R) 回归 (I) 整合和 e(X) 生成模式,然后实施聚合策略来最终确定扩展决策,优先考虑服务稳定性,其次是成本效率,而不是原始预测准确性。我们通过对现实环境中的现有解决方案进行基准测试,凭经验证明了 STARIXNet 的性能。沃尔玛为关键生产微服务部署了 STARIXNet,除了通过提高服务稳定性和客户体验带来无形效益外,还实现了 10% 到 50% 的有形节省。