智能AI morning

DAG革新时间序列预测,代码、数据、排行榜全开源 | ICML'26

2026-05-17 1 阅读 新智元
新智元报道 编辑:LRST 【新智元导读】 DAG框架利用时间与通道双重相关网络,有效整合历史与未来外生变量信息,提升时间序列预测准确性。通过发现并注入相关关系,充分利用未来协变量,显著优于现有方法。 DAG框架利用时间与通道双重相关网络,有效整合历史与未来外生变量信息,提升时间序列预测准确性。通过发现并注入相关关系,充分利用未来协变量,显著优于现有方法。 时间序列预测在经济学、交通、智能运维等多个领域具有关键作用。然而在实际应用中,仅关注内生变量(即目标变量)往往难以保证预测精度。引入外生变量(即协变量)能够提供额外的预测信息,从而提升预测准确性。 但现有外生变量时间序列预测方法(TSFX)存在两个主要缺陷: 1)未能充分利用未来外生变量; 2)忽略内生变量与外生变量间的相关关系,导致预测性能未达最优。 为了更好地利用外生变量(特别是未来外生变量),华东师范大学的研究人员提出通用框架 DAG,通过双相关网络在时间维度和通道维度上实现外生变量时间序列预测。 论文链接:https://arxiv.org/pdf/2509.14933 代码链接:https://github.com/decisionintelligence/DAG 开源数据集链接:https://drive.google.com/file/d/1K2AvogpOpSz1PiQ53dPchzGv_PqlCWAK/view 协变量预测排行榜以及测评结果链接:https://decisionintelligence.github.io/OpenTS/leaderboards/ #covariate _forecasting 具体来说,该研究首先提出时间相关模块,其包含相关发现模块(用于捕捉历史外生变量如何影响未来外生变量)和相关注入模块(将发现的相关关系融入基于历史内生变量的未来内生变量预测过程)。 随后提出通道相关模块,采用类似设计原理:通过相关发现模块建模历史外生变量对历史内生变量的影响,并借助相关注入模块将发现的相关关系用于增强基于未来外生变量的未来内生变量预测。 在多组数据集上的大量实验表明,DAG框架实现了最先进的预测性能。 研究背景 当前基于深度学习的时间序列预测方法大多聚焦于单变量或多变量,并依赖于学习单个内生变量(即预测目标)内部的时间依赖关系,或多个内生变量之间的依赖关系。 然而,除了内生变量本身外,许多实际场景还涉及另一类对预测精度有显著影响的信息——外生变量(即协变量)。特别是在未来外生变量可用的情况下,有效利用这类辅助信息有可能显著提升预测性能。 从时间角度看,协变量可以分为两类: 历史外生变量 :在历史阶段中观测到的外生信息; 未来外生变量 :在预测时刻即可获得的未来时间步的外生信息。 尽管未来外生变量具有很高的预测价值,但现有深度学习方法仍未得到充分利用。如图 1 所示,现有的「外生变量感知」预测方法大致可以分为两类: 仅使用历史信息的方法(图 1b) :这些方法仅依赖历史内生和外生变量来预测未来的内生变量。代表性模型包括 TimeXer 和 CrossLinear 。由于完全忽略了未来协变量,这类方法在未来外生信息可用的场景下往往表现欠佳。 同时使用历史与未来外生变量的方法(图 1c) :例如,TiDE 和 TFT 在预测未来内生变量时,利用了历史信息和未来外生变量。然而,由于缺乏相关关系约束,这类方法容易受到虚假相关的影响。 进一步的分析(如图 2 所示)表明,利用已知的未来协变量进行预测涉及时间维度和通道维度上的相关依赖关系: 在时间维度上,历史外生变量对未来外生变量的影响结构性地类似于历史内生变量演化为未来内生变量的过程; 在通道维度上,历史外生变量与内生变量之间的交互模式,往往可以迁移到未来外生变量与内生变量之间。 这种「双重相关结构」仍是一个尚未得到充分研究但极其关键的特征,而现有方法对其关注不足。 对此,研究人员提出了一个通用框架 DAG ,其核心思想是利用 时间维度和通道维度上的双重相关网络 ,在结合外生变量的时间序列预测任务中实现高质量的未来内生变量预测。 首先提出 时间相关模块 。由于历史外生变量对未来外生变量的影响在结构上类似于历史内生变量演化到未来内生变量的过程,该研究设计了一个相关发现模块来捕捉历史外生变量如何影响未来外生变量;接着构建了一个相关注入模块,将所发现的相关关系整合到基于历史内生变量的未来内生变量预测过程中。 随后提出 通道相关模块 。其设计原则类似,首先通过相关发现模块建模历史外生变量如何影响历史内生变量,然后通过相关注入模块,将所发现的相关关系整合到基于未来外生变量的未来内生变量预测过程中。 最后,将时间相关损失、通道相关损失以及未来内生变量的预测损失结合为总体损失函数,从而实现预测任务的端到端优化。 核心贡献 提出了一个通用框架 DAG ,通过在时间和通道维度上发现并注入相关关系,充分利用外生变量,从而提升预测精度。 设计了一个相关发现模块,用于捕捉历史外生变量对未来外生变量的影响,以及它们对历史内生变量的影响。 设计了一个相关注入模块,将所发现的时间与通道相关关系融入未来内生变量的预测过程中。 研究人员开源了自建的 TSF-X数据集 ,并在公共和新发布的数据集上进行了广泛实验,结果表明DAG优于当前最先进的方法。 模型方法 DAG 框架的模型结构如下图所示: 时间相关模块 历史外生变量对未来外生变量的影响,在结构上与历史内生变量演化为未来内生变量的过程具有相似性。因而,此模块设计了 时间相关发现模块 ,用于揭示历史与未来外生变量之间的相关关系,并设计了 时间相关注入模块 将所发现的相关关系注入到基于历史内生变量预测未来内生变量的建模过程中以提升预测精度。 时间相关发现模块 时间相关发现模块采用了 分块表示策略 提取历史外生变量与未来外生变量的相关关系。具体而言,将每个历史外生变量划分为多个patch,并将每个patch投影为一个时间token: 接着,该模块采用标准Transformer Block 来建模不同 patch 对未来外生变量的影响权重: 为增强鲁棒性,此模块并非直接将生成的注意力分数传递给时间相关注入模块,而是提取并传递MSA中生成注意力分数的可学习参数:查询矩阵Wq′和键矩阵Wk′。这些参数作为时间相关表示被注入。 最后,Si′经过前馈网络处理,得到 并输入到展平预测头以预测未来外生变量: 未来外生变量的预测损失被用作训练过程中的时间相关损失: 时间相关注入模块 与时间相关发现模块的处理方式一致,此模块首先对历史内生变量进行分块表示: 随后,采用 相关 Transformer Block 来建模不同内生变量 patch 对未来内生变量的影响,并引入来自时间相关发现模块的相关信息。具体而言,在注意力机制中,输入 token 通过 Correlation Transformer Block 中的原始查询和键矩阵 投影,得到Q,K,V;同时,也通过从时间相关发现模块中提取的Wq′和Wk'投影,得到Q′和 K: 引入可学习加权因子α融合两组注意力分数,得到最终融合注意力分数: 门控计算α: 最终时间token Pi′经过前馈网络处理得到 ,并通过展平