论文标题:Hi-Patch: Hierarchical Patch GNN for Irregular Multivariate Time Series
论文链接:https://01zhangbw.github.io/files/Hi-Patch.pdf
现有多尺度分析方法的局限性:在不规则多元时间序列(IMTS)建模中,多数现有时间序列多尺度分析方法对所有变量采用相同处理方式,而IMTS中变量具有不同的原始尺度/采样率,这导致这些方法难以适配,例如稀疏采样变量因缺乏细粒度特征,其下采样视图无意义,密集采样变量则需要多次下采样却难以确定统一合适的层级。
现有IMTS建模方法的不足:部分方法通过插值将IMTS规则化,可能破坏原始序列的采样模式;部分直接从原始数据学习的方法多聚焦于单尺度特征,难以全面捕捉IMTS的多尺度特征及不同尺度下的变量间相关性。
本文提出一种分层补丁图网络Hi-Patch,通过 intra-patch 图层和 inter-patch 图层,分别捕捉密集采样变量的局部依赖和不同尺度下稀疏与密集采样变量的全局依赖,实现对IMTS的有效多尺度建模。
01 观测编码器(Observation Encoder)
原理:将每个观测值编码为图节点嵌入,分别对时间、变量和观测值进行编码后融合。时间编码采用连续时间嵌入函数,结合线性项与正弦函数捕捉时间动态;变量编码通过可学习嵌入矩阵表示变量身份;值编码通过线性层映射观测值。最终节点嵌入为三者相加后经ReLU激活。
优势:综合考虑时间、变量和观测值的特征,为后续图网络处理奠定基础,能够有效保留IMTS的原始特性。
02 Patch内图层(Intra-Patch Graph Layer)
patch划分:按固定时间跨度将历史观测划分为多个非重叠patch,每个patch包含该时间段内所有变量的观测节点,主要针对密集采样变量形成细粒度视图。
图构建与更新:每个patch内构建全连接图,通过图注意力网络(GAT)更新节点状态,捕捉三类局部依赖:同一变量不同时间点、不同变量同一时间点(同步)、不同变量不同时间点(异步),并采用三组注意力参数矩阵分别处理。
聚合:对每个patch内同一变量的节点,计算平均观测时间戳作为参考时间,通过多时间注意力聚合为patch级变量特征节点,对无观测的变量不创建聚合节点,保留不规则性。
03 patch间图层(Inter-Patch Graph Layer)
更新:基于patch内图层输出的聚合节点构建对应尺度图,连接相邻patch的节点,通过GAT捕捉该尺度下的时间和变量依赖,包括密集和部分稀疏采样变量。
聚合:将相邻patch的同一变量节点聚合为更大尺度的特征节点,计算相邻节点的平均时间戳作为参考时间,通过多时间注意力实现聚合,形成新的节点集作为下一层输入。
分层架构:堆叠多层patch间图层,逐步提取更大尺度的特征,最终输出每个变量的单一节点嵌入,下层提取密集变量细粒度特征,上层提取所有变量粗粒度特征。
04 任务解码器(Task Decoder)
分类任务:对各变量的节点嵌入按通道求和得到对应维度向量,通过全连接层和Softmax输出分类概率,训练目标为最小化交叉熵损失。
预测任务:对于查询,将查询变量的节点嵌入与查询时间嵌入拼接,经MLP投影层生成预测结果,训练目标为最小化均方误差(MSE)损失。
性能优势
在预测任务中,基于MSE和MAE指标,Hi-Patch在多数数据集上表现最优,例如在Human Activity数据集上,MSE为2.57×10⁻³,MAE为3.11×10⁻²,优于Warpformer等基线;在分类任务中,基于AUROC和AUPRC指标,其在P19、PhysioNet等数据集上均取得最佳结果,如P19的AUROC达92.1%,AUPRC达61.1%。整体而言,Hi-Patch在72项指标中的62项上表现最优。
消融实验
通过消融实验验证了各核心组件的有效性:去除分层架构(w/o Hie)、异步依赖捕捉(w/o DVDT)、多组注意力参数(w/o 3W)或多时间注意力聚合(w/o TEAGG)均会导致性能下降,其中多时间注意力聚合对性能影响尤为显著。
核心贡献:提出分层patch图网络架构,通过patch内/patch间图层灵活捕捉不规则多元时间序列的多尺度依赖;无需插值处理,保留数据原始特性,在预测和分类任务中均表现优异。
局限与未来方向:模型在密集采样数据集上的可扩展性有限,主要因patch内图层计算复杂度与节点数平方成正比。未来将优化patch内图层的计算效率,探索自适应多尺度建模方法,根据样本的时间特性选择最合适的尺度以进一步提升性能。