本文作者简介:王世宇,蚂蚁集团算法专家,在AI创新技术部NextEvo主要负责时序算法研究方向,主导时序预测平台建设和时序算法创新研发和架构工作,推动预测与决策联动的双引擎能力。在ICLR, IJCAI, KDD, AAAI, WSDM, ICDM, DASFAA等顶级会议发表多篇论文。
谷歌、Meta、Claude、Perplexity都在争取与苹果AI整合;阿里联合华东师大发布AI视频工具
Claude 3.5 Sonnet发布,比GPT-4o更智能;OpenAI CTO预测1年半“博士级智能”AI将出现
在数据驱动的时代,时序预测成为了许多领域中不可或缺的一部分。从金融市场的波动预测到智能制造中的设备故障预警,时序数据分析的准确性和效率直接影响着决策的质量和速度。
近年来,Transformer模型因其在自然语言处理(NLP)和计算机视觉(CV)中的卓越表现,引起了广泛关注。然而,Transformer在处理时序数据时存在一定的局限性,如计算复杂度高、对长序列数据处理不够高效等问题。
为了解决这些问题,近期蚂蚁集团和清华大学联合推出一种纯MLP架构的模型TimeMixer,在时序预测上的性能和效能两方面全面超越了Transformer模型,实现时序预测双飞轮。
结合对时序趋势周期特性的分解以及多尺度混合的设计模式,不仅在长短程预测性能上大幅提升,而且基于纯MLP架构实现了接近于线性模型的极高效率,实现预测性能和模型效能齐飞。
论文地址:
https://openreview.net/pdf?id=7oLshfEIC2
ARXIV地址:
https://arxiv.org/abs/2405.14616v1
论文代码:
https://github.com/kwuking/TimeMixer
TimeMixer是一种全新的时序预测模型,采用了纯多层感知机(MLP)架构,彻底摒弃了复杂的自注意力机制。该模型通过引入可分解的多尺度混合机制,在保持高精度预测的同时,大幅降低了计算复杂度和训练时间。
TimeMixer模型采用了一个多尺度混合架构,旨在解决时间序列预测中的复杂时间变化问题。该模型主要采用全MLP(多层感知机)架构,由过去可分解混合Past Decomposable Mixing (PDM) 和未来多预测器混合Future Multipredictor Mixing (FMM) 两大块构成,能够有效利用多尺度序列信息。
PDM以季节和趋势混合为动力,将详细的季节信息由细到粗逐步聚合,并利用较粗尺度的先验知识深入挖掘宏观趋势信息,最终实现过去信息提取中的多尺度混合。
为了验证TimeMixer的性能,我们在包含长程预测,短程预测,多元时序预测以及具有时空图结构的18组基准数据集上进行了实验,包括电力负荷预测、气象数据预测和股票价格预测等。实验结果表明,TimeMixer在多个指标上全面超越了当前最先进的Transformer模型,具体表现如下:
本文介绍了TimeMixer这一全新的时序预测模型。通过引入可分解的多尺度混合机制,TimeMixer在保证高预测精度的同时,实现了显著的计算效率提升。实验结果表明,TimeMixer在多个公开数据集上的表现全面超越现有基准模型,包括Transformer极其多种变体在内。
TimeMixer的成功不仅为时序预测领域带来了新的思路,也展示了纯MLP结构在复杂任务中的潜力。未来,随着更多优化技术和应用场景的引入,相信TimeMixer将进一步推动时序预测技术的发展,为各行业带来更大的价值。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。