前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Informer:用于长序列时间序列预测的新型transformer 模型

Informer:用于长序列时间序列预测的新型transformer 模型

作者头像
deephub
发布于 2021-04-16 08:54:27
发布于 2021-04-16 08:54:27
3.2K0
举报
文章被收录于专栏:DeepHub IMBADeepHub IMBA

transformer 彻底改变了自然语言处理,并在神经机器翻译,分类和命名实体识别等领域进行了重大改进。最初,transformer 在时间序列领域很难应用。但是在过去的一年半中,出现了一些用于时间序列分类和预测的transformer 变体。我们已经看到了诸如时间融合,卷积,双阶段注意力模型以及更多尝试进入时间序列的模型。最新的Informer模型建立在这一趋势的基础上,并合并了几个新的组件。

Informer旨在改善自我注意机制,减少记忆使用,加快推理速度。Informer同时利用了transformer 编码器层和(掩码)transformer 解码器层。该解码器可以有效地在一次前向传递中预测长序列。当预测长序列时,这一特性有助于加快推理速度。Informer模型采用概率注意机制来预测长序列。Informer还包括学习嵌入相关的时间特征。这允许模型生成一个有效的基于任务的时间表示。最后,Informer同样可以根据任务的复杂性堆栈n个级别的编码器和解码器。

概率vs全注意力

为了减少自注意的时间复杂性,作者引入了概率注意。与传统的O(L²)相比,这种概率注意力机制实现了O(L log L)复杂度。传统的自注意存在这样的问题:只有少数k、v对注意力分数起主要作用。这意味着大多数计算出来的点积实际上毫无价值。稀疏注意力 ProbSparse允许每个k只关注主要的查询q,而不是所有的查询。这使模型仅能为查询/值张量的一小部分计算进行昂贵的运算。特别是ProbSparse机制还具有一个因素,可以指定预测。该因数控制着您减少注意力计算的程度。

基准数据集测试

作者在几个主要与电力预测有关的时间序列数据集上对Informer进行了基准测试:特别是电力变压器和用电负荷。他们测试了预测几个不同时间间隔数据的模型,包括在天气预报数据集上测试了模型。他们使用MSE和MAE作为评估指标,并将Informer的性能与其他几种transformer 变型以及流行的LSTM模型进行比较。

将模型移植到流量预测中

尽管与我们的完整transformer模型和Informer模型有相似之处,但将模型移到我们的框架中是一个挑战,原因有几个。最大的问题与我们的训练循环和数据加载器如何将数据传递给模型有关。因此,重构核心功能需要花费大量时间

我们一共做了以下调整

  1. 增加了详细的解释核心组件的文档字符串
  2. 重构了几个函数,以改善代码的整洁性和体系结构
  3. 像其他流量预测模型一样,允许在多个目标之间进行交换

我们仍在用我们的格式验证模型是否能再现原始论文的结果。然而,我们希望很快就能完成。

我们现在有几个关于如何在流量预测中使用Informer进行时间序列预测的教程。您可以访问这个Kaggle 代码(https://www.kaggle.com/isaacmg/pytorch-time-series-forecasting-with-the-informer),以获得使用Informer的快速教程。

论文地址:https://arxiv.org/abs/2012.07436

本文作者:Isaac Godfried

原为地址:https://towardsdatascience.com/adding-the-informer-model-to-flow-forecast-f866bbe472f0

deephub翻译组

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-04-09,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DeepHub IMBA 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
如何将 Transformer 应用于时间序列模型
在机器学习的广阔前景中,transformers 就像建筑奇迹一样高高耸立,以其复杂的设计和捕获复杂关系的能力重塑了我们处理和理解大量数据的方式。
数据科学工厂
2023/09/24
8130
如何将 Transformer 应用于时间序列模型
深度时间序列预测和基础模型的研究进展
本文综述了深度学习在时间序列预测中的应用,特别是在流行病预测领域。尽管深度学习在时间序列预测中表现出显著优势,但仍面临挑战,如时间序列不够长、无法利用积累的科学知识以及模型的解释性。
算法进阶
2024/07/10
3190
深度时间序列预测和基础模型的研究进展
长时间预测模型DLinear、NLinear模型
今年发布8月份发布的一篇有关长时间序列预测(SOTA)的文章,DLinear、NLinear在常用9大数据集(包括ETTh1、ETTh2、ETTm1、ETTm2、Traffic等)上MSE最低,模型单变量、多变量实验数据:
机器学习AI算法工程
2023/09/04
1.3K0
长时间预测模型DLinear、NLinear模型
Informer|时间序列研究之必读核心论文
所以从这篇开始,我也会同步记录自己阅读时间序列论文的笔记。但根据我的经验,由于相关论文太多,刚刚入坑的同学大多是不知道该从哪篇读起的,这是因为新手(包括我自己)往往对当前的研究的发展脉络是没有整体概念的。
科学最Top
2024/09/18
1490
Informer|时间序列研究之必读核心论文
时间序列+Transformer!
Transformer在自然语言处理和计算机视觉领域表现优秀,但在时间序列预测方面不如线性模型。
算法进阶
2024/02/29
1.5K0
时间序列+Transformer!
2022年深度学习在时间序列预测和分类中的研究进展综述
时间序列预测的transformers的衰落和时间序列嵌入方法的兴起,还有异常检测、分类也取得了进步
deephub
2023/02/01
2K0
AAAI21最佳论文Informer:效果远超Transformer的长序列预测神器!
在很多实际应用问题中,我们需要对长序列时间序列进行预测,例如用电使用规划。长序列时间序列预测(LSTF)要求模型具有很高的预测能力,即能够有效地捕捉输出和输入之间精确的长程相关性耦合。最近的研究表明,Transformer具有提高预测能力的潜力。
炼丹笔记
2021/05/14
1.2K0
AAAI21最佳论文Informer:效果远超Transformer的长序列预测神器!
AAAI 2021最佳论文Informer:效果远超Transformer的长序列预测神器!
在很多实际应用问题中,我们需要对长序列时间序列进行预测,例如用电使用规划。长序列时间序列预测(LSTF)要求模型具有很高的预测能力,即能够有效地捕捉输出和输入之间精确的长程相关性耦合。最近的研究表明,Transformer具有提高预测能力的潜力。
新智元
2021/03/10
1.1K0
AAAI 2021最佳论文Informer:效果远超Transformer的长序列预测神器!
Transformer时间序列预测!
【导读】大家好,我是泳鱼。一个乐于探索和分享AI知识的码农!今天带来的这篇文章,提出了一种基于Transformer的用于长期时间序列预测的新方法PatchTST,取得了非常显著的效果。希望这篇文章能对你有所帮助,让你在学习和应用AI技术的道路上更进一步!
算法进阶
2023/08/28
1.8K1
Transformer时间序列预测!
深度学习在时间序列预测的总结和未来方向分析
2023年是大语言模型和稳定扩散的一年,时间序列领域虽然没有那么大的成就,但是却有缓慢而稳定的进展。Neurips、ICML和AAAI等会议都有transformer 结构(BasisFormer、Crossformer、Inverted transformer和Patch transformer)的改进,还出现了将数值时间序列数据与文本和图像合成的新体系结构(CrossVIVIT), 也出现了直接应用于时间序列的可能性的LLM,以及新形式的时间序列正则化/规范化技术(san)。
deephub
2024/02/22
5420
深度学习在时间序列预测的总结和未来方向分析
时间序列预测一定需要深度学习模型吗?
时间序列预测是机器学习中的一项常见的任务,具有非常广泛的应用,例如:电力能源、交通流量和空气质量等预测。传统的时间序列预测模型往往依赖于滚动平均、向量自回归和自回归综合移动平均。另一方面,最近有人提出了深度学习和矩阵分解模型来解决时间序列预测问题,并获得了更具竞争力的性能,但是该类模型往往过于复杂。
Datawhale
2022/05/29
5690
时间序列预测一定需要深度学习模型吗?
使用 TiDE 进行时间序列预测
时间序列预测一直是数据科学领域的一个热门研究课题,广泛应用于能源、金融、交通等诸多行业。传统的统计模型如ARIMA、GARCH等因其简单高效而被广泛使用。而近年来,随着深度学习的兴起,基于神经网络的预测模型也备受关注,表现出了强大的预测能力。
数据STUDIO
2024/07/24
5350
使用 TiDE 进行时间序列预测
干货 | 深度多元时序模型在携程关键指标预测场景下的探索应用
doublering,携程高级算法工程师,关注自然语言处理、LLMs、时序预测等领域。
携程技术
2023/10/27
1.7K1
干货 | 深度多元时序模型在携程关键指标预测场景下的探索应用
时序预测的深度学习算法介绍
深度学习方法是一种利用神经网络模型进行高级模式识别和自动特征提取的机器学习方法,近年来在时序预测领域取得了很好的成果。常用的深度学习模型包括循环神经网络(RNN)、长短时记忆网络(LSTM)、门控循环单元(GRU)、卷积神经网络(CNN)、注意力机制(Attention)和混合模型(Mix )等,与机器学习需要经过复杂的特征工程相比,这些模型通常只需要经数据预处理、网络结构设计和超参数调整等,即可端到端输出时序预测结果。深度学习算法能够自动学习时间序列数据中的模式和趋势,神经网络涉及隐藏层数、神经元数、学习率和激活函数等重要参数,对于复杂的非线性模式,深度学习模型有很好的表达能力。在应用深度学习方法进行时序预测时,需要考虑数据的平稳性和周期性,选择合适的模型和参数,进行训练和测试,并进行模型的调优和验证。来源:轮回路上打碟的小年轻(侵删)
数据STUDIO
2023/09/04
1.8K0
时序预测的深度学习算法介绍
如何利用Transformer建立时间序列预测模型
我最近读了一篇非常有趣的论文,叫做 Deep Transformer Models for Time Series Forecasting: The Influenza Prevalence Case。我认为这可能是一个有趣的项目,他的实现是从头开始的,并且可以帮助你了解更多关于时间序列预测。
deephub
2021/05/18
5.3K0
如何利用Transformer建立时间序列预测模型
深度学习时间序列异常检测方法
本文全面概述了深度学习用于时间序列异常检测的最新架构,提供了基于策略和模型的方法,并讨论了各种技术的优点和局限性。此外,还举例说明了近年来深度学习在时间序列异常检测中各领域的应用。
算法进阶
2024/07/11
1.1K0
深度学习时间序列异常检测方法
如何搭建适合时间序列预测的Transformer模型?
今天又是一篇Transformer梳理文章,这次应用场景是时间序列预测。Transformer的序列建模能力,让其天然就比较适合时间序列这种也是序列类型的数据结构。但是,时间序列相比文本序列也有很多特点,例如时间序列具有自相关性或周期性、时间序列的预测经常涉及到周期非常长的序列预测任务等。这些都给Transformer在时间序列预测场景中的应用带来了新的挑战,也使业内出现了一批针对时间序列任务的Transformer改造。下面就给大家介绍7篇Transformer在时间序列预测中的应用。
圆圆的算法笔记
2022/09/22
3.2K0
如何搭建适合时间序列预测的Transformer模型?
用于时间序列预测的最佳深度学习模型总结
Makridakis M-Competitions系列(分别称为M4和M5)分别在2018年和2020年举办(M6也在今年举办了)。对于那些不了解的人来说,m系列得比赛可以被认为是时间序列生态系统的一种现有状态的总结,为当前得预测的理论和实践提供了经验和客观的证据。
数据STUDIO
2023/09/04
1.2K0
用于时间序列预测的最佳深度学习模型总结
Block Recurrent Transformer:结合了LSTM和Transformer优点的强大模型
在以前的文章中,我们讨论过Transformer并不适合时间序列预测任务。为了解决这个问题Google创建了Hybrid Transformer-LSTM模型,该模型可以实现SOTA导致时间序列预测任务。
deephub
2022/11/11
1.3K0
Block Recurrent Transformer:结合了LSTM和Transformer优点的强大模型
时间序列预测的零样本学习:TimeGPT vs. TiDE
在本文中,我们将讨论一个通用的预训练模型能否解决预测任务的范式转变。我们通过使用TimeGPT进行零样本学习并对模型的性能进行了彻底分析。然后将TimeGPT的性能与TiDE[2]进行比较(TiDE是一种在预测用例中击败了Transformer的简单的多层感知机)。
数据STUDIO
2024/04/11
7210
时间序列预测的零样本学习:TimeGPT vs. TiDE
推荐阅读
相关推荐
如何将 Transformer 应用于时间序列模型
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档