Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >近期值得关注的4个时序大模型研究

近期值得关注的4个时序大模型研究

作者头像
科学最Top
发布于 2024-09-18 09:15:36
发布于 2024-09-18 09:15:36
8660
举报
文章被收录于专栏:科学最Top科学最Top

前言

梳理了近期几篇时间序列大模型研究文章(后台回复:“论文合集”获取),时间序列大模型的研究正在迅速发展,并且在多个领域和应用中展现出巨大的潜力。随着技术的不断进步,预计未来会有更多创新的方法和应用出现,但我感觉目前可以重点关注以下三方面:

基础模型的构建:研究者们正在尝试构建时间序列预测的基础模型,这些模型可以在不同的时间序列数据集上进行预训练,并展示出良好的泛化能力。

模型可解释性:通过文本形式提供解释性的时间序列预测结果,帮助用户更好地理解时间序列数据的模式和趋势。

特定领域的应用:大模型正在被应用于特定领域的时间序列预测,如金融、医疗、交通等,以解决特定问题并提供可解释的预测。

1、UniTS

论文标题:UniTS: Building a Unified Time Series Model

尽管当前的基础模型能够处理序列数据,但它们并不适用于时间序列分析,时间序列分析面临着独特挑战:时间序列数据的多样性和多领域性、预测、分类和其他任务类型之间的任务规范差异,以及对特定任务模型的需求。本文提出UniTS,这是一个统一的时间序列模型,它支持通用的任务规范,能够处理分类、预测、插补和异常检测等任务。这一模型采用了一个创新的统一网络架构,结合了序列和变量注意力机制、动态线性算子,并作为一个统一模型进行训练。在38个跨领域的数据集上,UniTS展现了超越特定任务模型和基于自然语言的LLMs的性能。当评估新的数据领域和任务时,UniTS显示出了卓越的零样本、少量样本学习和提示学习能力。

2、TIME-LLM

论文标题:TIME-LLM: TIME SERIES FORECASTING BY REPROGRAMMING LARGE LANGUAGE MODELS(ICLR2024)

最近的研究揭示了大型语言模型(LLMs)在复杂序列上具有强大的模式识别和推理能力。然而,如何有效地将时间序列数据的模态与自然语言对齐,以利用这些能力仍是挑战。本文中作者提出了TIME-LLM,一个重新编程框架,用于将LLMs重新用于通用的时间序列预测,同时保持骨干语言模型的完整性。我们首先使用文本原型(text prototypes)重新编程输入的时间序列,然后将其输入到冻结的LLM中,以对齐这两种模态。为了增强LLM处理时间序列数据的推理能力,作者提出了Prompt-as-Prefix(PaP),它丰富了输入上下文,并指导了重新编程输入patch的转换。来自LLM的转换后的时间序列补丁最终被投影以获得预测。评估表明:TIME-LLM是一个强大的时间序列学习者,其性能超越了最先进的专门预测模型。此外,TIME-LLM在少量样本和零样本学习场景中表现出色。

3、Chronos

论文标题:Chronos: Learning the Language of Time Series

本文提出了Chronos,一个简单而有效的预训练概率时间序列模型框架。Chronos通过缩放和量化将时间序列值转换为固定词汇表中的标记,并使用交叉熵损失训练现有的基于Transformer的语言模型架构来处理这些标记化的时间序列。其基于T5家族(参数范围从200万到7100万)预训练了Chronos模型,训练数据包括大量公开可用的数据集,并通过高斯过程生成的合成数据集来补充,以提高泛化能力。在包含42个数据集的全面基准测试中,作者展示了Chronos模型:(a) 在训练语料库中的数据集上显著优于其他方法;(b) 在新数据集上的零样本性能与其他专门针对它们训练的方法相当,有时甚至更优。结果表明,Chronos模型能够利用来自不同领域的时间序列数据,提高在未见预测任务上的零样本准确性,将预训练模型定位为一种可行的工具,极大地简化了预测流程。

4、Lag-Llama

论文标题:Lag-Llama: Towards Foundation Models for Probabilistic Time Series Forecasting

在过去的几年中,基础模型因其在零样本和少样本泛化方面的空前能力,在机器学习领域引发了一场范式转变。然而,尽管基础模型在自然语言处理计算机视觉等模态上取得了成功,但针对时间序列预测的基础模型开发却相对滞后。本文提出了Lag-Llama,这是一款基于解码器Transformer架构的通用单变量概率时间序列预测基础模型,它将滞后值作为协变量。Lag-Llama在来自多个领域的多样化时间序列数据的大量语料库上进行了预训练,并在跨领域的下游数据集上与一系列预测模型相比,展现出了强大的零样本泛化能力。此外,当在这些之前未见数据集的相对较小部分上进行微调时,Lag-Llama实现了最先进的性能,超越了之前的深度学习方法,平均而言,成为最佳的通用模型。Lag-Llama作为时间序列预测领域现有技术的强大竞争者,并为未来针对时间序列数据定制的基础模型的进展铺平了道路。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-06-04,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 科学最Top 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
论文拾遗 | 3月论文集锦
作者:Yushan Jiang, Zijie Pan, Xikun Zhang, Sahil Garg, Anderson Schneider, Yuriy Nevmyvaka, Dongjin Song
时空探索之旅
2024/11/19
1640
论文拾遗 | 3月论文集锦
用 Lag-Llama 进行时间序列预测实战
Lag-Llama 是由 LLaMA 团队开发的时间序列基础模型,于2023年发布后迅速受到人工智能界的关注。这些预训练的模型经过大量时间序列数据的预训练,具备了存储不同频率和长度的时间序列数据的一般数据模式的能力,因此能够识别未见过的数据模式,且无需进行大量的微调。对于大型时间序列基础模型进行进一步微调,可以使它们实现与非基础模型相当的预测能力。
数据STUDIO
2024/06/17
1.4K0
用 Lag-Llama 进行时间序列预测实战
谷歌|清华|CMU近期值得关注的3个时序大模型研究
先前整理了4篇时间序列大模型的论文,ICML放榜之后,我重点关注了大模型相关的论文,再次梳理了谷歌、清华和CMU的3近期几篇时间序列大模型研究文章(后台回复:“论文合集”获取,共七篇),时间序列大模型的研究正在迅速发展,并且在多个领域和应用中展现出巨大的潜力,零样本和通用性是大家关注的重点。
科学最Top
2024/09/18
4410
谷歌|清华|CMU近期值得关注的3个时序大模型研究
时间序列分析如何从多种模态中获益?综述与展望
论文标题:How Can Time Series Analysis Benefit From Multiple Modalities? A Survey and Outlook
时空探索之旅
2025/03/28
1330
时间序列分析如何从多种模态中获益?综述与展望
Lag-Llama:时间序列大模型开源了!
之前我们介绍过TimeGPT,它是第一个时间序列的大模型,具有零样本推理、异常检测等能力。TimeGPT引发了对时间序列基础模型的更多研究,但是它是一个专有模型,只能通过API访问。
算法进阶
2024/02/29
1.3K0
Lag-Llama:时间序列大模型开源了!
AI论文速读 | 立场观点:时间序列分析,大模型能告诉我们什么?
题目:Position Paper: What Can Large Language Models Tell Us about Time Series Analysis
时空探索之旅
2024/11/19
1120
AI论文速读 | 立场观点:时间序列分析,大模型能告诉我们什么?
论文精读 |2024[ICLR]Time-LLM:通过重编程大语言模型进行时间序列预测
题目:Time-LLM: Time Series Forecasting by Reprogramming Large Language Models
时空探索之旅
2024/11/19
4930
论文精读 |2024[ICLR]Time-LLM:通过重编程大语言模型进行时间序列预测
Lag-Llama:第一个时间序列预测的开源基础模型介绍和性能测试
2023年10月,我们发表了一篇关于TimeGPT的文章,TimeGPT是时间序列预测的第一个基础模型之一,具有零样本推理、异常检测和共形预测能力。
deephub
2024/02/21
1.3K0
Lag-Llama:第一个时间序列预测的开源基础模型介绍和性能测试
AI论文速读 | UniTS:构建统一的时间序列模型
题目:UniTS: Building a Unified Time Series Model
时空探索之旅
2024/11/19
2260
AI论文速读 | UniTS:构建统一的时间序列模型
【源头活水】大语言模型对时间序列预测真的有用吗?
“问渠那得清如许,为有源头活水来”,通过前沿领域知识的学习,从其他研究领域得到启发,对研究问题的本质有更清晰的认识和理解,是自我提高的不竭源泉。为此,我们特别精选论文阅读笔记,开辟“源头活水”专栏,帮助你广泛而深入的阅读科研文献,敬请关注!
马上科普尚尚
2024/07/29
1360
【源头活水】大语言模型对时间序列预测真的有用吗?
谁说大象不能起舞! 重编程大语言模型实现跨模态交互的时序预测 | ICLR 2024
最近,来自澳大利亚蒙纳士大学、蚂蚁集团、IBM 研究院等机构的研究人员探索了模型重编程 (model reprogramming) 在大语言模型 (LLMs) 上应用,并提出了一个全新的视角:高效重编程大语言模型进行通用时序预测 –- 其提出的 Time-LLM 框架无需修改语言模型即可实现高精度时序预测,在多个数据集和预测任务中超越了传统的时序模型,让 LLMs 在处理跨模态的时间序列数据时展现出色,就像大象起舞一般!
机器之心
2024/04/13
3620
谁说大象不能起舞! 重编程大语言模型实现跨模态交互的时序预测 | ICLR 2024
2024年NIPS中6篇时序大模型研究汇总
1、论文标题:AutoTimes: Autoregressive Time Series Forecasters via Large Language Models(NIPS24)
科学最Top
2024/10/31
4480
2024年NIPS中6篇时序大模型研究汇总
AI论文速读 | ST-LLM—时空大语言模型用于交通预测
这应该是第一个将LLM用于交通预测(时空图预测),这篇由南洋理工大学(NTU)龙程(Cheng Long)老师团队与商汤,北大和德国科隆大学(Cologne)合作完成。且抢先使用了最通用的名字时空大模型名字——ST-LLM。
时空探索之旅
2024/11/19
2710
AI论文速读 | ST-LLM—时空大语言模型用于交通预测
AI论文速读 | TimesFM-ICF:时间序列基础模型的上下文微调
论文标题:In-Context Fine-Tuning for Time-Series Foundation Models
时空探索之旅
2024/11/19
4170
AI论文速读 | TimesFM-ICF:时间序列基础模型的上下文微调
深度学习在时间序列预测的总结和未来方向分析
2023年是大语言模型和稳定扩散的一年,时间序列领域虽然没有那么大的成就,但是却有缓慢而稳定的进展。Neurips、ICML和AAAI等会议都有transformer 结构(BasisFormer、Crossformer、Inverted transformer和Patch transformer)的改进,还出现了将数值时间序列数据与文本和图像合成的新体系结构(CrossVIVIT), 也出现了直接应用于时间序列的可能性的LLM,以及新形式的时间序列正则化/规范化技术(san)。
deephub
2024/02/22
5410
深度学习在时间序列预测的总结和未来方向分析
AI论文速读 | 立场观点:长程时间序列预测中没有冠军
论文标题:Position: There are no Champions in Long-Term Time Series Forecasting
时空探索之旅
2025/03/04
1180
AI论文速读 | 立场观点:长程时间序列预测中没有冠军
AI论文速读 | AutoTimes:利用大语言模型的自回归时间序列预测器
论文标题:AutoTimes: Autoregressive Time Series Forecasters via Large Language Models
时空探索之旅
2024/11/19
3360
AI论文速读 | AutoTimes:利用大语言模型的自回归时间序列预测器
Moirai:Salesforce的时间序列预测基础模型
在过去的几个月中,时间序列基础模型的发展速度一直在加快,每个月都能看到新模型的发布。从TimeGPT 开始,我们看到了 Lag-Llama 的发布,Google 发布了 TimesFM,Amazon 发布了 Chronos,Salesforce 发布了 Moirai。TimesFM是信息最多的模型,而Lag-Llama、Chronos我们都做过详细的介绍。今天我们来详细介绍一下Moirai,这里可能最不知名(相对)就是Salesforce了,所以基本没有介绍 Moirai的文章,我们就来补足这个信息。
deephub
2024/04/15
9081
Moirai:Salesforce的时间序列预测基础模型
AI论文速读 | UniST:提示赋能的通用模型用于城市时空预测
论文标题:UniST: A Prompt-Empowered Universal Model for Urban Spatio-Temporal Prediction
时空探索之旅
2024/11/19
2420
AI论文速读 | UniST:提示赋能的通用模型用于城市时空预测
全面!时间序列和时空数据大模型综述!
大型语言模型(LLM)和预训练基础模型(PFM)在自然语言处理(NLP)、计算机视觉(CV)等领域有广泛应用。时间序列和时空数据本质上都是时间数据,将这两个广泛且内在联系的数据类别的研究结合起来至关重要。尽管深度学习和自监督预训练方法在时间序列和时空数据分析领域逐渐取得进展,但统计模型仍占主导地位。
算法进阶
2024/03/18
4K0
全面!时间序列和时空数据大模型综述!
推荐阅读
相关推荐
论文拾遗 | 3月论文集锦
更多 >
领券
💥开发者 MCP广场重磅上线!
精选全网热门MCP server,让你的AI更好用 🚀
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档