Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >近期值得关注的4个时序大模型研究

近期值得关注的4个时序大模型研究

作者头像
科学最Top
发布于 2024-09-18 09:15:36
发布于 2024-09-18 09:15:36
8660
举报
文章被收录于专栏:科学最Top科学最Top

前言

梳理了近期几篇时间序列大模型研究文章(后台回复:“论文合集”获取),时间序列大模型的研究正在迅速发展,并且在多个领域和应用中展现出巨大的潜力。随着技术的不断进步,预计未来会有更多创新的方法和应用出现,但我感觉目前可以重点关注以下三方面:

基础模型的构建:研究者们正在尝试构建时间序列预测的基础模型,这些模型可以在不同的时间序列数据集上进行预训练,并展示出良好的泛化能力。

模型可解释性:通过文本形式提供解释性的时间序列预测结果,帮助用户更好地理解时间序列数据的模式和趋势。

特定领域的应用:大模型正在被应用于特定领域的时间序列预测,如金融、医疗、交通等,以解决特定问题并提供可解释的预测。

1、UniTS

论文标题:UniTS: Building a Unified Time Series Model

尽管当前的基础模型能够处理序列数据,但它们并不适用于时间序列分析,时间序列分析面临着独特挑战:时间序列数据的多样性和多领域性、预测、分类和其他任务类型之间的任务规范差异,以及对特定任务模型的需求。本文提出UniTS,这是一个统一的时间序列模型,它支持通用的任务规范,能够处理分类、预测、插补和异常检测等任务。这一模型采用了一个创新的统一网络架构,结合了序列和变量注意力机制、动态线性算子,并作为一个统一模型进行训练。在38个跨领域的数据集上,UniTS展现了超越特定任务模型和基于自然语言的LLMs的性能。当评估新的数据领域和任务时,UniTS显示出了卓越的零样本、少量样本学习和提示学习能力。

2、TIME-LLM

论文标题:TIME-LLM: TIME SERIES FORECASTING BY REPROGRAMMING LARGE LANGUAGE MODELS(ICLR2024)

最近的研究揭示了大型语言模型(LLMs)在复杂序列上具有强大的模式识别和推理能力。然而,如何有效地将时间序列数据的模态与自然语言对齐,以利用这些能力仍是挑战。本文中作者提出了TIME-LLM,一个重新编程框架,用于将LLMs重新用于通用的时间序列预测,同时保持骨干语言模型的完整性。我们首先使用文本原型(text prototypes)重新编程输入的时间序列,然后将其输入到冻结的LLM中,以对齐这两种模态。为了增强LLM处理时间序列数据的推理能力,作者提出了Prompt-as-Prefix(PaP),它丰富了输入上下文,并指导了重新编程输入patch的转换。来自LLM的转换后的时间序列补丁最终被投影以获得预测。评估表明:TIME-LLM是一个强大的时间序列学习者,其性能超越了最先进的专门预测模型。此外,TIME-LLM在少量样本和零样本学习场景中表现出色。

3、Chronos

论文标题:Chronos: Learning the Language of Time Series

本文提出了Chronos,一个简单而有效的预训练概率时间序列模型框架。Chronos通过缩放和量化将时间序列值转换为固定词汇表中的标记,并使用交叉熵损失训练现有的基于Transformer的语言模型架构来处理这些标记化的时间序列。其基于T5家族(参数范围从200万到7100万)预训练了Chronos模型,训练数据包括大量公开可用的数据集,并通过高斯过程生成的合成数据集来补充,以提高泛化能力。在包含42个数据集的全面基准测试中,作者展示了Chronos模型:(a) 在训练语料库中的数据集上显著优于其他方法;(b) 在新数据集上的零样本性能与其他专门针对它们训练的方法相当,有时甚至更优。结果表明,Chronos模型能够利用来自不同领域的时间序列数据,提高在未见预测任务上的零样本准确性,将预训练模型定位为一种可行的工具,极大地简化了预测流程。

4、Lag-Llama

论文标题:Lag-Llama: Towards Foundation Models for Probabilistic Time Series Forecasting

在过去的几年中,基础模型因其在零样本和少样本泛化方面的空前能力,在机器学习领域引发了一场范式转变。然而,尽管基础模型在自然语言处理计算机视觉等模态上取得了成功,但针对时间序列预测的基础模型开发却相对滞后。本文提出了Lag-Llama,这是一款基于解码器Transformer架构的通用单变量概率时间序列预测基础模型,它将滞后值作为协变量。Lag-Llama在来自多个领域的多样化时间序列数据的大量语料库上进行了预训练,并在跨领域的下游数据集上与一系列预测模型相比,展现出了强大的零样本泛化能力。此外,当在这些之前未见数据集的相对较小部分上进行微调时,Lag-Llama实现了最先进的性能,超越了之前的深度学习方法,平均而言,成为最佳的通用模型。Lag-Llama作为时间序列预测领域现有技术的强大竞争者,并为未来针对时间序列数据定制的基础模型的进展铺平了道路。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-06-04,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 科学最Top 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
图解:什么是B-树、B+树、B*树
6.非叶子结点的关键字:K[1], K[2], …, K[M-1];且K[i] < K[i+1];
你好戴先生
2020/09/03
10.8K2
DS高阶:B树系列
        若接近有序的数据插入到BS中,会导致退化成单支树,时间复杂度退化为O(N)
小陈在拼命
2024/05/26
1060
DS高阶:B树系列
【高阶数据结构】B-树详解
以上结构适合用于数据量相对不是很大,能够一次性存放在内存中,进行数据查找的场景(内查找)。
YIN_尹
2024/02/08
8290
【高阶数据结构】B-树详解
MySQL索引底层:B+树详解
当我们发现SQL执行很慢的时候,自然而然想到的就是加索引。对于范围查询,索引的底层结构就是B+树。今天我们一起来学习一下B+树哈~
捡田螺的小男孩
2021/03/15
7770
文心一言 VS 讯飞星火 VS chatgpt (251)-- 算法导论18.2 4题
B树(B-tree)是一种自平衡的树,常用于数据库和文件系统的索引结构。在B树中,每个节点最多有 m 个子节点(对于B树,m 是阶数,即节点的最大子节点数),并且每个非根节点至少有 ⌈m/2⌉ 个子节点(其中 ⌈x⌉ 表示不小于 x 的最小整数)。
福大大架构师每日一题
2024/05/18
1000
文心一言 VS 讯飞星火 VS chatgpt (251)-- 算法导论18.2 4题
文心一言 VS 讯飞星火 VS chatgpt (167)-- 算法导论13.1 7题
每个节点或是红色,或是黑色。根节点是黑色。每个叶节点(NIL或空节点)是黑色。如果一个节点是红色的,则它的两个子节点都是黑色。从任一节点到其每个叶节点的所有路径都包含相同数目的黑色节点。要使红黑树中红色内部结点与黑色内部结点的比值最大,我们需要考虑以下策略:
福大大架构师每日一题
2023/12/29
1580
文心一言 VS 讯飞星火 VS chatgpt (167)-- 算法导论13.1 7题
算法数据结构(一)-B树
介绍 B树的目的为了硬盘快速读取数据(降低IO操作次树)而设计的一种平衡的多路查找树。目前大多数据库及文件索引,都是使用B树或变形来存储实现。 目录 为什么B树效率高 B树存储 B树缺点 为什么B树效
蘑菇先生
2018/05/21
8340
算法和数据结构: 十 平衡查找树之B树
前面讲解了平衡查找树中的2-3树以及其实现红黑树。2-3树种,一个节点最多有2个key,而红黑树则使用染色的方式来标识这两个key。
yaphetsfang
2020/07/30
4120
算法和数据结构: 十 平衡查找树之B树
从B 树、B+ 树、B* 树谈到R 树
说明:本文从B树开始谈起,然后论述B+树、B*树,最后谈到R 树。其中B树、B+树及B*树部分由weedge完成,R 树部分由Frankie完成,全文最终由July统稿修订完成。
bear_fish
2018/09/14
2.3K0
从B 树、B+ 树、B* 树谈到R 树
数据结构 —— B树和B+树
​ 最近在学习数据库相关的知识,了解到数据库很多是采用B-/+树作为索引,例如Mysql的InnoDB引擎使用的B+树、MongoDB默认采用B树作为索引。
俺也想起舞
2021/12/24
6.6K0
数据结构 —— B树和B+树
MySQL数据库索引选择为什么使用B+树而不是跳表?
在进一步分析为什么MySQL数据库索引选择使用B+树之前,我相信很多小伙伴对数据结构中的树还是有些许模糊的,因此我们由浅入深一步步探讨树的演进过程,在一步步引出B树以及为什么MySQL数据库索引选择使用B+树!
小冷coding
2023/05/24
7750
MySQL数据库索引选择为什么使用B+树而不是跳表?
6.3.2 B+树基本概念
2)非叶根(不是叶子的根结点)结点至少有两棵子树,其他每个分支结点至少有【m/2】(向下取整)棵子树。(B树是要求至少2棵子树)
week
2018/08/24
4440
数据结构 之 树总结
   特点:二叉树每个节点最多只有两个子节点, 分为左右子树, 且左子树 < 节点 < 右子树。
菜的黑人牙膏
2019/01/21
5520
数据库底层数据结构 B树B+树LSM树 详解对比与总结
我们熟知常用数据库MySQL MongoDB HBase等底层存储都用了各种树结构,如B树LSM树,不过为什么要用这些结构呢?
大鹅
2021/06/16
5.4K0
python算法与数据结构-数据结构中常用树的介绍(45)
树是一种非线性的数据结构,是由n(n >=0)个结点组成的有限集合。 如果n==0,树为空树。 如果n>0, 树有一个特定的结点,根结点 根结点只有直接后继,没有直接前驱。 除根结点以外的其他结点划分为m(m>=0)个互不相交的有限集合,T0,T1,T2,...,Tm-1,每个结合是一棵树,称为根结点的子树。
Se7eN_HOU
2019/07/08
8310
你好,我是B树
b)x.key:为节点中存储的关键字。x.key1、x.key2 ... x.keyx.n 以非降序顺序排列,满足 x.key1 <= x.key2 ... <= x.keyx.n。
WindWant
2021/07/23
3390
常用的算法和数据结构 面试_数据结构与算法面试题80道
定义:最先发明的自平衡二叉查找树。在AVL树中任何节点的两个子树的高度最大差别为一,所以它也被称为高度平衡树。查找、插入和删除在平均和最坏情况下都是O(log n)。增加和删除可能需要通过一次或多次树旋转来重新平衡这个树。
全栈程序员站长
2022/09/23
7820
常用的算法和数据结构 面试_数据结构与算法面试题80道
数据库索引(结合B-树和B+树)
数据库索引,是数据库管理系统中一个排序的数据结构以协助快速查询、更新数据库表中数据。索引的实现通常使用B树及其变种B+树。 在数据之外,数据库系统还维护着满足特定查找算法的数据结构,这些数据结构以某种
Mister24
2018/05/14
9430
万字长文彻底搞懂二叉树
一棵树由称作跟的节点r以及0个或多个非空的树T1,T2, ...Tk组成,这些子树中每一颗的根都被来至根r的一条有向的边所连接。
码老思
2023/10/19
7700
万字长文彻底搞懂二叉树
【MySQL一】开发人心里都该有的那颗 B 树
对该二叉树的节点进行查找发现深度为1的节点的查找次数为1,深度为2的查找次数为2,深度为n的节点的查找次数为n,因此其平均查找次数为(1+2+2+3+3+3) / 6 = 2.3次
周三不加班
2019/09/03
6420
【MySQL一】开发人心里都该有的那颗 B 树
推荐阅读
相关推荐
图解:什么是B-树、B+树、B*树
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档