Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >将word2vec用于非字符串输入(如时间序列分析)是否有意义?

将word2vec用于非字符串输入(如时间序列分析)是否有意义?
EN

Data Science用户
提问于 2019-08-03 06:32:09
回答 3查看 954关注 0票数 3

我正在做一个在时间序列中检测异常的项目。我想知道是否可以使用word2vec来检测像汇率这样的非字符串输入的异常?

EN

回答 3

Data Science用户

发布于 2019-10-19 01:30:34

简而言之,答案是肯定的。一般来说,NLP和时间序列的域是非常相似的,因为它们都是序列数据。主要的区别是文本是离散的,而信号的值属于连续空间。因此,离散一个时间序列(关于它可以取的值),我们可以在离散空间中有一个序列。

已有许多基于时间序列离散化的算法,其中一些算法实际上将时间序列转换为文字。最流行的时间序列表示有PAA、SAX老板科特和最近的Signal2Vec

Signal2vec (我是作者之一)包括两个步骤。第一种是对时间序列进行离散化,这种情况可以使用聚类算法或任何其他离散化方法来实现。第二步是Word2vec模型,它既可以应用于每个符号,也可以应用于由离散化时间序列的符号构成的单词。

就异常检测而言,您可以使用上述任何时间序列表示。也有非常好的调查比较异常检测方法的时间序列,我强烈建议阅读至少最近的方法,以了解最先进的方法。我还会推荐矩阵轮廓,它实现起来非常简单,而且非常健壮。

票数 1
EN

Data Science用户

发布于 2019-08-03 07:55:37

Word2vec的目标是将序列中的每个元素表示为“嵌入空间”,即“相似”元素位于较低维度的空间。

我认为这对时间序列分析来说有点离题。如果要检测异常值,可以尝试查看每个数据点与趋势的归一化距离,并设置一个阈值。

或者,如果你真的想坚持使用神经网络,你可以使用自动编码器。它们可以应用于异常点检测,但它不是实现的最简单的模型。

票数 0
EN

Data Science用户

发布于 2021-11-12 05:03:30

不- word2vec算法假设数据是一系列离散符号.汇率是连续的。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/56894

复制
相关文章
在时间序列中使用Word2Vec学习有意义的时间序列嵌入表示
向量表示是机器学习生态系统中的一个关键概念。无论进行什么样的任务,我们总是试图训练找所掌握的数据的意义而机器学中通常使用数字向量来对数据进行描述,发现隐藏的行为,产生有价值的见解。
deephub
2022/06/04
1.3K0
在时间序列中使用Word2Vec学习有意义的时间序列嵌入表示
时间序列分析:对非平稳时间序列进行建模
编者按 曾经有位小伙伴在公众号留言提问:如何做时间序列分析?最近C君发现了一篇文章,也许可以解答这个问题,收录在此,以飨读者。本文来自于数据人网。 如果你有数据分析相关的问题,也可以公众号留言提问,说不定C君可以帮你找到答案。发现优质文章,也可以推荐给C君。祝,学习快乐~ 在这篇博客中,我将会简单的介绍一下时间序列分析及其应用。这里,我们将使用匹兹堡大学的教授David Stoffer所开发的R包astsa进行时间序列分析。而与之相关的课本,可以在Time Series Analysis and Its A
CDA数据分析师
2018/02/24
3.8K0
时间序列分析:对非平稳时间序列进行建模
通过FEDOT将AutoML用于时间序列数据
大多数现代开源AutoML框架并没有广泛地涵盖时间序列预测任务。本文中我们将深入地研究AutoML框架之一FEDOT,它可以自动化时间序列预测的机器学习管道设计。因此,我们将通过时间序列预测的现实世界任务详细解释FEDOT的核心正在发生什么。
deephub
2021/07/23
9140
通过FEDOT将AutoML用于时间序列数据
时间序列分析这件小事(六)--非平稳时间序列与差分
之前我们说明了怎么样的时间序列是序列平稳的,但是世界并不是那么美好,很多时间序列都不是平稳序列,所以这里就要求我们做一些处理了。
钱塘小甲子
2019/01/28
3.7K0
非平稳时间序列
若非平稳序列经过差分后能显示出平稳序列的性质,我们就可以称这个非平稳序列为差分平稳序列,而ARIMA模型拟合就相当于给差分平稳序列使用ARMA模型进行拟合。 一般情况下ARIMA模型记为ARIMA(p,d,q),其中p、d、q分别为ARMA模型的阶数,d为差分阶数,d=0时,ARIMA模型就是ARMA模型:
爱编程的小明
2023/04/27
8840
非平稳时间序列
R中季节性时间序列分析及非季节性时间序列分析
①SAM(Simple Moving Average) 简单移动平均,将时间序列上前n个数值做简单的算术平均。 SMAn=(x1+x2+…xn)/n
Erin
2022/05/09
1.8K0
R中季节性时间序列分析及非季节性时间序列分析
用于时间序列分析的 5 个Python 库
时间序列分析是数据科学家最常见的问题之一。大多数时间序列解决方案涉及经济预测、资源需求预测、股票市场分析和销售分析。
deephub
2021/08/20
1.2K0
如何将 Transformer 应用于时间序列模型
在机器学习的广阔前景中,transformers 就像建筑奇迹一样高高耸立,以其复杂的设计和捕获复杂关系的能力重塑了我们处理和理解大量数据的方式。
数据科学工厂
2023/09/24
8090
如何将 Transformer 应用于时间序列模型
用于时间序列预测的AutoML
最近,参加了AutoSeries —时间序列数据的AutoML竞赛,在其中设法获得40个竞争对手(决赛中的15个)的第一名。这篇文章是解决方案的概述。
代码医生工作室
2020/01/17
1.9K0
用于时间序列预测的AutoML
用python做时间序列预测四:平稳/非平稳时间序列
1、序列的均值(mean)不应该是时间的函数(意思是不应该随时间变化),而应该是一个常数。下面的左图满足这个条件,而右图的均值受时间的变化影响。
程序员一一涤生
2020/06/03
6.2K0
PCA不适用于时间序列分析的案例研究
在大部份情况下我们都可以使用 PCA 进行线性降维。从图像处理到非结构化数据,无时无刻不在。我们甚至可以将它用于时间序列分析,虽然有更好的技术。在这篇文章中,我想向您介绍动态模式分解 (DMD),这是一种源自我的研究领域:流体动力学的用于高维时间序列的线性降维技术。DMD 结合了两个世界中的优点:PCA 和傅立叶变换。在数学上,它与动力系统理论中的一个基本算子有关,称为 Koopman 算子。但在深入研究 DMD 的数学之前,让我们用一个相当简单的例子来说明为什么 PCA 不是高维时间序列分析的最佳选择。
deephub
2021/07/23
1.6K0
PCA不适用于时间序列分析的案例研究
用于时间序列预测的Python环境
Python生态系统正在不断的成长和壮大,并可能成为应用机器学习的主要平台。
李郑
2018/02/08
3K0
2022年10个用于时间序列分析的Python库推荐
去年我们整理了一些用于处理时间序列数据的Python库,现在已经是2022年了,我们看看又有什么新的推荐
deephub
2022/11/11
1.6K0
2022年10个用于时间序列分析的Python库推荐
python时间序列分析代码_时间序列分析VAR实验报告
题记:毕业一年多天天coding,好久没写paper了。在这动荡的日子里,也希望写点东西让自己静一静。恰好前段时间用python做了一点时间序列方面的东西,有一丁点心得体会想和大家分享下。在此也要特别感谢顾志耐和散沙,让我喜欢上了python。
全栈程序员站长
2022/09/19
1.1K0
python时间序列分析代码_时间序列分析VAR实验报告
【时序预测】时间序列分析——时间序列的平稳化
将非平稳时间序列转化成平稳时间序列,包含三种类型:结构变化、差分平稳、确定性去趋势。本文脉络框架如下:
roganhuang
2020/07/22
11.8K0
【时序预测】时间序列分析——时间序列的平稳化
【译】用于时间序列预测的Python环境
采用Python进行时间序列预测的主要原因是因为它是一种通用编程语言,可以用于研发和生产。
李郑
2019/12/10
2K0
【译】用于时间序列预测的Python环境
Informer:用于长序列时间序列预测的新型transformer 模型
transformer 彻底改变了自然语言处理,并在神经机器翻译,分类和命名实体识别等领域进行了重大改进。最初,transformer 在时间序列领域很难应用。但是在过去的一年半中,出现了一些用于时间序列分类和预测的transformer 变体。我们已经看到了诸如时间融合,卷积,双阶段注意力模型以及更多尝试进入时间序列的模型。最新的Informer模型建立在这一趋势的基础上,并合并了几个新的组件。
deephub
2021/04/16
3.2K0
java输入的字符串是否_java采用3种方式判断用户输入的字符串是否为回文
回文的定义:"回文数" 就是正读倒读都一样的整数。如奇数个数字:98789, 这个数字正读是98789,倒读也是98789;偶数个数字3223也是回文数。
用户7886150
2021/04/29
1.5K0
时间序列分解:将时间序列分解成基本的构建块
大多数时间序列可以分解为不同的组件,在本文中,我将讨论这些不同的组件是什么,如何获取它们以及如何使用 Python 进行时间序列分解。
deephub
2022/11/16
1.4K0
时间序列分解:将时间序列分解成基本的构建块
将时间序列转换为分类问题
来源:DeepHub IMBA本文约1900字,建议阅读5分钟在本文中,我们将遵循 CRISP-DM 流程模型,以便我们采用结构化方法来解决业务案例。CRISP-DM 特别适用于潜在分析,通常在行业中用于构建数据科学项目。 本文将以股票交易作为示例。我们用 AI 模型预测股票第二天是涨还是跌。在此背景下,比较了分类算法 XGBoost、随机森林和逻辑分类器。文章的另外一个重点是数据准备。我们必须如何转换数据以便模型可以处理它。 在本文中,我们将遵循 CRISP-DM 流程模型,以便我们采用结构化方法来解决业
数据派THU
2023/05/11
7270
将时间序列转换为分类问题

相似问题

用于时间序列分析的时间戳特征工程

10

时间序列关联分析

10

LSTM可以用于非时间序列数据吗?

10

时间序列数据分析

10

哪种时间序列分析适合于集合时间序列数据分析?

10
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
💥开发者 MCP广场重磅上线!
精选全网热门MCP server,让你的AI更好用 🚀
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档