前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >MGRN:多源图关系显著提高模型预测能力

MGRN:多源图关系显著提高模型预测能力

作者头像
量化投资与机器学习微信公众号
发布于 2022-09-14 13:17:47
发布于 2022-09-14 13:17:47
6770
举报

量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者,荣获2021年度AMMA优秀品牌力、优秀洞察力大奖,连续2年被腾讯云+社区评选为“年度最佳作者”。 作者:Qinkai Chen、Christian-Yann Robert

我们在上一篇推文中分享了一篇关于图相关算法在量化研究中的论文综述。从股价预测到组合优化,传统的图算法及图神经网络都有非常丰富的应用场景。今天分享的文章来自Journal of Financial Data Science的最新论文《Graph-Based Learning for Stock Movement Prediction with Textual and Relational Data》,本文与之前图神经网络相关文献最大的不同点体现在以下几处:

1、从新闻文本提取股票表征,并和股票图关系结合进行股票涨跌的预测,这样的结合优于根据新闻预测单个资产的价格走势。

2、上述步骤中,利用了多个图的关系(行业属性、供应链关系等)可以进一步提高预测精度。

3、作者设计了用于股票预测的多图递归网络,并通过准确性测试和交易模拟证明了该模型具有最先进的性能。

我们首先来看一下模型的整体结构(如下图):

  • 最左边是股票池里的股票在过去一段时间(作者选取的是过去1个交易日)的所有新闻。
  • 每篇新闻经过Financial News Encoder(采用的是Universal Sentence Encoder)提取Embedding,在把每只股票所有新闻的Embedding计算平均值,作为该股票当天的新闻的Embedding。
  • 把以上每个股票的Embedding最为图中每个股票节点的属性,分别输入到不同的图中,作者总共使用了以下三个图关系(最终以邻阶矩阵的方式进行定义):
    • 股价相关系数
    • 供应链关系(来自Facset)
    • 股票的行业属性(GICS)
  • 通过以上图神经网络提取的每个股票节点的表征,在与原始个股的新闻表征拼接在一起,得到每天每个股票的特征集。

最后再把这个特征序列输入到RNN(LSTM)模型,训练的目标是下一交易日股票的涨跌方向。

作者实证研究用的是STOXX Europe 600成分股,本文使用的新闻数据来自Bloomberg,并过滤掉每天新闻数量少于两篇的股票,以下是样例数据:

构件图关系的三个邻阶矩阵的热力图如下图所示,Panel A每个元素表示这两个股票的相关系数,Panel B表示两个股票是不是属于同一个Sector,Panel C表示两个股票之间是否存在供应链关系。

下表显示了在不同百分位(根据下一期涨跌幅分成10组)测试集上不同模型的准确性和MCC。我们发现我们的MGRN模型表现出最好的性能,在准确性和MCC方面优于其他基准模型。

我们比较了单图模型(MGRN-Corr, MGRN-Sector和MGRN-Supply)和无图模型(RNN)。我们发现所有的图关系都可以帮助提高性能,特别是对于最极端的分位组(一个更小的q值)。但是,很难说哪个图具有最佳性能,因为每个图在不同的百分位上具有不同的最佳性能。这也意味着每个图中的信息是互补的,使得将不同的图组合起来更加合理。通过比较完整模型(MGRN)和单一图模型,我们验证了我们的假设,即组合不同的图有助于提高模型性能。我们发现,当同时使用这三张图时,我们的准确性有显著提高证明了我们的模型可以同时从多个互补图中吸收必要的信息,验证了来自不同来源的组合关系的有效性。

我们还注意到,在某些情况下,添加图会导致比无图RNN更糟糕的结果。例如,当q = 10时,MGRN-Corr比RNN差。但是,当与其他图组合使用时,结果比单独使用任何图要好。这是因为错误通常来自于几个特定的股票,特别是当我们只有一个信息来源时。如果来源不正确,就会导致重大错误。使用多个图表的好处是,通过基于多个信息源做出决策,可以减少这些情况的影响。

下表显示策略模拟交易结果。我们还可以确认我们的MGRN模型优于其他模型,并且将图组合在一起是有益的。我们还发现,等权策略与市值权重策略具有相似的表现,表明对小盘股几乎没有偏差。

GICS行业分类有四个层级,我们比较了四个层级的表现,发现第三级别的biaoxian最好,特别是在更极端的分数上。因此,我们选择使用第三行业级别来构建图。详细的结果如下表所示。

总结

我们通过综合考虑财经新闻、多个基于图形的特征和新闻的时间模式来预测股票的走势。我们为这个任务引入MGRN模型。通过大量的实验和交易模拟,我们证明了模型结构的有效性。研究结果还证明,添加图关系信息,特别是来自多个来源的不同图关系信息,可以更好地预测股票的走势。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-09-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量化投资与机器学习 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
QIML Insight:基于多源特征及机器学习的股票聚类模型
量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者,荣获2021年度AMMA优秀品牌力、优秀洞察力大奖,连续2年被腾讯云+社区评选为“年度最佳作者”。 量化投资与机器学习公众号 独家解读 量化投资与机器学公众号  QIML Insight——深度研读系列 是公众号全力打造的一档深度、前沿、高水准栏目。 公众号遴选了各大期刊前沿论文,按照理解和提炼的方式为读
量化投资与机器学习微信公众号
2022/05/25
1.4K0
QIML Insight:基于多源特征及机器学习的股票聚类模型
深度学习LSTM-RNN建立股票预测模型
  此次股票价格预测模型仅根据股票的历史数据来建立,不考虑消息面对个股的影响。曾有日本学者使用深度学习的方法来对当天的新闻内容进行分析,以判断其对股价正面性/负面性影响,并将其与股票的历史数据相结合,各自赋予一定的权重来对近日的股价进行预测[1]。该预测方法取得了一定的效果。
机器学习AI算法工程
2019/10/28
2.7K0
深度学习LSTM-RNN建立股票预测模型
[量化投资]万字综述,94篇论文分析股市预测的深度学习技术
论文 | Stock Market Prediction via Deep Learning Techniques: A Survey
核桃量化
2023/01/31
3.9K0
[量化投资]万字综述,94篇论文分析股市预测的深度学习技术
AAAI 2021:仅有的8篇量化投资论文(论文+代码)
量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业20W+关注者,连续2年被腾讯云+社区评选为“年度最佳作者”。
量化投资与机器学习微信公众号
2021/10/12
4.3K10
Two Sigma:Machine Learning Models of Financial Data
量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者,荣获2021年度AMMA优秀品牌力、优秀洞察力大奖,连续2年被腾讯云+社区评选为“年度最佳作者”。 机器学习是当前金融建模、预测和决策的最先进技术。然而,实现这一潜力需要克服许多复杂的挑战。在本次演讲中,Two Sigma的Justin Sirignano——他也是牛津大学数学副教授——讨论了金融领域机器学习的机遇和挑战
量化投资与机器学习微信公众号
2022/09/02
7400
Two Sigma:Machine Learning Models of Financial Data
新闻共现:股票长期与动态关联性表征的因子挖掘
量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者,连续2年被腾讯云+社区评选为“年度最佳作者”。 量化投资与机器学习公众号独家解读 量化投资与机器学公众号  QIML Insight——深度研读系列 是公众号今年全力打造的一档深度、前沿、高水准栏目。 历史汇总 QIML Insight深度研读,全网独一份! 公众号遴选了各大期刊前沿论文,按照
量化投资与机器学习微信公众号
2022/03/03
1K0
因子挖掘:基于图神经网络与公司主营(附代码)
量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业20W+关注者,连续2年被腾讯云+社区评选为“年度最佳作者”。
量化投资与机器学习微信公众号
2021/11/23
1.6K0
基于图神经网络、图谱型数据的收益预测模型(附代码)
传统的股价预测的时许模型,对于收益率的假设往往不切实际,而最近兴起的机器学习模型,特别是深度学习模型对于股价的预测也存在着明显的问题:
量化投资与机器学习微信公众号
2021/07/29
3.3K0
有人说:机器学习应用量化投资没啥用,给你看看有用的!
想必很多人还不知道Numerai吧,有志于从事量化方向的同学可以重点关注下。Numerai 是一家初创公司,以举办专业数据锦标赛(类似kaggle)为其对冲基金寻找最佳交易策略而闻名。同时,它能将世界各地数据学家的股市预测模型“众包”出去。同时,Numerai创建了自己的加密货币,名为Numeraire(NMR)。近日,Numerai通过ICO完成了300万美元融资,Placeholder、Union Square等公司参投。
量化投资与机器学习微信公众号
2020/09/26
1.7K0
深度学习在股市的应用概述
股票市场预测由于其非线性、高度波动性和复杂性,一直是个复杂的问题。近年来,深度学习在许多领域占据了主导地位,在股市预测方面取得了巨大的成功和普及。本文以深度学习技术为重点,对其应用于股市预测研究进行结构化和全面的概述,介绍了股市预测的四个子任务及股市预测主流模型,并分享了一些关于股市预测的新观点及未来的几个方向。
算法进阶
2023/09/15
1.2K0
深度学习在股市的应用概述
News Co-Occurrences:关注同时出现在新闻中的股票
量化投资与机器学公众号 QIML Insight——深度研读系列 是公众号今年全力打造的一档深度、前沿、高水准栏目。
量化投资与机器学习微信公众号
2021/07/07
8450
News Co-Occurrences:关注同时出现在新闻中的股票
从《繁花》到现实,现代版“宝总”如何通过智能手段预测股市?
在导演王家卫看来,《繁花》“表面是饮食男女,里面是山河岁月,时代变迁”。剧中主角阿宝凭借精准的投资预判和灵活的操作策略,在资本市场的博弈中完成了从散户到“宝总”的华丽转身。而宝总起家的背后,便是抓住了A先生股票投资失败的契机,这一戏剧性转折生动揭示了股市风险无处不在,即便是实力雄厚的大户也可能面临惨痛损失。
可信AI进展
2024/01/19
2920
从《繁花》到现实,现代版“宝总”如何通过智能手段预测股市?
基于三大图谱网络和HIST模型的A股策略研究
在之前的文章中,我们分别构建了产业链关系网络、供应链关系网络和新闻共现关系网络,都做了图聚类,并分析了各类关系下和集群内外股票间收益率相关性,最终也都得出了“关联股票比非关联股票表现出更强相关性,集群内股票比集群外股票也表现出更强相关性”的结论,三大网络关系和三大集群属性能提供有用的增量信息。本文将进一步以这些集群属性为预定义概念,借助 HIST模型提取集群的共有信息用于预测股票未来收益。
量化投资与机器学习微信公众号
2023/09/05
9470
基于三大图谱网络和HIST模型的A股策略研究
基于『成交数据』的股票联动研究
受市场各参与方及资金流动等相互作用,不同股票之间往往会表现出价格联动或共振的现象。随着市场高频交易参与度的增加,这种共振的现象愈发明显。本文中,作者使用高频的成交数据来研究股票间共同成交(文中称为co-trading,即一只股票发生成交的极短时间内,另一只股票也发生成交)的现象,构建了co-trading network来对股票市场复杂的联动进行建模。
量化投资与机器学习微信公众号
2023/04/20
5360
基于『成交数据』的股票联动研究
A股市场机器学习多因子模型实证
量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者,荣获2021年度AMMA优秀品牌力、优秀洞察力大奖,连续2年被腾讯云+社区评选为“年度最佳作者”。 量化投资与机器学习公众号 独家解读 量化投资与机器学公众号  QIML Insight——深度研读系列 是公众号全力打造的一档深度、前沿、高水准栏目。 公众号遴选了各大期刊前沿论文,按照理解和提炼的方式为读者呈
量化投资与机器学习微信公众号
2022/09/08
1.2K0
A股市场机器学习多因子模型实证
供应链数据因子化研究:Customer Momentum
量化投资与机器学公众号 QIML Insight——深度研读系列 是公众号今年全力打造的一档深度、前沿、高水准栏目。
量化投资与机器学习微信公众号
2021/07/07
8290
供应链数据因子化研究:Customer Momentum
来!新闻流与股价跳跃、图数据应用综述、机器学习与有效前沿
量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者,荣获2021年度AMMA优秀品牌力、优秀洞察力大奖,连续2年被腾讯云+社区评选为“年度最佳作者”。 资产价格的跳跃已经被认为是许多金融和经济决策的重要因素,例如投资组合重新平衡、衍生品定价以及风险度量和管理。股票价格的大幅波动可能与市场上重要的信息流(如超预期收益)有关,这一直观的想法启发了许多与股票收益跳跃建模相关的
量化投资与机器学习微信公众号
2022/09/08
3950
来!新闻流与股价跳跃、图数据应用综述、机器学习与有效前沿
用AlphaGo来做股票交易会怎样?机器学习预测股票靠谱么?
今天李世石已连续输掉了第二局,粗看下来,后面几盘似乎已没啥悬念了。无疑,这是一个伟大的时刻,也是个伟大的开始,超级智能机器在未来将会在人类生活中扮演更多更重要的角色。 资本市场,越来越多的量化策略与量化交易,越来越多的机器在介入,以前散户面对的是同样赤手空拳的空头,但现在我们面对的是高度智能的机器以及加杠杆的赌徒,以前跌一年,现在一周搞定,信息传播越来越快,人心预期转化也特别迅速,于我们,更需要理性,纪律与底线。 Alpha Go的优势: 无比强大的数据分析能力。对于公司的财务、行业的数据,未来的趋势,依据
机器学习AI算法工程
2018/03/13
1.1K0
用AlphaGo来做股票交易会怎样?机器学习预测股票靠谱么?
基于供应链网络的股票收益分析
供应链数据主要描述公司之间存在的商业关系,即客户-供应商关系(customer-supplier)。最近越来越清楚的是,这种关系与上市公司股价的表现具有一定的相关性。Cohen和Frazzini (2008) 发现在美国市场中,分别为供应商和客户的上市公司之间股票价格有明显的相关性和领先滞后效应。Shahrur等 (2009)也在其他22个发达国家股票市场验证了Cohen和Frazzini (2008) 的发现。Wu和Birge (2014) 在此基础上使用中心度等度量指标构建了多个量化交易策略。但有些时候领先滞后效应的方向似乎随着时间和地点的变化而变化,因此对于应该是哪一个没有明确的、最终的一致意见。
量化投资与机器学习微信公众号
2023/04/20
3320
基于供应链网络的股票收益分析
NLP for Quant:使用NLP和深度学习预测股价(附代码)
美国证券交易委员会(SEC)的文件长期以来一直被用作出投资决策的宝贵信息来源。一些论文和项目已经演示了如何使用自然语言处理技术从SEC文件和新闻中提取信息,以预测股票波动。本文在其他工作的基础上,通过使用GloVE嵌入技术、MLP、CNN和RNN深度学习体系结构,预测8-K文件发布后的股票价格变化。
量化投资与机器学习微信公众号
2019/05/09
3.6K0
NLP for Quant:使用NLP和深度学习预测股价(附代码)
推荐阅读
相关推荐
QIML Insight:基于多源特征及机器学习的股票聚类模型
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档