Loading [MathJax]/jax/input/TeX/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >现实世界中的数据科学:基于领域知识和监督学习模型的黄金价格理解与预测

现实世界中的数据科学:基于领域知识和监督学习模型的黄金价格理解与预测

作者头像
deephub
发布于 2020-05-12 08:27:13
发布于 2020-05-12 08:27:13
7250
举报
文章被收录于专栏:DeepHub IMBADeepHub IMBA
本文将展示如何建立一个简单但是强大的金价预测模型,主要包含以下内容:
  • 黄金的简要历史
  • 影响金价的若干因素
  • 建立用于预测金价的回归模型
  • 利用回归模型来辅助投资决策

人类为何需要黄金?

大约公元前3600年,黄金首先在古埃及被采掘冶炼。经历30个世纪之后,在土耳其西部的一个古王国铸造出世界上第一枚金币,此后黄金便作为王国内的一种实物货币进行流通。

在现代,黄金已经从实物货币演变为货币储备。1819年,英国正式采用有史以来第一个金本位制,将其货币与黄金挂钩。到1900年,除中国以外的大多数国家都采用了金本位制。然而,当第一次世界大战开始时,由于许多国家需要印钞来支付战争费用,金本位制最终被抛弃。

今天,黄金在我们的生活中被用于各种各样的用途,如铸币、珠宝、电子产品和牙科治疗等。而货币政策和金融需求会对黄金价格产生实质性的影响。

金价的主要影响因素

从理论上讲,影响黄金价格的因素有很多,包括基本面因素、宏观因素和情感因素。从基本面看,央行、珠宝买家和 ETFs 对实物黄金有需求,而从宏观层面看,通胀、利率、货币供应和美元走强也会影响金价。此外,一些交易员跟踪 ETFs 的净头寸数据,以衡量投机者的情绪,消费情绪和投资情绪也会影响金价。

各因素对金价的相关性

基本层面因素的影响最容易理解。政府和民众购买的黄金越多,市场上的黄金就越少,价格应该会攀升。

在宏观层面,通货膨胀率(通货紧缩率)是衡量一篮子商品和服务价格上涨(下降)的指标。如果通货膨胀率上升,我们午餐和黄金的价格也会上升。相反,如果利率上升,黄金作为一种投资工具相对于美国国债来说就变得没有吸引力。

最重要的因素之一是货币供应量,它衡量一个经济体中可用的货币总量。让我们举两个例子来解释为什么货币供应量的增加会提高黄金价格:

  1. 想象一下你和你的朋友之间的一个小经济体,他们同意用你的货币资金买卖彼此的黄金。如果你开始在你的车库里制造货币资金,并开始从你的朋友那里购买所有的黄金,那么黄金相对于货币的价格将会上升。换言之,如果美联储开始印上数吨美元,黄金相对于美元的价格可能会攀升。
  2. 再想象一下你和你的朋友之间的小经济体,他们用美元进行交易。如果你印钞票,给每个人免费的钱,商品和服务的价格将增加,因为免费的钱将用于购买额外的商品和服务。货币供应量的增加最终导致通货膨胀率的上升,因此黄金价格可以上涨。

总之,美元的强势会影响黄金和其他以美元计价的大宗商品的价格。如果美元变得疲软,其他国家可以购买更多的美元,然后购买更多的黄金,从而推高黄金价格,以及其他以美元计价的商品。

如何建立预测金价的模型呢?

为了对黄金价格进行建模预测,我们首先收集输入数据并对其进行转换等预处理。利用转换后的数据,我们使用线性回归模型来解释影响因素与金价之间的关系。为了验证模型,我们进行了样本外的回溯测试,并计算了 值来衡量模型的性能。

数据收集

本文主要收集了 1981 年以来的以下数据:

  • XAUUSD:以美元计价的黄金现货价格。
  • 美国CPI指数:该指数跟踪城市消费者支付的商品和服务价格的变化(即通货膨胀率)。
  • 美国M2指数:包括现金、支票存款和易于兑换的货币在内的货币供应量。
  • 美国GDP:该指标衡量美国经济产出的规模。
  • 美元指数:美元相对于一篮子外币的价值的指数。

输入数据及其来源

数据处理&特征工程

目标变量

该回归模型的目标变量是经通货膨胀调整后的黄金现货价格。即经过 CPI 平滑处理后的黄金现货价格时间序列(XAUUSD)。

预测因子

该回归模型有两个预测因子:货币供应量占GDP的比率(M2/GDP)和美元指数(DXY)。货币供应量与GDP之比这一指标优于货币供应量,因为它是衡量经济中货币供应量过剩的指标。

对数变换

在上述两个变换之后,我们对目标变量和预测因子应用对数变换。因为所有的值都是正的并且显示出很高的正偏度,对数变换有助于后面线性模型的应用。

目标变量和预测因子之间的相关性矩阵

利用转换后的变量,我们绘制一个相关矩阵来了解黄金价格与预测值之间的线性关系。如图所示,黄金现货价格与货币供应量占GDP的比例高度相关,与美元指数存在一定的负相关关系。

黄金价格 VS M2/GDP

更重要的是,这两个预测因子几乎不相关,两者的相关度只有 -0.08。这表明,尽管美元指数的相关性小于货币供应量与GDP比率的相关性,但美元仍然是有用的,因为它可能会添加不重叠的信息。

黄金价格 VS 美元指数

模型训练&回溯测试性能

现在针对预测因子和目标变量,我们通过线性回归、岭回归、套索回归、随机森林、XGBoost等方法拟合黄金价格。为了对模型进行评价,采用100个季度的滑动窗口对模型进行反复训练,并预测下一季度的平均金价,进行了样本外的回溯检验。最后,将预测值与实际值进行比较,计算出R2

金价线性回归方程

各方法的结果如图所示。

预测模型的性能

R 2是决定系数,表示模型可以解释的总变化百分比。因此,这个简单的线性回归模型可以解释高达92%的黄金价格总变化。对比其它方法可以看到,线性回归模型的性能优于其它更为复杂的模型。

如何利用训练好的预测模型?

利用该模型,我们可以分析货币供应量、GDP、美元指数等因素对黄金价格的影响,从而预测黄金价格。

由于各国政府未抵消全球封锁的影响和信贷市场的担忧情绪将持续印钞,货币供应量与GDP的比率在短期和长期都将增加。不过,美元指数可能会因避险需求而出现一定程度的走强。当市场出现抛售时,对美元等避险资产的需求增加,美元走强。

综合这些因素,预计黄金价格在短期内将保持相当大的波动,因为这两个预测因素可以相互抵消。不过,从长期来看,相信期待已久的牛市行情将卷土重来。

作者:Alex Kim

本文代码 https://github.com/ayh9kim/Commodity/blob/master/Gold/Gold%20Price%20Model%20-%20Version%201.0.ipynb

deephub翻译组 oliver lee

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-05-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DeepHub IMBA 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
品玩SAS:通货膨胀下持币者的隐忧
最近逛超市发现随便买点就是百元大钞起步,花钱如流水是实打实,但问题在于赚钱时怎么感觉像是在乞讨……
机器思维研究院
2019/06/05
8190
品玩SAS:通货膨胀下持币者的隐忧
Eviews基于多元回归模型OLS的CPI影响因素分析
2015年以来,通货膨胀越来越成为我国的重要经济现象。作为衡量通货膨胀的主要指标,CPI(消费者物价指数)与人们的生活具有最密切的关系。
拓端
2023/04/11
5790
经济学:动态模型平均(DMA)、动态模型选择(DMS)、ARIMA、TVP预测原油时间序列价格|附代码数据
本文提供了一个经济案例。着重于原油市场的例子。简要地提供了在经济学中使用模型平均和贝叶斯方法的论据,使用了动态模型平均法(DMA),并与ARIMA、TVP等方法进行比较
拓端
2023/02/10
7920
宏观经济读书笔记
国内生产总值GDP:衡量一个国家的总的商品和服务的产值是如何决定的。 消费,总投资(私人部门购买的新的资本货物-设备和建筑物) ,政府采购的商品和服务,及商品和服务的净出口。
lilugirl
2019/05/26
8730
手把手:用Python搭建机器学习模型预测黄金价格
大数据文摘作品 编译:小明同学君、吴双、Yawei xia 新年总是跟黄金密不可分。新年第一天,让我们尝试用python搭建一个机器学习线性回归模型,预测金价! 自古以来,黄金一直作为货币而存在,就是在今天,黄金也具有非常高的储藏价值,那么有没有可能预测出黄金价格的变化趋势呢? 答案是肯定的,让我们使用机器学习中的回归算法来预测世界上贵重金属之一,黄金的价格吧。 我们将建立一个机器学习线性回归模型,它将从黄金ETF (GLD)的历史价格中获取信息,并返回黄金ETF价格在第二天的预测值。 GLD 是最大的以
大数据文摘
2018/05/24
2K0
比特币进入牛初阶段,接下去的剧情该怎么走?
伴随比特币站上三万美元,其实质上已经进入到新阶段。从某种意义上讲,本轮行情的直接推动因素是一则关于比特币ETF通过的假消息,但在利好消息不断出现的推动下,比特币在徘徊犹豫中不断突破新高。然而,从链上数据看,散户投资者不断涌入,大资金却出现一定离场迹象,该如何看待当下比特币上涨背后的深层逻辑?未来比特币又将如何发展?
小将
2023/11/13
1880
比特币进入牛初阶段,接下去的剧情该怎么走?
经济学:动态模型平均(DMA)、动态模型选择(DMS)、ARIMA、TVP预测原油时间序列价格|附代码数据
本文提供了一个经济案例。着重于原油市场的例子。简要地提供了在经济学中使用模型平均和贝叶斯方法的论据,使用了动态模型平均法(DMA),并与ARIMA、TVP等方法进行比较
拓端
2023/04/07
5850
经济学:动态模型平均(DMA)、动态模型选择(DMS)、ARIMA、TVP预测原油时间序列价格|附代码数据
本文提供了一个经济案例。着重于原油市场的例子。简要地提供了在经济学中使用模型平均和贝叶斯方法的论据,使用了动态模型平均法(DMA),并与ARIMA、TVP等方法进行比较(点击文末“阅读原文”获取完整代码数据)。
拓端
2022/10/27
5060
爱数课实验 | 第七期-基于随机森林的金融危机分析
简介:上世纪60年代之后,非洲掀起了摆脱殖民主义的独立浪潮。由于几百年的历史原因,非洲大陆多数国家经济发展较为落后,经济体系较脆弱,各种危机时常发生。该案例对近百年来非洲13个国家的金融危机进行了探索性分析,并构建了随机森林模型进行预测。
数据科学人工智能
2022/06/27
7230
爱数课实验 | 第七期-基于随机森林的金融危机分析
重建中的EOS——复兴之路
EOS曾被认为是Layer 1领域最有前途的区块链发之一。在推出时,EOS 是市值排名前五的加密货币。但从那以后,EOS 未能达到早前的预期,社区成员在很大程度上将其归因于创始团队缺乏开发和投资。
用户9439247
2023/03/05
6810
重建中的EOS——复兴之路
R语言ARMA-GARCH模型金融产品价格实证分析黄金价格时间序列
研究黄金价格的动态演变过程至关重要。文中以黄金交易市场下午定盘价格为基础,帮助客户利用时间序列的相关理论,建立了黄金价格的ARMA-GARCH模型,并对数据进行了实证分析,其结果非常接近。利用该模型可动态刻画黄金价格数据的生成过程,也可帮助黄金产品投资者和生产者做出更加灵活、科学的决策。
拓端
2023/06/05
4840
Python新加坡房产交易数据预测:神经网络MLP、回归、指数平滑模型与特征交互探索
在数据科学领域,每一次对复杂系统的精准建模,都是对数据价值的深度挖掘。作为数据科学家,我们深知,房地产市场作为城市经济的关键一环,其价格波动背后蕴含着海量信息与复杂规律。近期,我们团队承接了一项极具挑战性的咨询项目 —— 新加坡私人住宅房价预测研究。该项目旨在运用前沿的数据科学技术,为房地产市场的参与者提供决策支持(点击文末“阅读原文”获取完整代码、数据、文档)。
拓端
2025/04/26
770
Python新加坡房产交易数据预测:神经网络MLP、回归、指数平滑模型与特征交互探索
深度报告 | 中国宏观经济数据分析入门
有奖转发活动 回复“抽奖”参与《2015年数据分析/数据挖掘工具大调查》有奖活动。 论坛君 本文为光大证券首席经济学家,中国首席经济学家论坛徐高理事对中国宏观经济数据分析的深度报告。数据作为经济分析的基础,即使有严格的经济理论和预测判断,也需要详实合理的数据做支撑。宏观经济涉及多层面庞杂的数据,系统全面的掌握宏观数据体系,以及阅读、处理、分析、判断经济数据对宏观研究至关重要。 前言 数据是经济分析的基础。严格的经济理论和预测判断均需要以详实合理的数据做支撑。认识理解经济数据是进行经济研究所需的基本素质。宏观
小莹莹
2018/04/23
4.2K0
深度报告 | 中国宏观经济数据分析入门
比特币像个醉汉,S2F模型是它回家的路!
比特币减半是其创始人中本聪(Satoshi Nakamoto)在比特币白皮书中设置的一项机制。在比特币代码中规定每开采210000个区块,矿工得到的比特币奖励就减少一半。2012年11月28日,比特币首次减半,每一区块开采奖励降至25枚比特币;2016年7月9日,比特币第二次减半,奖励降至12.5枚比特币。北京时间2020年5月12日03:25,第三次减半将从12.5枚比特币变为每个区块奖励6.25枚比特币。
量化投资与机器学习微信公众号
2020/05/25
1.2K0
比特币像个醉汉,S2F模型是它回家的路!
AQR:构建更稳健的商品期货组合
量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者,连续2年被腾讯云+社区评选为“年度最佳作者”。 作者:Yao Hua Ooi、Thomas Maloney、Alfie Brixton 编译:1+1=6 前言 大宗商品的收益非常分散化,常常用在股债投资组合中构建更稳健的组合。但许多大宗商品指数在全球金融危机期间大幅下跌,在随后的十年通缩期间几乎没有复苏。然而,大多数投
量化投资与机器学习微信公众号
2022/05/13
5580
AQR:构建更稳健的商品期货组合
【线性回归分析】:基于实验数据的模型构建与可视化
在数据分析领域,线性回归是一种基础而强大的工具,用于探究两个或多个变量之间的关系。通过给定的数据集,我们可以构建一个线性模型来预测目标变量(y)如何随着输入变量(x)的变化而变化。CV九段手将演示如何使用Python中的NumPy和Matplotlib库读取数据、计算线性回归参数,并可视化结果。
用户11315985
2024/10/19
2880
【线性回归分析】:基于实验数据的模型构建与可视化
杂谈 | 用数据分析的方式打开延迟退休
最近延迟退休的消息真的是炸得漫天飞,作为一个数据分析师,自然也想用数据分析的方式来聊聊延迟退休~
做数据的二号姬
2024/11/25
1400
杂谈 | 用数据分析的方式打开延迟退休
R语言分位数回归、最小二乘回归OLS北京市GDP影响因素可视化分析
对于影响北京市GDP 因素分析常用的方法是最小二乘回归。【1】但最小二乘有自身的缺陷,该方法要求较高,例如许多观测数据很难满足全部假设条件(点击文末“阅读原文”获取完整代码数据)。
拓端
2023/08/31
3120
R语言分位数回归、最小二乘回归OLS北京市GDP影响因素可视化分析
【元道孟岩新年重磅对话】比特币不是用来炒的,通证派如何看待加密货币一月大幅下挫?
在前几次孟岩与元道先生的对话中,他们谈论了很多关于通证的话题,但对于通证经济的基础——比特币和其他加密数字货币,讨论并不多。今年一月初以来,整个加密数字货币市场发生了一轮大幅度的下挫,这虽然不是第一次
区块链大本营
2018/05/10
6820
大盘点 | 十分钟,看尽加密货币十年之现状
2009年,中本聪将比特币带到了世界,十年了,时光来到了2018年的夏天,加密货币如雨后春笋遍地开花。十年后,加密货币的生态现状是怎样的?除比特币、Ethereum和EOS之外,你对加密货币了解多少? 本篇文章总结了加密货币十年的历程和现状,包括比特币、Bitcoin Cash和Chia等数字货币,Ethereum、DFINITY和EOS等智能合约平台,以及Zcash、Monero和Stablecoin等Privacy Coin的全面介绍和深入分析,认真阅读,干货满满!
区块链大本营
2018/07/25
9460
大盘点 | 十分钟,看尽加密货币十年之现状
推荐阅读
品玩SAS:通货膨胀下持币者的隐忧
8190
Eviews基于多元回归模型OLS的CPI影响因素分析
5790
经济学:动态模型平均(DMA)、动态模型选择(DMS)、ARIMA、TVP预测原油时间序列价格|附代码数据
7920
宏观经济读书笔记
8730
手把手:用Python搭建机器学习模型预测黄金价格
2K0
比特币进入牛初阶段,接下去的剧情该怎么走?
1880
经济学:动态模型平均(DMA)、动态模型选择(DMS)、ARIMA、TVP预测原油时间序列价格|附代码数据
5850
经济学:动态模型平均(DMA)、动态模型选择(DMS)、ARIMA、TVP预测原油时间序列价格|附代码数据
5060
爱数课实验 | 第七期-基于随机森林的金融危机分析
7230
重建中的EOS——复兴之路
6810
R语言ARMA-GARCH模型金融产品价格实证分析黄金价格时间序列
4840
Python新加坡房产交易数据预测:神经网络MLP、回归、指数平滑模型与特征交互探索
770
深度报告 | 中国宏观经济数据分析入门
4.2K0
比特币像个醉汉,S2F模型是它回家的路!
1.2K0
AQR:构建更稳健的商品期货组合
5580
【线性回归分析】:基于实验数据的模型构建与可视化
2880
杂谈 | 用数据分析的方式打开延迟退休
1400
R语言分位数回归、最小二乘回归OLS北京市GDP影响因素可视化分析
3120
【元道孟岩新年重磅对话】比特币不是用来炒的,通证派如何看待加密货币一月大幅下挫?
6820
大盘点 | 十分钟,看尽加密货币十年之现状
9460
相关推荐
品玩SAS:通货膨胀下持币者的隐忧
更多 >
领券
💥开发者 MCP广场重磅上线!
精选全网热门MCP server,让你的AI更好用 🚀
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档