前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >收藏级!A股动态多因子模型实践

收藏级!A股动态多因子模型实践

作者头像
量化投资与机器学习微信公众号
发布于 2022-03-03 10:32:52
发布于 2022-03-03 10:32:52
1.6K0
举报

量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者,荣获2021年度AMMA优秀品牌力、优秀洞察力大奖,连续2年被腾讯云+社区评选为“年度最佳作者”。

量化投资与机器学习公众号独家解读 量化投资与机器学公众号  QIML Insight——深度研读系列 是公众号全力打造的一档深度、前沿、高水准栏目。

公众号遴选了各大期刊前沿论文,按照理解和提炼的方式为读者呈现每篇论文最精华的部分。QIML希望大家能够读到可以成长的量化文章,愿与你共同进步!

本期遴选论文 来源:The Journal of Investing Vol. 31, Issue 2 February 2022 标题:Study of Dynamic Multifactor Model Application In China A-Shares 作者:Ying Lan

核心观点

  • A股市场,因子存在短期动量效应,这种效应可以用在动态因子的模型构建中。
  • A股市场中,因子有效性并不稳定,当因子发生拥挤时,其有效性会减弱或消失。
  • 通过结合因子短期动量、因子有效性持续能力过滤及基于因子拥挤的权重调整构建的动态因子模型能够提供更稳定的Alpha能力。

因子库及因子数据预处理

作者基于Ricequant和Wind数据库构建了五大类(价值、规模、质量、成长及技术指标)共计62个因子。每个大类大概有15个因子,这些因子涵盖了大部分常用的因子。部分因子如下表1,详细的62个月度因子定义见附录。

因子的方向也是根据因子的逻辑决定的,下表2列出了负向因子和双向因子。比如DAR是一个负向因子,因为逻辑上负债资产比率越高,股票的质量越低,收益率就越低。但像return_1M因子可能是双向的,正向代表动量效应,负向表示反转效应。

此次研究的股票池为沪深300指数成分股,一共包括2008年7月至2020年3月的670个股票。所有因子数据都经过了以下处理:

  • 行业中性化,采用中信一级行业,对每个因子计算行业内Z-Score的方式计算中性化后的因子值。
  • 异常值处理,也在行业内进行异常值处理,异常值的判定标准为超过正负3个标准差。

因子分析

因子分析主要是从时序截面等角度分析因子的IC值,文中的IC为Spearman相关系数,也就是我们常说的Rank IC。

时间序列分析

IC的时间序列能够展示出该因子预测能力的稳定性,表3给出了62个因子的IC的统计值。表4给出了每个分类下ICIR最大的因子的IC序列,可以看出即使ICIR最大的因子,也有可能在很长一段时间表现出不稳定性。

Gupta和Kelly(2019)在对全球市场65个常见因子的自相关性研究中发现了因子展现出强劲的一个月的因子动量。65个因子其中有59个因子的AR1(一阶自回归)为正,49个因子的一阶自回归系数统计上显著。所以,本文也对A股的62个因子进行了自回归测试,结果如图5和图6。其中图5是对因子IC序列进行自回归测试的结果,有43个因子IC的自回归系数为正。其中图6表示因子收益(每个因子多空组合的收益)自回归测试的结果,有47个因子的自回归系数为正。这说明A股存在因子动量和因子收益动量效应。

截面分析

虽然每个因子在时间序列预测能力方面表现出很大的差异,但对于整个研究期间的每个因子大类(风格),在大多数月份,每组内都存在有效因子(表7)。

这一发现表明,这些共同风格的因子大部分时间一般能够区分股票的表现水平;然而,内部风格定义的轮换可能会随着时间的推移而存在。例如,投资者一直在寻找高质量的公司。在经济扩张期间,他们可能会寻找质量因子,如资产收益率(ROA)或净资产收益率(ROE),但在经济低迷周期或流动性紧张时期,随着对破产的担忧加剧,债务与资产比率(DAR)等因子变得更有效。这揭示了A股稳健模型的重要性——识别市场变化和适应不断变化的市场机制的能力。

面板数据分析

在一段强劲的表现之后,因子的有效性会衰减或完全消失(Vopati et al.2020)。这是由于因子拥挤造成的。因子拥挤度可以通过一个月的因子横截面重要性与历史重要性滚动平均值的相对值来评估。由于因子库包含具有相似特征的因子,因此在测量因子拥挤度时可以将它们分组到不同的聚类中。

作者使用K-means,基于62个因子的IC序列,对它们进行聚类。K的数量取决于轮廓系数(silhouette)。silhouette系数是聚类效果好坏的一种评价方式。值越大,说明聚类效果越好。如图8,说明K等于30时聚类效果最好。

对于聚类在t时刻的重要性,用以下公式计算。也就是该时刻,所有聚类内因子IC的均值。

而因子k在t时刻的相对重要性(相对于过去12个月)等于:

其中,

我们发现因子的相对价值能够捕捉到因子的过度拥挤。研究期间,因子有76.5%可能的损失预测能力(单向因子的IC < 0.05或双向因子|IC |  < 0.05 )。

通过以上的测试,对因子模型的构建得出了以下几个启发:

  • 因子IC表现出的不稳定性,说明静态的因子模型可能效果不会很好;
  • 一阶自回归测试结果说明因子筛选时可以考虑因子动量
  • 许多AR(1)为正,但不显著,这种情况下,可以在每个因子分类中加入一个动态因子筛选器。
  • 尽管单因子不稳定,但每组中总有有效的因子,说明在模型要考虑每组中因子的分散性。
  • 因子很有可能由于因子拥挤而衰减,说明因子拥挤可以用在因子权重配比中。

因子模型和组合优化

基于以上发现,我们构建了一个动态多因子模型(Model 1),除此之外还构建了三个用于对比的模型(Model2-Model4)。下面分别介绍一下这4个模型:

Model1 动态多因子模型

模型的整体流程如图10所示,具体说明如下:

1、因子预测能力过滤,考虑到因子动量效应,t-1时刻,在每个因子组内选择一个预测效果最好的因子(基于t-1时刻的因子Rank IC)。

2、预测能力持续性过滤(Predictive power persistency filtering),根据36个月滚动数据计算一阶马尔可夫链转移概率。对于一个因子,预测能力持续性过滤的条件是:正向因子 大于 1/3;负向因子 大于1/3;双向因子 或 大于1/3。每一组的因子选择逻辑如下:

  • 如果这一步没选出因子,则返回上一步,选择这组IC最高的4个因子直接进入下一步。
  • 如果这一步选出因子,再在这组剩下的因子中,选择一个IC最高的,此时这组有两个因子进入下一步。

最终确保每组都至少有2个(或者4个)因子进入下一步。

基于因子月度Rank IC值,把因子分为三个状态:1. 较强正向预测能力(IC>=0.05)2. 较差预测能力(|IC|<=0.05)3. 较强负向预测能力(IC<=-0.05)。也就是说,给定这三种状态,任何一个因子的IC时间序列都可以转变为类似[1,1,2,2,1,1,2,3,3...]的状态序列。可以使用较长时间的历史数据得到状态序列,并由此计算因子预测能力的转移概率。用p_i,j表示从状态i转移到j的概率,p_1,1表示从状态1(较强正向预测能力)变到还是状态1的概率。

关于如何使用Python,基于历史状态序列计算转移概率矩阵,可以参考这个链接:

https://stackoverflow.com/questions/46657221/generating-markov-transition-matrix-in-python/46657489

因子拥挤性测试,基于等式10计算因子的拥挤度指标。对于单向因子,如果指标值大于2;或者双向因子,指标绝对值大于2;其原先的因子权重需要再乘以1/2。因子原先的权重由以下等式计算:

双向因子的方向由其上一期的因子IC决定。

其他三个模型定义如下:

  • Model2是一个静态模型。基于训练期(2009-2012)的数据,在每组中选择ICIR绝对值最大的两个因子,组成静态因子模型。因子权重也基于ICIR绝对值计算。
  • Model3与Model2的区别是因子的选择是每年滚动选取,也是基于ICIR绝对值排序每组选取两个因子。
  • Model4是一个动态因子模型,在每一组中,每个月选取上一期因子IC最大的两个因子。

组合优化

基于以上各模型计算每个股票的因子得分和因子权重,然后基于以下目标函数(最大化Alpha因子)及限制条件(主要包括行业暴露、主动权重及行业市值限制)求解股票权重:

(i) industry constraint versus benchmark industry breakdown: For each CITIC Level I industry j:

(ii) active weight constraint versus benchmark stock weights: For CSI 300 constituent stock i: For non-CSI 300 constituent stock i: (iii) market-cap constraint versus benchmark market cap:

实证结果

下表11至14给出了测试结果,可以看出Model1动态因子模型的回测大幅领先于其他三个对比模型。

附录

因子定义:

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-02-09,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量化投资与机器学习 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
科普:什么是公有云、私有云和混合云?
在上一篇《什么是云计算》发表之后,很多小伙伴表示终于知道到底什么是云计算了,能够帮到大家真的很开心。
Java3y
2019/11/05
22.4K2
科普:什么是公有云、私有云和混合云?
干货丨如何快速区分公有云,私有云和混合云的概念
云计算的发展到今天,很多企业计划或正在使用云计算,但不是每个企业都使用相同类型的云模式。云模式有三种,包括公有云,私有云和混合云。为了帮助企业选择合适的模式,以下对这三种模式的概念和应用进行对比。
齿轮易创说互联网
2018/09/14
6.7K0
干货丨如何快速区分公有云,私有云和混合云的概念
什么是混合云?与公有云、私有云有啥区别?
随着成本效益、敏捷和可扩展计算的不断增长的需求,越来越多的公司转向混合云架构,那么什么是混合云?混合云的特点是什么?有哪些优势?本文笔者就和大家好好讨论一下混合云。
网络技术联盟站
2023/03/02
13.6K0
什么是混合云?与公有云、私有云有啥区别?
公有云和私有云的对比和区别「建议收藏」
云技术是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来,实现数据的计算、储存、处理和共享的一种托管技术。
全栈程序员站长
2022/09/07
15.1K0
公有云和私有云的对比和区别「建议收藏」
公有云、私有云与混合云解决方案差异及选择
最近在跟人聊天时说到一个话题,说私有云必然会被淘汰,因为维护和使用成本太高,再者未来的云就像现在的水和电一样常见,就像发电厂一样,有谁会私自发电呢?在我看来,其实不然,了解更多,请看下文。
用户5166556
2023/03/18
4.5K0
公有云、私有云与混合云解决方案差异及选择
公有云、私有云与混合云到底有什么区别?
上面针对云计算一大段的解释你懂了吗?我来给大家“翻译一下”:云计算就是一种基于因特网的超级计算模式,在某一个地方由谷歌、IBM这样的专业网络公司建立了一个数据中心,将成千上万台电脑和服务器连接在一起,达到的效果就是普通电脑远远不能达到的每秒10万亿次的运算能力,而用户完全可以通过电脑、笔记本、手机等设备接入这个数据中心,根据自己的需求选择计算。
兮动人
2021/06/11
5.7K0
公有云、私有云与混合云到底有什么区别?
公有云与私有云优劣对比分析
T客汇官网:tikehui 撰文 |Felix 选择公有云或私有云并不是一个二选一的问题。行业分析师指出大部分的公司使用了多云战略,也就是说明他们至少使用了两种形式的云。 RightScale 2017 的报告中发现,平均每家公司正在使用1.8个公有云和2.3个私有云,同时正在准备使用1.8个公有云和2.1个私有云(正在测试)。很多公司选择了混合云的方案,所以他们在单一的环境中至少使用了一种私有云和一种公有云。 公有云本地部署私有云托管私有云混合云硬件部署和管理者服务商客户服务商服务商与客户硬件共享模式
人称T客
2018/03/23
18K0
公有云与私有云优劣对比分析
公有云、私有云和混合云,企业用户将如何选择?
所谓云计算的服务类型,就是指为用户提供什么样的服务;通过这样的服务,用户可以获得什么样的资源,以及用户该如何去使用这样的服务。目前业界普遍认为,云计算可以按照服务类型分为以下三类: 云计算提供者与使用
BestSDK
2018/03/27
6.5K0
公有云、私有云和混合云,企业用户将如何选择?
私有云与公有云,哪种云模型最适合企业的需求
如今,随着云计算的发展,几乎每个企业都在使用或将要使用它,但是,公司可能不会选择相同类型的云模型,实际上,存在三种不同的云模型,包括私有云、公共云和混合云,其中最常见的是私有云和公共云。
网络技术联盟站
2022/03/18
4.4K0
私有云与公有云,哪种云模型最适合企业的需求
公有云和私有云的区别:多维度详细对比
云计算发展那么多年,大家都知道业界现在云计算服务的模式还是老三样:公有云、私有云、混合云。但是即便如此,公有云和私有云的区别到底在哪,这其中,肯定有人想过。这次阿祥也是应粉丝需求,将公有云和私有云从模式、架构、业务类型等多维度对比一下,帮助粉丝更好理解两者的区别。
ICT系统集成阿祥
2024/12/19
2.5K0
公有云和私有云的区别:多维度详细对比
公有云、私有云还是混合云:应该怎么选?
如今,企业越来越能感觉到上云所带来的好处。 不过,开始对云解决方案提供商进行调查之前,他们首先需要了解哪种类型的云是正确的选择。即使在 IT 专家中,“云”一词对不同的人而言,其意味也不尽相同。云不仅
静一
2018/03/28
9.1K0
公有云、私有云还是混合云:应该怎么选?
混合云=公有云+私有云
近两年云计算行业最受欢迎的概念无疑是混合云。混合云私有云的配置成为众多企业支持的对象。虽然照目前情况来说,混合云并没有一个很好的定义,但大多数情况下,我们所说的混合云是指公有云 自营私有云的IT架构。
企商在线
2021/08/13
29.6K0
混合云=公有云+私有云
混合云:如何在公有云和私有云的结合中保持平衡
在混合云世界中,人们将会发现公共云和私有云混合部署的优势:企业需要对某些数据和应用程序进行内部控制,以及为其他业务提供公共云的可扩展性。IT人员需要花费时间查看业务的整体解决方案,并遵循最佳实践帮助企业充分利用这一环境,同时在预算、安全、合规性和优化方面取得更大进展。
静一
2019/08/09
2.1K0
私有云和混合云仍将持续发展
当私有云和混合云技术首次出现时,一些权威人士预测,他们的应用不会持续太长时间,因为企业都将转向采用公共云。然而,他们最后都错了…想知道为什么吗? 以下有几个很好的理由解释为什么私有云和混合云可以存留下来。首先,一些企业的工作负载和存储数据一旦增长到数十PB,就会加大维护公共云部署的成本。此外,一些垂直市场(例如金融服务)的内部安全控制要求十分严格,因此在他们业务许多方面,公共云不是很好的选择。最后,企业客户希望能够选择一个最适合他们的云解决方案,并且如果他们的情况另有规定的话,他们不希望被授权使用公共云
静一
2018/03/27
1.4K0
私有云和混合云仍将持续发展
评估公有云和私有云的5个核心原则
私有云能解决企业面临的普遍挑战和问题,公有云能帮助企业向云计算平滑迁移。 在几年前,云计算刚开始流行,并且引人注目的仅是公有云,但是到了如今,私有云和混合云也正在获得越来越多企业的关注。事实上,私有云部署能解决企业面临的普遍挑战和问题,但是这其中有一些不能通过公有云来解决,公有云只能帮助企业加速向云计算迁移。 当企业衡量和评估私有云和公有云时,应该注意其中的5个核心原则: 1.易于使用 IT部门的职责不仅是技术的实施,还要对IT系统进行运营维护和支持。不幸的是,从运营和使用的角度来讲,新技术往往会耗费时间和
静一
2018/03/15
2.4K0
从惠普看企业如何实现真正的混合云
企业是选择私有云还是选择公有云进行部署?现在这已经不再是非此即彼的问题了。根据Gartner的一项调查,预计2017年底,接近一半的大型企业将部署混合云。从2013年到2014年,混合架构实际上已经在云架构中占据了支配地位。 然而,虽然目前围绕着混合云的炒作有许多,大部分企业也都表示他们正在使用混合云模式;但实际上,他们只是拥有各自独立的公有云和私有云而已。这样的应用模式并没有充分体现出混合云计算的真正价值:编排、自助服务自动化以及通过在公共云和私有云之间转移工作负载实现按需增减资源的能力。 混合云标准 的
静一
2018/03/20
1.5K0
如何设置混合云环境
评估组织需求,选择统一控制平面并解决合规性问题,以便做出明智的决策并实施最佳实践。
云云众生s
2024/06/18
3120
混合云大战在即,IT巨头们手里都有哪些牌?
根据RightScale 今年新发布的一份关于全球云计算市场的调查,58%接受调查的企业采用了混合云。在旺盛的市场需求面前,众多厂商的进入带来了混合云市场的百花齐放,竞争的大幕也随之拉开。
科技云报道
2022/04/14
8490
混合云或成企业云计算最佳选择
随着云计算出现在人们的视野之内,也出现了不少新兴术语,如公有云和私有云,这两个词很好理解,但混合云就不是那么好理解了,它对不同的人有着不同的意义和解释。 也许理解或解释混合云的最好方法是把它分解成两部分——“混合”和“云”。简单说,混合就是一个或多个组件或元素的结合。在生物学上讲,混合作物组合的属 性是一个或多个作物产生的作物具有抗病或更高的收益率或其他属性。另外,看看混合汽车。混合汽车拥有两个动力来源:一个是传统的汽油引擎,一个电动马达和 充电电池。混合汽车是解释混合云功能的一个很好的例子。 所以,如何才
静一
2018/03/19
1.3K0
公有云、私有云及混合云应用场景辨析
近几年我们经常能看到一些研究公司(Gartner朋友Alice Yang语,“我们是研究公司”)、咨询机构发布关于公有云、私有云以及混合云的市场趋势分析,种种“公有云是未来发展趋势”、“混合云是主流”等观点层出不穷。在此,笔者试图抛开趋势,仅从应用场景角度分析,试图阐述当前国内各类云的客户群体、供应商、服务和技术特点。
楼炜
2019/04/30
11K0
推荐阅读
相关推荐
科普:什么是公有云、私有云和混合云?
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档