随着中国的证券市场规模的不断壮大、市场创新不断深化、信息披露不断完善、市场监管不断强化,随着现代投资组合理论的发展和计算机技术的进步,投资者为了在股票交易中取得更多的收益,就需要有合理有效的投资策略,因素模型的基础上发展出众多量化研究模型。对于这些模型的研究能够帮助投资者有效的跟踪市场的变化,为得出更好的投资策略而提供帮助。Logistic选股模型正是这些众多模型中的一个。
因素模型是建立在证券收益率对各种因素或指数变动具有一定敏感性的假设基础之上的一种模型。证券的收益率具有相关性,这种相关性是通过对模型中的一个或多个因素的共同反应而体现出来。证券收益率中不能被因素模型所解释的部分被认为是各种证券的个性,因而与其他证券无关。因素模型也被称为指数模型(Index model)或夏普模型(Sharp model)。
本文以多因素模型在股票交易中的应用为背景,帮助客户针对Logistic选股模型的理论基础以及模型原理方面分析Logistic选股模型的可行性与稳定性。为保证模型的可靠和稳定,使用过去五年的历史数据来检测模型。
结合以上多因素模型与Logistic回归分析的知识可以得到基于Logistic选股模型。这里采用沪深300指数作为基准,将沪深300中的个股作为研究对象,研究其收益率超过沪深300股指收益率的概率。
这里Logistic选股模型研究的窗口期选择为一个月,在当月的最后一个交易日以股票或指数投资组合的收盘价买入股票或指数资产组合,在次月的最后一个交易日以股票或指数投资组合的收盘价卖出股票或指数资产组合。
这样将即可以使用Logistic回归分析结合历史数据对组合中每支股票进行回归分析。利用回归分析结果预测每只股票下个月收益率大于指数投资组合收益率的概率,这时我们选取预测中收益率大于基准收益率概率排名前40支股票,等权重组合,在当月的最后一个交易日以收盘价买入,在次月的最后一个交易日以收盘价卖出。如此即为Logistic选股模型的交易策略。
#读取数据
file=list.files(".",pattern=".Rdata")
for(i in file)load(i)
#计算对数收益率
data$return2=c(0,( log((data$CLOSE.y[-1])/data$CLOSE.y[-nrow(data)])))
合并因子数据和收益率数据
经过对模型的检验得到以下结果:
逻辑回归收益的直方图 可以看到大部分收益分布在大于0的区域
图中显示了根据模型所选股票在当期的收益率分布。从图中可以看出大部分股票收益率分布在0%至-10%之间,将近半数的股票在其交易当期内具有小额负收益。
这个图横轴代表时间。纵轴代表使用逻辑回归模型结果在不同时间点的收益
这个图横轴代表时间。纵轴代表使用逻辑回归模型结果在不同时间点的收益率:
通过图中对利用Logistic选股模型选出的组合的收益率和基准收益率的对比可以看出看出通过Logistic选股模型选出的组合具有一个较平稳的收益率,而且在绝大数的时间内收益率超过了基准收益。由此可以看出Logistic选股模型具有一定的稳定性和有效性,在绝大多数的情况下可以选出收益率高于基准收益的组合。
Deviance Residuals:
Min 1Q Median 3Q Max
-0.86049 -0.32622 -0.05835 -0.00147 2.24675
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 7.199e+00 9.101e+00 0.791 0.429
SHARE_TOTALTRADABLE -9.482e-10 1.934e-09 -0.490 0.624
MKT_CAP -4.653e-11 5.952e-11 -0.782 0.434
MV -1.687e+00 2.033e+00 -0.830 0.407
pe -9.811e-02 1.128e-01 -0.870 0.384
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 16.081 on 41 degrees of freedom
Residual deviance: 11.560 on 37 degrees of freedom
(1 observation deleted due to missingness)
AIC: 21.56
构建了Logistic选股模型,并利用历史数据经行回测,验证模型的有效性,并根据实验数据得到结果证明Logistic选股模型可以在大部分情况下为投资者选出一个收益率能够超过基准收益的投资组合。但是本文的研究也可能存在以下问题和漏洞:
[1]:黄志文. Logistic选股模型及其在沪深300中的实证[R].国信证券,2010.
[2]:黄志文.传统多因素模型及其在沪深300 中的实证[R].国信证券,2010.
[3]:滋维·博迪.投资学[M].第九版.机械工业出版社,2012;127-172.
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。