论文部分内容阅读
经济变量和技术指标是股票投资者进行风险投资时的重要参考。在本文中,我们分别比较了11个经济变量和16个技术指标对股市未来收益率的预测作用,发现对于单变量来预测股票未来超额收益率的情况来说,在宏观经济变量中,有股利价格比(DP)、股息率(DY)、盈余价格比(EP)、股利支付率(DE)、账面市值比(BM)、通货膨胀率(Inflation)对股票收益率有显著的样本内预测作用。其中,股息率(DP)、股息率(DY)、盈余价格比(EP)、通货膨胀率(Inflation)有显著的样本外预测能力。在所考察的技术指标中,有MA(1,9)、MA(1,12)、MA(2,12)、RSI(7)体现出了显著的样本内预测能力,并且RSI(7)还具有显著的样本外预测能力。
在分别考虑无交易成本和有交易成本的情况下,盈余价格比(EP)也表现出了正的CERgain,在不考虑和考虑交易成本的情况下,其CERgain分别为16.55和16.46,为所考察的所有经济变量中CERgain的最高值。在资产配置检验里,RSI(7)的CERgain值亦为正值,在不考虑和考虑交易成本的情况下,分别为5.26和5.19,高于运用历史平均值做预测为投资者带来的效用。
除对单变量进行预测能力检验外,我们还考察了多变量对未来一期超额收益率的预测能力,为降低共线性程度,对数据进行降维,我们分别采用三种思路对共线性程度进行降低,分别为对变量提取主成分的主成分分析法和偏最小二乘法,以及通过在最小化离差平方和的基础上加入惩罚项,从而使某些变量的系数压缩为0的LASSO方法和AdaptiveLASSO方法,以及机器学习中的随机森林方法。我们发现在第一组思路中,运用偏最小二乘法提取经济变量组、技术指标组和所有变量组的主成分,其样本内拟合程度要大于运用主成分分析对相应变量组提取主成分后的拟合程度。在第二种思路中,运用AdaptiveLASSO方法提取重要变量后,经济变量组、技术指标组、所有变量组的样本内拟合程度大于运用LASSO方法提取重要变量后对应组的样本内拟合程度。并且,运用AdaptiveLASSO方法对经济变量进行筛选,筛选后的经济变量具有显著的样本外预测能力,并且该变量组合也可为投资者带来较高的CERgain,其值为所讨论的所有方法、所有变量组合中的CERgain的最高值。运用随机森林方法这一非线性方法,相比于前四种将主成分或主要变量代入对未来一期超额收益率的线性模型中的方法,该方法可以捕获股票市场的非线性特征,对经济变量组、技术指标组、所有变量组的样本内拟合程度较主成分分析、偏最小二乘法、LASSO方法、AdaptiveLASSO方法均有了显著的提高,并且,运用该方法对三组变量剔除非重要变量后,各变量组合均具有显著的样本外预测能力,而其它方法对三组变量进行处理时,并不是每组变量均具有显著的样本外预测能力,可见随机森林方法可以很好地规避样本过拟合现象。此外,随机森林方法也可为投资者带来高于运用历史平均值做预测的效用。
此外,在稳健性检验方面,我们考察了盈余价格比(EP)、RSI(7)、AdaptiveLASSO方法筛选出的经济变量、随机森林方法筛选出的经济变量的长期预测能力,我们发现:盈余价格比(EP)对未来1个月到未来5个月的超额收益率具有显著的预测能力,RSI(7)只对未来一个月超额收益率具有样本外预测效果,AdaptiveLASSO方法筛选出的经济变量对未来一个月到未来四个月的超额收益率均具有显著的样本外预测能力。随机森林方法筛选出的经济变量对未来一个月到未来三个月的超额收益率均具有显著的样本外预测能力。最后我们尝试对RSI(7)的预测能力进行解释,认为RSI(7)越大,可以进一步改善公司的基本面,从而进一步促进股市的上涨。
在分别考虑无交易成本和有交易成本的情况下,盈余价格比(EP)也表现出了正的CERgain,在不考虑和考虑交易成本的情况下,其CERgain分别为16.55和16.46,为所考察的所有经济变量中CERgain的最高值。在资产配置检验里,RSI(7)的CERgain值亦为正值,在不考虑和考虑交易成本的情况下,分别为5.26和5.19,高于运用历史平均值做预测为投资者带来的效用。
除对单变量进行预测能力检验外,我们还考察了多变量对未来一期超额收益率的预测能力,为降低共线性程度,对数据进行降维,我们分别采用三种思路对共线性程度进行降低,分别为对变量提取主成分的主成分分析法和偏最小二乘法,以及通过在最小化离差平方和的基础上加入惩罚项,从而使某些变量的系数压缩为0的LASSO方法和AdaptiveLASSO方法,以及机器学习中的随机森林方法。我们发现在第一组思路中,运用偏最小二乘法提取经济变量组、技术指标组和所有变量组的主成分,其样本内拟合程度要大于运用主成分分析对相应变量组提取主成分后的拟合程度。在第二种思路中,运用AdaptiveLASSO方法提取重要变量后,经济变量组、技术指标组、所有变量组的样本内拟合程度大于运用LASSO方法提取重要变量后对应组的样本内拟合程度。并且,运用AdaptiveLASSO方法对经济变量进行筛选,筛选后的经济变量具有显著的样本外预测能力,并且该变量组合也可为投资者带来较高的CERgain,其值为所讨论的所有方法、所有变量组合中的CERgain的最高值。运用随机森林方法这一非线性方法,相比于前四种将主成分或主要变量代入对未来一期超额收益率的线性模型中的方法,该方法可以捕获股票市场的非线性特征,对经济变量组、技术指标组、所有变量组的样本内拟合程度较主成分分析、偏最小二乘法、LASSO方法、AdaptiveLASSO方法均有了显著的提高,并且,运用该方法对三组变量剔除非重要变量后,各变量组合均具有显著的样本外预测能力,而其它方法对三组变量进行处理时,并不是每组变量均具有显著的样本外预测能力,可见随机森林方法可以很好地规避样本过拟合现象。此外,随机森林方法也可为投资者带来高于运用历史平均值做预测的效用。
此外,在稳健性检验方面,我们考察了盈余价格比(EP)、RSI(7)、AdaptiveLASSO方法筛选出的经济变量、随机森林方法筛选出的经济变量的长期预测能力,我们发现:盈余价格比(EP)对未来1个月到未来5个月的超额收益率具有显著的预测能力,RSI(7)只对未来一个月超额收益率具有样本外预测效果,AdaptiveLASSO方法筛选出的经济变量对未来一个月到未来四个月的超额收益率均具有显著的样本外预测能力。随机森林方法筛选出的经济变量对未来一个月到未来三个月的超额收益率均具有显著的样本外预测能力。最后我们尝试对RSI(7)的预测能力进行解释,认为RSI(7)越大,可以进一步改善公司的基本面,从而进一步促进股市的上涨。