论文部分内容阅读
自1964年Sharpe、Linter和Mossin提出CAPM模型以来,资本资产定价模型在实践中不断发展,为了提高资本资产定价模型的解释能力,更好得解释股票收益率异象,Fama和French于1992年和2015年分别提出三因子模型和五因子模型,而Carhart基于动量效应提出了四因子模型,Hou、Xue和Zhang等人也根据q理论提出了其四因子模型,都从不同的研究方向对股票的收益率进行了很好的解释。在以上这几个经典模型之外,大量的研究者基于世界的股票市场提出了各自通过实证检验能在统计上显著得解释股票收益率的多因子模型。这为提高资本市场的定价效率,增强资本市场的有效性,促进资本资产定价理论的发展作出了突出的贡献。综合从1964年至今前人的各项研究成果,在解释股票收益率方面有430个以上能在统计上显著得解释股票收益率变化的因子。可以肯定的是,并非所有的这430个因子都能为解释股票收益率提供独立的信息。大量因子之间存在着很强的相关关系,有些因子的影响也在一些文献中被证实能被其他因子解释,而在这大量的因子集中哪些是能为解释股票收益率提供独立信息的因子,学术界一直莫衷一是。因此John H.Cochrane在其2011年美国金融协会主席演讲中挑战研究者们去识别能为美国股票市场平均收益率提供独立信息的公司特征因子。John H.Cochrane(2011)挑战的目的在于总结前面近50年的研究成果,找出这430多个因子中的哪几个能准确高效得解释股票收益率的变化。对于基于美国等西方成熟股票市场提出的资本资产定价模型,中国学者使用中国股票市场的历年交易数据进行了验证,发现国外文献提出的资本资产定价模型并不完全适用于中国的股票市场。为对中国资本市场定价理论的发展作出一定的贡献,提出适用于中国股票市场的资本资产定价模型,本文立足于中国的股票市场,通过对大量公司特征因子集进行筛选,试图挑选出能够准确解释股票收益率的独立因子,以从中国股票市场的角度回应John H.Cochrane(2011)的挑战。本文从Green,Hand和Zhang(2013)中列出的已被以往文献证明显著解释股票收益率的330个特征中选择了 38个特征因子,通过WIND金融数据库获取了上证A股市场的841支股票从2007年1月1日至2019年1月1日的月度收益率及38个特征因子的月度数据。为了尽可能保留足够多的样本量,同时保持各因子系数量纲的一致性,本文首先对股票的数据集按10%和90%分位点进行Winsorize处理,然后将各因子数据进行了正态分布标准化,最后将因子数据的缺失值填充为标准化后的平均值0。本文的总体方法遵循Fama-Macbeth(1973)的二步回归法,但是在两个方面进行了创新。第一,将全部38个特征因子作为解释变量同时对股票的月度收益率进行Fama-Macbeth回归分析,以通过对大规模因子集的分析挑选出具有独立解释能力的因子。第二,在Fama-Macbeth回归的第二步截面数据回归时,分别引入LASSO方法和Elastic Net方法作为筛选因子的方法,通过往普通最小二乘回归加入惩罚函数,解决因子之间存在的多重共线性问题,提高从大因子集中筛选独立有效因子的效率。通过对LASSO方法和Elastic Net方法筛选出的因子模型进行修正,删除t检验不显著的因子,再对修正后的因子模型进行比较,本文认为通过Elastic Net方法挑选出的因子模型要优于LASSO方法挑选出的因子模型。通过Elastic Net方法挑选出的因子模型由过去一个月动量、过去一个月日收益最大值、市场超额收益率和营运资本四个因子组成。为了检验本文提出的四因子模型的效果,本文基于相同的数据分别对Carhart四因子模型、Fama-French五因子模型和Hou等基于q理论提出的四因子模型进行了验证,通过比较发现以上三个经典模型中均有不能在统计上显著解释股票收益率的因子,从整体而言,本文通过Elastic Net方法选出的因子模型在中国上证A股市场的表现要优于以上三个经典模型。为了检验本文所选四因子模型在泛化数据集的解释能力,本文从深证A股市场选取579支股票构造相同时间段内的泛化数据集,并采取相同的数据处理方式,通过Fama-Macbeth二步回归发现本文基于上证A股市场数据提出的四因子模型在深证A股的数据集上也拥有很好的解释能力。将本文的因子模型结果进行理论分析,可将过去一个月动量和过去一个月日收益最大值划分为动量因素,而将市场超额收益率划分为市场系统风险因素,因此本文认为中国A股市场的股票收益率主要受动量因素和市场因素的影响,且以往股价表现良好的公司股票倾向于在未来有良好表现,此正向的动量效应体现了“强者恒强”的现象。