论文部分内容阅读
资产定价研究在强化市场认知中具有重要作用,从投资者角度,合适的定价预测模型有利于构建有效的投资组合;针对管理者,企业市值管理及再融资需要有效的定价模型支撑;而对监管层来说,及时有效的风险测度是构建金融安全的核心。本文以大数据时代为背景,将机器学习与资产定价相结合,在风险解释、收益预测以及经济机制等方面进行了探索研究。首先针对中国A股市场存在的收益与风险不对称问题,使用机器学习重新对系统性风险进行了测度,缓解了异象。之后将研究拓展到样本外的可预测性上,对比了各类机器学习算法,创新性地构建了动态深度学习模型,提升了市场有效性。最后从机器学习的可解释性出发,从微观和宏观两个视角对机器学习背后的经济机制进行了讨论。本文在第四章从市场风险角度出发,分析了中国股市长期存在的风险收益不对称问题,构建了基于人工智能的动态CAPM模型进行解释。通过使用各类机器学习算法结合666个宏微观大数据进行系统性风险建模,更灵活、更智能的测度了我国股票市场系统性风险。实证发现基于月度数据的静态CAPM模型无法充分解释风险补偿收益,即国内股票市场长期存在CAPM模型斜率β过于平坦和截距α显著大于0的现象。而在使用基于机器学习的动态CAPM模型后定价偏误显著降低,其中非线性模型效果最好。此外通过对市场波动进行拆解,发现中国市场中收益水平变动风险是导致异象产生的主要原因。本文第五章进行了基于机器学习的中国股票市场收益预测研究。使用包括LASSO、岭回归、弹性网络、主成分分析、偏最小二乘、随机森林、增强梯度回归树、神经网络等各类机器学习模型并结合中国A股市场收益和特征大数据进行多因子模型建模和收益预测。结果发现,相比基准的最小二乘法回归模型,机器学习克服了高维数据运算时出现的多重共线性和过拟合的问题,且非线性模型相比线性模型具有更好的预测能力,主要原因在于变量间的非线性信息同样具有定价能力,非线性算法对这部分信息的提取完善了实证模型。所有模型中,本文基于中国股票市场特征进行构建的生成式对抗网络模型(Generative Adversarial Networks,GAN)表现最优,其特有的动态学习功能使得模型在市场波动的情况下相对更为稳定,预测效果更好,基于模型预测结果构建的多空组合月度收益达到了1.13%,夏普比率为0.71。第六章研究了机器学习背后的经济机制。首先考虑了存在交易摩擦时投资组合的收益变化,发现在引入0.125%和0.25%的单边手续费率后,非线性模型的组合收益仍然显著。因子重要度方面,结合GAN模型实证结果对本文使用的特征因子进行了排序,发现影响我国股票市场的三类重要特征:(1)价格及交易趋势类;(2)流动性指标类;(3)基本面指标类。前10大特征因子对于定价的贡献度占到了所有因子的40%左右。之后使用交易摩擦、波动及不确定性以及换手率与流动性等三类指标研究了GAN对于不同微观特征股票是否具有同样的预测能力。发现GAN模型整体上对低波动、高流动性的“蓝筹”类股票预测精度更高。为了更深入地理解模型与宏观经济、市场状态之间的关联,第六章还从宏观经济活跃度、经济与市场的不确定性、市场情绪等多个方面入手,构建了宏观指标为虚拟变量的回归模型,并发现GAN模型在不同经济周期其定价能力有显著的不同。总体而言,当宏观经济处于较高的新增固定资产投资、社会消费品零售总额、社会融资规模以及再贴现利率时,表明宏观经济有可能处于过热或者投资者非理性的状态,基于公司基本面特征提取的深度学习因子的预测收益会下降。而当市场波动率、外贸货物量、CPI环比、消费者满意度较高,而美国贸易政策不确定性较大时,我国的经济和市场状态较为活跃且外部世界的不确定性较高,此时深度学习因子捕捉到了企业基本面的这些特征,能获得更显著的超额收益。本文的主要贡献体现为:(1)构建了高维的宏微观特征数据,将多类机器学习模型应用到中国股票市场分析中,丰富了中国A股市场的实证资产定价研究;(2)利用机器学习构建动态资产定价模型,重新对A股市场系统性风险进行了测度,揭示了系统性风险的传导逻辑;(3)在比较各类模型后,提出了针对中国A股市场动态变化特征的深度学习模型GAN,新模型具有更好的定价和预测能力;(4)基于实证结果从微观和宏观视角挖掘了机器学习高预测性背后的经济机制,提升了复杂模型在金融市场中的可解释性,为后续相关研究提供了支持。