论文部分内容阅读
多因子选股模型目前已经成为A股量化权益投资的核心策略,因子共线性问题对策略的效果与稳健性具有基础性的重要影响,因子之间共线性问题的存在会使得投资组合的实际风格暴露偏离预期,容易在某些因子上产生过多的风险暴露。如果能合理解决因子共线性问题,将有利于提升多因子选股模型的稳健性,更好地控制投资组合的风险暴露。本文主要针对多种共线性处理方法,选用多个经典因子,在A股市场进行了相关实证分析,以探究能够合理解决因子共线性的实用性方法。本文首先介绍了多因子模型的相关背景以及多重共线性问题的研究现状,并阐述了多重共线性问题对多因子模型的影响。在理论模型方面,本文着重介绍了主成分分析法、核主成分分析法、施密特正交、正则正交、对称正交和逐步回归正交方法的基本原理与思想,并进行了相关证明与推导。同时,本文证明了施密特正交化方法与逐步回归正交方法的等价性。在实证分析阶段,本文着重对所选因子之间的共线性问题进行了检验分析,因为共线性问题本质就是样本数据问题,所以本文亦聚焦在数据层面对因子共线性问题的处理进行研究分析。本文首先采用传统数据降维算法主成分分析法对原始因子数据进行处理,将各个主成分作为转换后的新因子进行实证分析,结果表明主成分分析虽然能解决因子共线性问题,但原始因子与主成分之间无法保持对应关系,实际回测效果很差。核主成分分析方面,相比主成分方法,核主成分分析效果有所提升,并且存在一定的优化空间,但依然难以明显战胜市场。接着本文采用与主成分原理类似的正则正交化方法,结果表明正则正交化方法效果比主成分分析稍好,但依然跑输全市场等权组合。进一步,本文采用施密特正交化方法对原始因子进行正交处理,结果表明施密特正交化方法一定程度上可以保持因子变换前后的对应关系,但取决于因子正交的顺序,同时历史回测效果表明施密特正交化方法一定程度上能够解决因子共线性导致的因子重复暴露问题,具有良好的应用效果。最后,本文采用对称正交化方法进行了进一步的分析,结果表明因子对称正交处理前后能够保持良好的对应关系,并且不依赖于正交顺序,从而有利于保持因子的本质含义,历史回测结果表明经过对称正交处理后,对称正交多因子组合实现了良好的历史回测绩效表现,组合表现更加稳健。本文实证分析结果表明,施密特正交与对称正交方法对处理因子共线性问题上都具有良好的效果,但相比而言,对称正交不依赖于正交顺序,能够更好的保持因子的本质含义,历史回测也表现出相对更稳定的绩效。而主成分分析与核主成分分析、正则正交等方法则表现较差。一方面是无法保持因子处理前后的对应关系,二是实际回测分析效果较差。最后本文基于对称正交方法,使用GBDT算法构建了多因子选股模型,结果表明对称正交组合在各训练周期下的绩效表现都优于不进行对称正交的组合。本文在对称正交的基础上,分别在较短和较长的训练周期下独立训练GBDT模型,将两者的收益率预测结果进行等权加和构建GBDT长短期平衡选股模型,模型实现了更稳定的绩效变现和更强的市场适应性。所以本文所研究的内容与方法,对于改进优化多因子选股模型,提高其业绩稳健性具有一定的积极意义。