论文部分内容阅读
自1990年以来,我国证券市场从无到有,日趋成熟。传统通过个人直觉、经验、观察进行投资的主观投资模式显得越来越力不从心。无数历史经验证明:任何一门学科当它被深入研究到一定程度时,必然会产生一些量化的描述,投资亦是如此。伴随着数学、计算机和机器学习技术的发展,量化投资开始进入到投资者的视野中来。量化投资是一种基于大数定律的投资方法。它主要借助现代统计方法以及量化个人投资经验的方法从海量历史数据中寻找各种“大概率获胜”模型,并依据这些“大概率获胜”模型构建投资模型进行大量交易。量化投资起源于上世纪七十年代的美国,截至 2019 年三季度末,Bridgewater、Renaissance、AQR Capital Management等知名量化投资公司规模均已超过600亿美元。在各类量化模型中,量化多因子对冲模型无疑是其中最亮眼的那颗星。该类模型通过股指期货、期权等对冲手段对冲掉市场风险,只获取模型针对市场所产生的的超额收益。它既继承了多因子模型收益可观、覆盖面广、模型容量较大等优点,又大大降低了模型的回撤,稳定性较高。在近年来,由于机器学习技术的发展以及金融数据中的大量非线性关系,各类机器学习算法开始被应用到多因子模型的构建中来。本篇的主要研究目的是通过遗传规划和XGBoost等机器学习算法建立一个收益稳健的量化多因子对冲模型并进行实证。主要是在下述两个方向上进行研究实证:一是要求模型所选取的因子对于股票市场需要有足够的解释力度,二是依据这些因子所建立的模型要有足够的准确度、稳定性、实用性以及较强的泛化能力。基于此两大方向,本文主要从以下几个方面来进行模型的构建:其一是挖掘相当数量的有效的Alpha因子。本文通过遗传规划算法挖掘和人工挖掘的方法从2007年初至2011年底累计211万条股票数据中挖掘出相当数量有效的Alpha因子,这使得本文的模型对于股票市场有很强的解释力度。其二是本文在模型构建中使用了近年来兴起的机器学习算法——XGBoost算法,该算法具有训练速度快、回归效果好、不易过拟合等优点,可以更好地在Alpha因子和个股收益之间建立有效的联系,提高了本文模型的准确度和稳定性,本篇论文在模型构建中还采用滚动调参的模式,每252个交易日进行一次调参,这使得模型能够更快地适应市场风格的转变,实用性和泛化能力大大增强。其三是本文引入了股指期货对冲,优化了传统对冲方式,使得模型的收益更加稳定,最大回撤显著降低。基于上述设计思路,本文最终成功设计出一个优秀的量化多因子对冲模型。在2012-01-01至2020-01-01的回测区间,模型年化收益为15.96%,远高于基准(沪深300)年化收益7.3%,信息比率为0.348,夏普比率为1.060,模型最大回撤为10.49%,同期沪深300最大回撤为46.7%,在2015年股灾以及2018年贸易战单边下跌等极端行情下,仍能规避风险取得不俗的收益(2018年年度收益20.1%,同期上证指数下跌24%),具有很强的实用性。