论文部分内容阅读
由于经济的日益全球化发展,中国的资本市场也变得日益复杂,其规模也在发展的过程中逐渐扩大,市场中各式各样的投资种类层出不穷,投资的数目也变得越来越大,不管是投资资金的来源是个人还是机构,他们所拥有的投资渠道和方式也因此呈上升趋势。其中,一种新兴的投资方式——量化投资,正在吸引了越来越多的投资人的目光。量化投资起源于国外资本市场,以一种全新的先进技术在海外资本市场掀起了巨大的波澜[1]。本文主要是研究如何将人工智能和传统多因子模型的量化投资策略结合在—起,构建基于机器学习的选股策略。通过该策略,从上市股票中选取具有投资价值的股票构建投资组合,从而希望可以通过这样的方式获取稳定的高额收益回报。这种策略优势明显,既可以扩充传统的因子选股模型构建方式的内容,又可以在研究者进行深入探究的时候给予方向和数据。本文则从该方面入手,选择了中证全指成份股2015年1月至2018年7月的交易日的因子截面数据作为数据样本。构建流程主要分为数据预处理与构建模型,检验模型构建是否具有可行性,对使用该模型得到的结果进行研究分析,对该模型进行全面的优化升级。本文分别采用了机器学习算法里的线性回归,岭回归,SVR和随机森林来构建策略。本文构建的基于机器学习的选股策略在2014年1月—2018年7月间,最佳的收益率接近700%,年化回报率也接近60%,将同期对比的中证全指的表现远远地甩在身后。通过分组比较分析可以得知,分组变化会对策略业绩造成深深的影响,两者之间成负相关,进一步说明本文所研究的模型在股票分类这一项目上有着显著的效果,可以完美辨认优势股和劣势股之间的区别。将策略在不同的因子组合,不同的持仓数,不同的市场风格下进行对比分析,可以发现其基于机器学习的选股策略的表现相差较大。另外在策略的优化方面,通过参数调优和训练集长度的修改,可以选择最佳表现的优化策略。