论文部分内容阅读
量化选股模型是量化投资策略的重要组成部分,机器学习算法是量化选股模型的重要研究手段,若能提高模型对股票收益的预测精度,不仅可以帮助投资者研判股票价格趋势,也能为其带来显著的投资回报.由于股票市场是一个庞大的非线性系统,数据质量和算法参数的选取会对模型的预测效果产生较大影响.因此,单一的传统预测方法已经无法较好地表现出股票价格的综合趋势.为探索新的量化选股方法,将智能算法用于量化选股建模,并探讨基于主成分分析(PCA)、人工蜂群(ABC)算法和极限学习机(ELM)的组合预测及参数优化模型.本文的主要研究内容如下:1)以沪深300成分股为研究对象,由于股票市场的各类因子具有时间和空间的双重特性,根据各因子的内在经济意义,对其分别进行归一化处理、简单趋势化处理和深度趋势化处理,然后采用ELM对处理后的三组数据进行建模,并与SVM的预测结果进行对比.对比结果表明数据经过深度趋势化处理后,模型对正样本特征的学习更加充分,且ELM对上涨股票的预测能力较好,更具有实践意义.2)采用PCA算法对三组数据进行降维处理,利用ELM对处理后的数据进行建模预测.实验结果表明,PCA提高了ELM模型的预测精度,且深度趋势化后数据的预测效果更好,模型预测准确率达到53.61%.3)将ABC算法与PCA-ELM相结合,采用ABC算法对ELM的参数进行优化,利用优化后的模型对深度趋势化后的数据进行预测,并与PCA-GA-ELM和PCA-DE-ELM的预测结果进行对比.实验结果表明,ABC算法对ELM的参数优化效果更好.此外,采用朴素贝叶斯和Xgboost模型对相同数据进行预测,结果表明PCA-ABC-ELM模型的预测精度更高,预测准确率达到59.67%.4)为进一步分析模型预测效果,将PCA-ABC-ELM的预测结果转化为投资信号,对沪深300指数成分股进行短期及中期仿真投资实验.实验结果表明,该模型的4日累计收益为8189.11元,年化收益率为66.38%,21日累计收益为50835.63元,年化收益率为80.45%,均显著优于同期沪深300指数的业绩表现,体现了该模型在沪深300成分股量化选股方面的可行性与有效性.