基于CatBoost算法的多因子量化选股策略研究

来源 :上海师范大学 | 被引量 : 2次 | 上传用户:water_please
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机和信息技术的发展,人们在股票市场的投资方式不再局限于传统投资的技术分析和基本面分析,基于二者的量化投资走进了人们的视野。量化投资凭着其纪律性、系统性、及时性及分散化的特点在投资界不断取得优异的投资回报,获得了人们的认可。纵观量化界,海外国家已经大规模地使用量化的方式进行投资决策,成为了不可获取的投资方式,而我国A股市场由于创立时间晚,制度不完善,起初量化投资在中国发挥的成绩并不是很理想,但随着这几年法律制度的不断完善,计算机硬件的性能提高,量化投资逐渐在中国火热起来,并取得了优秀的成绩。在量化投资策略中,多因子选股凭借着稳定性和覆盖面广泛,一直是研究的焦点。尤其是近几年随着人工智能和大数据的发展,机器学习算法结合多因子数据进行量化选股成为了新的研究热点。本文准备使用最新的集成学习算法Cat Boost并结合有效的因子进行多因子选股建模从而构建一套能够稳定地获取超额收益的量化投资组合。本文选取了沪深300成分股近8年季度财务比率数据以及每季度最后一个交易日数据作为模型的多因子,目标变量为下季度该只个股的涨和跌,对应数字1和0。首先对原始数据进行数据预处理,使得数据变成易于建模的干净数据,然后选取经典算法随机森林、GBDT梯度提升树和最新的Cat Boost算法进行建模,并使用重要的分类问题评价指标评估算法的表现。实证研究过程中包含单期建模比较三个算法的准确性和泛化能力,多期向前滚动建模检验模型的稳定性,然后进行了因子重要性分析,最后使用算法进行选股回测评价投资收益。根据三种算法建模效果比较,最后选择了Cat Boost算法进行因子选股,使用最近的三年12个季度的数据进行选股回测,每期选择5只股票等权重进行建仓调仓。通过计算收益,单期收益分析中,三年12期中有10期超过了同期基准收益,跑赢基准季度占比83.33%,有10期取得了正收益,占比达到83.33%,为期三年共获得了140%,年化复合收益率33.88%的投资收益回报,远超基准总收益17.27%的收益率,同时最大回撤为14.57%也在合理范围之内。
其他文献
1993年~1994年,内蒙古自治区阿拉善盟先后发生两次特大沙尘暴,给西北地区造成巨大损失,其中直接经济损失3.5亿元,间接经济损失15亿元,死亡失踪111人,受伤400多人,倒塌民房数万
近年来,逐步有效化解地方政府隐性债务存量,控制地方政府投融资平台债务风险一直是国家防范化解重大风险的重要抓手。地方政府投融资平台的出现与发展在一定程度上解决了地方政府基础设施建设配套资金短缺与融资困难的问题,缓解了其财政压力,对推动地方城镇化水平的提升及区域发展建设起到重要的支撑作用。但随着经济新常态背景下地方经济发展模式的逐步转变,地方政府投融资平台的发展方式不再适应当今的经济形势,所存在的问题
<正>中医体质学说滥觞于《内经》,发展于现代。20世纪80年代,王琦教授等主编的《中医体质学》一书的问世,推动了《内经》体质学说的深入研究,并标志着这一学科的正式确立;中
会议
课堂提问是教学中非常重要的环节,是师生之间互动沟通的重要方式,课堂提问效果的高低直接影响课堂教学效果。小学语文课堂提问的设计存在问题层次浅、问题之间逻辑性不强、无
近年来,政府债务在区域经济发展中起到举足轻重的作用,但同时也是困扰经济发展可持续性及区域集聚的一个重要因素。一方面,政府债务可以为基础设施建设提供资金支持,吸引生产
一张网、一盘棋、一串城,置身国家战略,成德眉资同城化已势在必行,站在时代的风口,大成都都市圈已蓄势待发。2020年1月3日,中央财经委员会第六次会议作出推动成渝地区双城经
《念奴娇&#183;赤壁怀古》写于苏轼被贬黄州期间,词人泛舟于赤壁之下,睹物思人,咏怀古迹,写下千古名篇,成为怀古词中的代表作。《念奴娇&#183;赤壁怀古》历来是教学研究的热
随着素质教育的不断推进,学困生的教育和转化问题成为教育工作者关注的热点话题之一。近年来关于学困生的研究成果十分丰富,这些研究大多以教育学、心理学、学科理论等为理论
目前中国依靠刺激需求量与要素投入来推动经济的增长,已经受到了资源、环境和劳动力成本上升等多重因素的制约。提高全要素生产率将成为推动经济增长的主要动力,而单纯的依靠
大学生群体是担当中华民族伟大复兴重任的时代新人。然而,大学生学习投入不足现象较为普遍,给我国本科人才培养带来较大质量风险。为有效防范该风险,采用问卷调查法,运用SPSS