基于集成算法的多因子选股模型的应用研究

来源 :中南财经政法大学 | 被引量 : 0次 | 上传用户:rserrrrr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着机器学习在各个领域大放异彩,越来越多的学者开始探究如何将其应用到股票投资市场中来,以期获得稳定的收益率。其实在量化界,海外的发达国家很早就已经开始大规模地将人工智能领域的各项算法用于辅助投资决策,已然成为一种不可或缺的辅助工具了。而由于我国A股市场创立时间晚且制度不完善等各方面原因,起初这一方式并不能起到显著的作用,但随着我国证券市场制度的不断完善,这一方法正在不断地发光发热!本文的核心目的在于筛选出最能影响股票价格波动的特征因子,从而构建一套能够获得稳定收益的多因子选股模型。最终筛选得到的因子的质量将直接影响到模型的预测效果,即后续构建股票组合的收益率和稳定性。本文选取了沪深300成分股自2012年9月至2020年9月共计8年96个月的数据,选用优矿量化因子库中244个因子作为备选因子,通过Normal IC判别得到105个为有效因子,其中63个为正有效因子,42个为负有效因子;Rank IC判别得到84个有效因子,其中40个为正有效因子,44个为负有效因子。辅以随机森林和GBDT算法中对特征的重要度计算共计四种方法对特征因子的有效性进行分析最终选定84个特征因子进行建模。而后基于2013年至2017年共计五年的数据分别选用随机森林算法,GBDT算法,Cat Boost算法等集成学习算法进行网格调参建模,根据分类器性能评价指标如准确率、F1值、AUC值等指标综合比较,最终选定GBDT算法进行后续选股。基于此前网格调参获取的算法最佳参数对2019年9月至2020年8月共计12个月的月度因子数据进行选股,每月选出上涨概率最大的5只股票进行等权重的建仓调仓。最终对选定的投资组合进行回测分析收益后发现,模型选定的投资组合总收益率为71.26%,较基准收益率高出了44.63个百分点,证明了模型选股的可行性。此外,风险指标中最大回撤为20.87%,夏普比率为1.21,12期选股中共有8期投资组合的收益超过了基准收益率,也是证明了模型的稳定性。本文的研究结果也是证明了将机器学习算法运用到金融领域证券市场的可行性,相信将来两者之间也会联系得更加紧密。
其他文献
改革开放以来,中国经济规模不断发展壮大。然而以往主要依赖扩大投入要素来增加产出,这种经济发展方式会导致资源短缺、生态环境质量恶化等严重问题。因此,当务之急是寻找一条绿色可持续的发展道路。随着对美好生活的日益向往,大众对各方面的要求也越来越严格。环境问题作为目前社会发展的一个重要问题,被越来越多的人所重视。有关部门通过出台一系列相关法律法规来对环境问题进行规制,以促进环保生产。但环境规制在推动企业绿
学位
近年来,中国数字经济的规模在不断提升,数字经济时代企业信息平台的建设和互联网服务业的兴起带动了电子商务的发展,线上消费群体愈发庞大。商品的定制化、多样化影响着人们的消费需求和消费结构,居民消费对象和消费体验的升级促使消费结构不断升级。数字经济背景下居民在住房、教育、出行、娱乐等方面的消费支出不断增加,不断扩大的内需促使企业科技进步、产业数字化转型、投资结构变动,从而引领高质量经济增长。本文的研究内
学位
多年来,我国经济高速发展的同时,资源面临枯竭、水资源污染严重、生态环境恶化等问题日益严重,绿色发展的概念应运而生。绿色发展立足于平衡发展需求和自然资源能源有限供给之间的矛盾,有利于帮助解决当前生态环境保护中存在的突出问题,以实现可持续发展。绿色发展不仅是城市发展的要求,也是农村的发展新路径。鉴于此,党和国家就绿色发展道路的实现颁布了一系列文件规定,立志于将绿色发展理念广泛运用于人民生产生活的方方面
学位
贫困是全球社会发展面临的重要问题,其有着复杂深刻的社会、经济内涵。2021年2月25日,我国脱贫攻坚战取得了全面胜利,我国已消除绝对贫困,扶贫工作的重心转向缓解多维相对贫困,在新时期,全面分析我国人口贫困状况,对贫困人口进行多维贫困测度,在多维贫困视角下分析我国财政支出的减贫效果,可以优化财政支出的结构,保证财政支出精准发力,并为政府实现扶贫目标和制定扶贫政策提供可靠依据。本文选取2018年中国家
学位
突如其来的新冠肺炎疫情对我国的社会经济发展造成了极大冲击,疫情得到有效控制后,中央和地方政府便开始发布各种政策,支持企业复工复产,以求尽快恢复正常的经济社会秩序。其中,各地政府通过发放新型数字消费券的形式,扩大居民消费,定向支持特定行业和特定群体,对促进经济复苏起了重要的作用,引起了世界各国的关注。从三月下旬开始,全国有200多个城市陆续发放了消费券,5个月时间不到,就有超300亿消费券发放。鉴于
学位
小样本问题是指研究如何从少量的样本中去学习。小样本的信息间隔大,提供的可用信息少,这样少的样本集合无法完全揭示群体的整体特征。如今的大数据时代,小样本问题依然存在,如在医学领域的癌症研究中,由于基因数据获取技术要求高、成本高、涉及病人隐私等原因,导致可供研究的样本较为有限,从而很难进行有效研究。本文分别基于EPSO-VSG框架与WGAN生成大量虚拟样本,以填补小样本之间的信息缺失,从而达到提高小样
学位
个体的市场预期会通过群体行为不断地影响投资交易者的决策行为,并进一步地影响到整个金融市场的决策行为。通过研究交易者的市场预期与市场流动性两者之间存在的内在联系,能让大家更加深入地了解影响我国股票市场流动性的影响因素和影响形式,为中国股票市场的风险控制以及资本市场的改革提供一些启示作用。本文第一部分绪论主要写的是研究背景、研究现状和基本思路等;第二部分介绍市场流动性和市场预期的相关理论以及各类指标的
学位
期刊
中央经济工作会议强调,金融体制改革的深化须以金融体系结构优化调整为重点,其中银行业作为金融支柱行业首当其冲。近年随着政策的放宽,中小商业银行的兴起,以及外资银行的引入,国有大行积极深化改革,银行业竞争愈演愈烈。与此同时,兴起的金融科技成为各银行控制风险、争夺市场、获取最大利润的重要竞争领域。银行业对互联网技术的运用,在促进自身金融创新的同时,影响企业的创新,对金融科技的整体发展产生了较大影响。我国
学位
房地产业是我国社会和国民经济持续快速发展的重要基础和支柱产业,当房价产生大幅度波动时,这将对房地产市场的良好运作和经济的稳健运行产生不利的影响,因此探究房价的影响因素,稳定房价波动,这对房地产市场良好运作的重要性不言而喻。房地产市场极具复杂性,受诸多因素影响,经济发展态势、相关政策以及上下游行业情况等均会对房地产价格波动产生影响。之前对房地产市场进行的相关研究中,许多学者从市场供给、市场需求、人口
学位