基于机器学习的多因子选股组合预测与Alpha对冲策略研究

来源 :中央财经大学 | 被引量 : 0次 | 上传用户:xdq2269586
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国经济的繁荣增长,我国证券市场不断发展,但离有效市场尚有差距,存在利用历史财务和因子数据获取超额收益的空间。对于弱有效市场,采用多因子选股模型构建股票组合是战胜市场的有效办法。面临海量的财务和因子数据,机器学习算法能够有效捕捉其中的股票信息以预测未来股票涨跌,进而帮助选股。此外,随着股指期货、融资融券等新型衍生品工具的推出,Alpha对冲策略也能够引入投资策略,帮助抵御市场的系统性风险,获得股票组合的稳定超额收益。本研究主题是基于机器学习模型构建组合预测选股模型并引入Alpha对冲策略,尝试构建收益稳健的股票投资组合策略,包括三个研究目的,一是采用随机森林、XGBoost的集成学习算法建立收益表现优秀的量化多因子选股模型,二是在此基础上进行模型的组合预测,旨在优化策略的收益和风险表现,三是引入Alpha对冲策略对冲系统性风险,在市场动荡时期实现稳健收益。基于以上三个研究目的,本研究展开模型的构建:第一步,依据投资理论和统计学原理筛选获得能高效预测股票未来涨跌的因子,构建了202因子集和38因子集,两个因子集在不同的模型中有效帮助提升选股性能。第二步,使用随机森林、XGBoost模型分别构建多因子选股模型,并测试不同因子集、训练窗口下的模型在2020至2021年的表现。最终分别获取了年化收益36.94%、夏普比率0.966的随机森林选股模型和年化收益33.22%、夏普比率0.895的XGBoost选股模型。第三步,提出了组合预测方法,将两个机器学习模型的预测能力组合,旨在提高选股模型的预测准确性。本研究的组合预测分为两种组合方式,一是以基础模型输出的股票被分为某一类的概率组合,二是以基础模型输出的股票排名组合。在回测中被证实以排名进行的组合预测模型获得了最高的年化收益率41.27%,其夏普比率达1.141,因此证明组合预测方法是一个有效的提升收益、控制风险的选股模型。第四步,在组合预测选股模型基础上,引入Alpha对冲策略,旨在面临市场的动荡和下跌时,策略仍能够保证稳健的正收益。最终获得了202因子集在5个月训练窗口下训练的以排序方式进行组合预测的Alpha对冲选股策略,能够获得36.07%的年化收益率,夏普比率达到0.99,在市场下跌情况下仍保持了稳健的正收益。此外,重新选取2016年至2017年的市场震荡下行区间进行对冲策略的稳健性检验,Alpha对冲策略比组合预测模型的年收益率高10个百分点,最大回撤率降低了超过18个百分点,策略波动率显著降低。证明了市场震荡环境下,基于组合预测的Alpha对冲策略是一个有效的降低系统性风险,帮助投资者度过市场动荡的稳健选股策略。
其他文献
智能客服系统是任务型对话中的一个重要应用。智能客服系统相比人工客服而言,解决问题能力更加高效,而且成本更低,因此受到了工业界大量企业的亲睐。比如在电商领域,阿里小蜜、京东小咚等产品都是典型的智能客服系统。在政务客服领域,同样需要智能客服助力。目前,很多政府部门都提供了智能客服系统,比如北京政府的智能咨询机器人“京京”、上海政府的智能客服“小申”等。这些政务智能客服系统可以为公众提供权威的政策咨询服
学位
海冰不仅是全球气候变暖的警示器,同时也是航海的大敌。近年来,利用遥感数据来观察海冰已成为海冰研究的主要方式。图像分割技术作为高分辨率可见光遥感海冰图像研究的基础,其分割效果的好坏将会直接影响到后续研究的结果。由于高分辨率可见光遥感海冰图像的分辨率较高,以像素为单位的分割算法通常分割成本过高,且分割效率低。另一方面,高分辨率可见光遥感海冰图像光谱信息相对不足,部分区域颜色较暗,采用传统的分割算法会将
学位
随着信息技术的发展,线上教学平台和传统课堂都产生了数以万计的数据。由于教育环境的特殊性,这些数据通常具有庞大、多维、异构的特点,不仅包括教育管理系统中的学生基本信息、课程参与、成绩统计、图书阅览等异构数据,还包括了学生使用学习平台所生成的大量点击流数据,如交互数据、学习行为数据等多模态数据信息。虽然这些教育数据中蕴含了大量学习行为信息、交互信息、学习效果评价信息,但是对于没有掌握数据挖掘和数据分析
学位
本文着重于研究层级图表征学习模型,提出了一种改进当前主流层级图表征模型的算法。该算法旨在提升图分类任务中预测分类标签准确率的性能,并通过实验来验证新算法模型的有效性和可应用能力。近年来,针对处理非结构化数据的机器学习方法这一研究受到越来越多的学者关注。不同于结构化数据(如图片、音频、视频等)的固定排列结构,非结构化数据的结构排列是没有固定顺序的,这使得传统深度学习算法无法作用于非结构化数据。因此,
学位
随着人工智能技术和机器人流程自动化技术(RPA)的发展,传统的审计工作面临较大变革。审计自动化、审计智能化与审计数字化逐渐成为未来审计领域的发展趋势。因此,融合人工智能技术与RPA技术对发现企业财务舞弊、提升审计质量与审计效率具有重要意义。传统的审计模式需要跨越多个系统或应用,这些繁琐、重复性强的操作仍需审计人员手动完成,现有研究仅将新技术应用于审计的某一方面或某一特定任务,例如合同分析、收集证据
学位
随着机器学习与深度学习的不断发展,计算机视觉已经逐渐成为各大领域持续研究并应用的领域,因此异常检测技术逐渐出现在人们日常生活中的方方面面,尤其是在工业工厂领域,异常检测技术的不断成熟不仅提高了缺陷产品的检测率,减轻了工人的劳动时间与工厂的用人成本,而且极大地降低了工厂因缺陷产品而产生的成本。但是面对异常样本十分稀缺的情况下,如何训练模型来提高检测缺陷产品的准确性就成为了异常检测领域中一个需要解决的
学位
现如今这个时代人类的精神生活高度饱和,人们可以借助各类社交点评软件来表达自己对于各类事物的意见和看法,这同时也是表达自我感情的过程,会有大量的情感倾向特征应运而生。基于评论数据的情感分类可以度量出用户的情感走向,不仅可以据此实现个性化推荐,还可以依据情感波动对现实生活中的诸多事物进行切实的改进,因此其隐藏的社会价值十分有意义。但是传统的文本情感分析任务往往并没有考虑到性格这类本质性的人格特征对于人
学位
区块链经历了从数字货币技术到可应用于各行各业的发展和演变。区块链作为新兴技术,逐渐引起了中央和地方政府的重视,在2019年的全国两会上也被频繁提及。其实,早在2016年,中国政府就开始了对于区块链技术的探索。智能合约相当于是一个“不可改变”且“公正”的“中间人”,协议条件满足就会强制执行该合约,由不得赖账。但是一直以来,智能合约缺少相应的技术作为支持,所以在被提出的时候没有很好地发展下去。而区块链
学位
现在深度学习方法已经广泛应用于医学界的各种疾病检测中,为医学工作者带来了诸多便利。从2019年武汉新冠肺炎(COVID-19)疫情爆发至今,全国乃至全球人民都不可不避免地受到疫情的影响,为此各大医疗机构都加设了疫情专区,以便更有效、安全地服务患者。另外,新冠肺炎作为肺炎疾病的一种,在临床表现上有许多相似的地方,例如都会表现出咳嗽、呼吸困难等症状;在影像方面,无论是X射线检测影像还是CT影像,两者也
学位
随着计算机运算能力的不断提高,信息的存储和利用方式变得越来越简单和多样化。其中知识图谱是一种将现实世界中复杂事物关系挖掘出来并且将其可视化的技术。近年来,大数据技术以及人工智能产业的快速发展成熟,能高效准确处理海量信息的强大机器学习、深度学习算法等被应用在了各行各业的研究中,尤其在自然语言处理界,深度学习的发展大大促进了各领域知识图谱的广泛应用研究。金融行业是一个具备庞大复杂数据信息的领域,同时也
学位