基于数据挖掘和XGBoost算法的量化多因子对冲模型研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:wuyiguogdut
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自1990年以来,我国证券市场从无到有,日趋成熟。传统通过个人直觉、经验、观察进行投资的主观投资模式显得越来越力不从心。无数历史经验证明:任何一门学科当它被深入研究到一定程度时,必然会产生一些量化的描述,投资亦是如此。伴随着数学、计算机和机器学习技术的发展,量化投资开始进入到投资者的视野中来。量化投资是一种基于大数定律的投资方法。它主要借助现代统计方法以及量化个人投资经验的方法从海量历史数据中寻找各种“大概率获胜”模型,并依据这些“大概率获胜”模型构建投资模型进行大量交易。量化投资起源于上世纪七十年代的美国,截至 2019 年三季度末,Bridgewater、Renaissance、AQR Capital Management等知名量化投资公司规模均已超过600亿美元。在各类量化模型中,量化多因子对冲模型无疑是其中最亮眼的那颗星。该类模型通过股指期货、期权等对冲手段对冲掉市场风险,只获取模型针对市场所产生的的超额收益。它既继承了多因子模型收益可观、覆盖面广、模型容量较大等优点,又大大降低了模型的回撤,稳定性较高。在近年来,由于机器学习技术的发展以及金融数据中的大量非线性关系,各类机器学习算法开始被应用到多因子模型的构建中来。本篇的主要研究目的是通过遗传规划和XGBoost等机器学习算法建立一个收益稳健的量化多因子对冲模型并进行实证。主要是在下述两个方向上进行研究实证:一是要求模型所选取的因子对于股票市场需要有足够的解释力度,二是依据这些因子所建立的模型要有足够的准确度、稳定性、实用性以及较强的泛化能力。基于此两大方向,本文主要从以下几个方面来进行模型的构建:其一是挖掘相当数量的有效的Alpha因子。本文通过遗传规划算法挖掘和人工挖掘的方法从2007年初至2011年底累计211万条股票数据中挖掘出相当数量有效的Alpha因子,这使得本文的模型对于股票市场有很强的解释力度。其二是本文在模型构建中使用了近年来兴起的机器学习算法——XGBoost算法,该算法具有训练速度快、回归效果好、不易过拟合等优点,可以更好地在Alpha因子和个股收益之间建立有效的联系,提高了本文模型的准确度和稳定性,本篇论文在模型构建中还采用滚动调参的模式,每252个交易日进行一次调参,这使得模型能够更快地适应市场风格的转变,实用性和泛化能力大大增强。其三是本文引入了股指期货对冲,优化了传统对冲方式,使得模型的收益更加稳定,最大回撤显著降低。基于上述设计思路,本文最终成功设计出一个优秀的量化多因子对冲模型。在2012-01-01至2020-01-01的回测区间,模型年化收益为15.96%,远高于基准(沪深300)年化收益7.3%,信息比率为0.348,夏普比率为1.060,模型最大回撤为10.49%,同期沪深300最大回撤为46.7%,在2015年股灾以及2018年贸易战单边下跌等极端行情下,仍能规避风险取得不俗的收益(2018年年度收益20.1%,同期上证指数下跌24%),具有很强的实用性。
其他文献
美国次贷危机本质上不是一个金融问题、而是收入差距问题。文章以新古典经济增长模型为基础,分析了危机的实体经济基础,对其原因与本质进行了理论与实证研究。最后得出结论:过度
分数知识是义务教育阶段的教学重点和难点之一,也是初中代数的核心内容。在实际的课堂教学中,分数知识的教学效果并不令人满意,学生在分数学习中还存在各种困难。因此,研究分数学习困难,不仅能为教师的教提供思路和方向,也能够帮助学生克服学习困难,对学生的学具有实际意义。在此背景下,本文研究以下问题:一、预初年级学生在学习分数知识时存在哪些学习困难;二、预初年级分数学习困难的成因有哪些;三、针对预初年级分数学
高斯束偏移是近年来发展的一种较好的偏移算法,它不仅具有接近于波动方程偏移的成像精度,而且保留了Kirchhoff积分方法高效灵活的优点,能够有效解决多值走时问题。由于实际地
一、粮食生产存在的问题 (一)中低产田面积大:我县地处山区,全县中低产稻田面积73830亩,占总面积的36.4%。这些田多为冷、烂、锈、瘦、薄,单产在300公斤以下。 (二)农民种粮积
课程实施是将所设计的课程付诸实践并使之发生效用的过程.它是达成预期课程目标的基本路径和实现方式。姜大源先生在许多不同场合都用过“空对空”、“空对地”、“地对空”的
日本发明了一种纸膜覆盖水稻种植法,方法是利用旧纸制作的再生纸为膜,水稻旱栽后只浸润灌溉一次,将纸膜覆盖在泥土表面,纸膜浸湿后紧贴在泥土表面,既不会被风刮走,又可遮挡阳
对采自河南许昌的表现丛枝症状的泡桐样品进行了病原鉴定,并通过序列同源性分析确定了其分类地位。采用16SrDNA基因的通用引物R16mF2/R16mR1、R16F2n/R16R2和延伸因子(EF—Tu)tuf
随着信息技术的快速发展和人工智能时代的到来,国家已经把推广编程教育、实施人工智能进校园写入了发展规划之中。算法学习作为程序设计教学的核心内容成为了广大一线教育工作者关注的焦点。中小学信息技术的课程标准也对学生的信息技术学习提出了新的要求:通过算法模块的学习,学生可以对生活中的算法问题有一定的理解,而且可以编程实现生活中简单问题的求解,从中体会程序设计的过程,逐步培养算法思维。由于初中生的认知能力、
目的:本研究通过比较完全腹腔镜脾切除术、手助腹腔镜脾切除术和开腹脾切除术治疗创伤性脾破裂的临床资料,探讨三种手术方式治疗创伤性脾破裂的疗效、安全性,以期为临床工作中手术方式的合理选择提供一定的参考。方法:回顾性分析2014年10月—2019年12月南昌大学第一附属医院接受手术治疗的137例创伤性脾破裂患者的临床资料,按手术方式的不同分为三组,其中完全腹腔镜组(TLS)12例、手助腹腔镜组(HALS
为了评价生物柴油替代苯作为农药助剂的生态风险,室内测定了生物柴油和苯对斑马鱼、蚯蚓及黑麦草的毒性,评价二者对鱼类、土壤环节动物及植物的生态效应。在处理后24~96h,苯对斑