基于XGBoost选股模型的量化交易策略设计

来源 :安徽财经大学 | 被引量 : 0次 | 上传用户:alex136629
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据科学与信息技术的快速发展,各类机器学习与人工智能算法被越来越多地应用于金融领域,量化投资应运而生。量化投资在美国等国外市场起步较早,因此发展较为成熟。相比之下,我国的量化交易起步较晚,占比也相对较小,仍有很大的发展空间。所以,研究量化投资在我国A股市场的应用具有很强的理论意义与现实价值。本文构建了一个以XGBoost分类模型和XGBoost回归模型为基础的集成模型,并使用中国A股全市场股票的日频数据进行模型的训练与选股,期望能够以此设计一个稳定获取超额收益的量化交易策略。首先,本文参考现有研究成果进行初始量化因子的筛选,并根据自身经验设计了一个特色因子——股价变动阻力(resistance)。然后,根据2011年1月1日至2023年2月28日全部A股的日频数据计算得到2022年1月1日至2023年2月28日的因子值并进行了数据清洗。接着,本文利用因子数据对XGBoost分类模型与XGBoost回归模型进行调参与集成。在此过程中,我们发现利用XGBoost回归模型对XGBoost分类模型的分类结果进行二次筛选,能够有效提升模型选股的准确率。随后,使用机器学习自有的因子评价指标、IC信息系数和IR信息比率对因子进行分析,不仅验证了本文构建的特色指标——60日股价变动阻力具有较好的表现,还发现剔除三种因子分析尾部排名的共有因子能够有效提升模型的选股能力。然后,本文在对训练集长度、训练目标与测试集长度的分析中发现,当训练集长度为120个交易日、训练目标为20日收益率且测试集长度为30个交易日时,模型的选股效果最好。最后,本文使用2012年1月1日至2017年12月31日的数据对模型进行回测检验以获取最优选股策略,并用2018年1月1日至2023年2月28日的数据进行仿真模拟交易验证策略的有效性。结果表明,使用XGBoost分类模型和XGBoost回归模型为基础的集成模型进行选股,并根据最大夏普比率组合配置股票,每20个交易日进行一次调仓,能够获得25.09%的年化收益率、0.8的夏普比率和0.264的年化波动率。本文在构建量化交易策略过程中设计了一个具有出色表现的特色因子——股价波动阻力,随着越来越多的量化因子出现“拥堵”现象,这给大家提供了一个新的选择与思路。此外,本文通过将XGBoost分类模型与XGBoost回归模型进行集成,获得了比单一模型更好的回测收益,这也为量化投资者在模型集成上提供了不同的思路。
其他文献
老年人作为一个庞大的社会群体,在药品消费中占有相当大的比重,但当前中国老年人药品包装设计的发展却相对滞后。本文通过探析老年人认知心理,充分考虑老年患者的信息识别与使用体验,通过设计的合理性来促进老年患者在进行药物使用和信息传递等相关方面便捷性的提高,完成药品和老年人医疗病痛患者之间的无障碍交流沟通。
期刊
目的通过临床病例对照研究探讨炎性因子和铁代谢与初诊癌症患者贫血的相关性;了解不同铁代谢状态的分布情况及对癌性贫血的影响;旨在为癌性贫血患者缺铁的早期干预和治疗提供指导。方法选取2020年11月至2021年9月就诊于华北理工大学附属医院的初诊癌症患者共计176例为研究对象。以男性Hb<120g/L;女性Hb<110g/L作为贫血的诊断标准。将其中67例癌症合并贫血的患者纳入病例组,109例无贫血癌症
学位
目的探讨以右美托咪定和丙泊酚为基础的不同镇静方案对脓毒症患者急性肾损伤(Acute kidney injury,AKI)的影响,为脓毒症急性肾损伤(Sepsic acute kidney injury,SAKI)患者镇静药物的选择提供一定的临床依据。方法选取2020年11月至2021年10月期间收治于华北理工大学附属医院重症监护室的SAKI患者为研究对象,随机分为试验组(右美托咪定)和对照组(丙泊
学位
目的构建miRNA-1225-5p模拟物的模型,并探究其对人结直肠癌细胞LOVO增殖、迁移、侵袭能力的影响,为miRNA-1225-5p在人结直肠癌细胞方面的研究提供部分数据和实验参考,为人结直肠癌的诊疗以及预后提供了一定借鉴。方法对人结直肠癌细胞系HCT116、HT-29、LOVO进行培养,通过Q-PCR实验来检测每组结直肠癌细胞中的miRNA-1225-5p的表达水平,筛选出差异最大的一个细胞
学位
目的通过评估雄激素性脱发(AGA)患者疾病认知、生活质量及心理状态,系统评价疾病认知对AGA患者生活质量和心理状态的影响,进一步分析AGA患者疾病认知与生活质量、心理状态间的相关性,为通过提高AGA患者的认知水平,改善生活质量,减少心理问题提供更多依据。方法选取2020年10月至2021年11月在华北理工大学附属医院毛发专病门诊、皮肤科门诊就诊以及网络招募的AGA患者为研究对象。按照纳入标准、排除
学位
目的复方丹参滴丸对经皮冠脉介入治疗(Percutaneous Coronary Intervention,PCI)患者低密度脂蛋白胆固醇(LDL-C)、高敏C反应蛋白(Hs-CRP)及临床疗效的影响。方法选择符合纳入标准的2020.10.01至2021.10.01在邢台市第九医院心内科住院并行冠脉支架植入术患者306例,所有患者均符合纳入标准,检查患者入院时、复查后的低密度脂蛋白胆固醇(LDL-C
学位
目的通过现况调查了解免疫规划医务人员(简称医务人员)及家长关于二类疫苗的知识、态度和行为及影响因素,为二类疫苗推广普及和提高儿童二类疫苗接种率提供理论依据。方法采用现况调查方法,于2019年10月和2020年8月,在长春绿园区5家社区卫生服务中心、3家乡镇卫生院,采用普查法,选取共计85名医务人员,采用自填问卷调查医务人员对二类疫苗知识的知晓和态度。采用随机抽样方法选取了281名家长,调查了儿童情
学位
随着新课程改革的不断深入推进,少数民族开展小学藏语文教学中,存在一些问题,如何解决则成为一个亟需教师思考的重要课题。民族小学的语文教师要想提升藏语教学效果,则要对存在的主要问题进行综合分析,让藏语文教学效率及教学质量皆获得提升,还可为学生未来的学习与生活奠定基础。本文基于新课程背景下,对于小学藏语文教学的问题及针对性策略进行探讨分析。
会议
目的选择接受人工辅助生殖治疗的患者人群,采用现况研究法,分析反复植入失败(recurrent implantation failure,RIF)的患病率和影响因素;在此基础上,应用单细胞测序、流式细胞术、原位杂交、免疫荧光、3D成像和生物信息学等方法,对小鼠子宫周细胞的特征及其调控子宫早期发育、妊娠早期和围植入期等不同时期子宫的功能进行研究,探究其参与RIF发生的可能机制,包括子宫周细胞分布、标志
学位
国土空间规划体系重构的时代背景下,生态文明理念将经济可持续发展与社会建设放在突出地位,日趋强调资源集约、城乡公平。国土空间规划对城乡建设用地实行总量约束,乡村地区城乡建设用地面临提质增效和低效减量的巨大压力。与此同时,乡村振兴战略又要求赋予乡村生产生活发展以一定的土地要素保障。由此,引发了国土空间规划中城镇开发边界外城乡建设用地如何选择提质增效的减量化路径和策略问题,在大城市边缘区尤为突出。据此,
学位