基于机器学习算法的中国A股收益率预测与应用研究

来源 :浙江财经大学 | 被引量 : 0次 | 上传用户:t381598972
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着我国资本市场改革开放的不断推进,我国A股市场加速扩容。2010-2020年我国A股市场总市值复合年均增长率为11.6%,截至2021年5月末,我国A股上市公司已达4338家,总市值仅次于美国,达到85.1万亿元。与此同时,随着科创板、注册制等多项政策不断落地,我国A股市场的财富效应愈加显著,2020年,上证指数、深证成指和创业板指涨幅分别达13.9%、38.7%和64.9%。此外,伴随着我国居民收入水平持续提高和房地产调控加码,我国居民在低利率环境下寻求更多投资渠道,居民资金正在加速进入股市。但是,在错综复杂的股票市场中掌握股市变化规律并预测其收益率是学界和业界亟待解决的问题。本文系统性地运用机器学习,探究其在中国股票市场收益率预测中的应用效果,比较不同算法的样本外预测水平,分析哪些因子是真正重要的,并检验模型在真实市场的运用效果。本文选取2006年1月至2021年6月沪深300成分股共计837支个股为样本,参考已有文献以月度为频率构建基本面类、波动率(风险)类、技术指标类三大因子,合计4826142条数据。在此基础上本文基于随机梯度下降回归、决策树、随机森林、梯度提升树和卷积神经网络五个机器学习算法构建股票收益率预测模型,并预先设置好各个模型的调整参数形式。本文通过月度滚动的整体模型设计,将处理完成的数据集输入不同的机器学习预测模型进行样本外测试,并完成特征重要性分析,最后应用于真实市场检验其投资效果。本文的研究结果最终得出以下结论:(1)机器学习应用在预测我国A股市场收益率场景是有效的,卷积神经网络模型的样本外测试表现最好,梯度提升树和随机森林次之。(2)在三大类因子对模型预测能力影响的排序中,技术指标类因子最有价值,波动率(风险)类因子次之,基本面因子影响较弱,其中基本面因子几乎只有市值因素能对模型的预测造成较大的影响。(3)通过构建股票预测收益率高的投资组合策略进行仿真模拟交易,发现机器学习预测A股市场收益率能在真实市场中带来良好的经济收益,其中神经网络模型的表现仍然最好,随机森林和梯度提升树次之。相比于以往的相关研究,在研究方法上,本文系统性地引入机器学习模型应用于我国股票市场,从新的视角研究哪些特征能对收益率预测产生影响,是对股票收益率预测问题的深化和补充;在研究内容上,本文根据我国A股市场数据进行实证检验,设计滚动预测模型尽可能排除未来数据的干扰,验证机器学习算法在我国股票市场也能获得很好的预测效果;在研究意义上,本文是对股票收益率预测问题在我国市场方面文献的补充,进一步充实了在资本市场改革开放背景下我国的股票市场理论研究内容。基于相关的理论分析和实证研究结果,本文从金融学应用研究、政府监管机构和证券投资实践三方面提出具体的建议:第一,一方面金融学的研究要勇于创新,可以把具备理论基础的已有研究与前沿的新型技术结合,突破原有理论的一些限制;另一方面要立足本土,发现我国国情下的金融学研究的特殊之处,把科研写在祖国的土地上。第二,对监管机构来说,一方面可以逐步有序放开量化投资限制,优化对冲机制,有效提高我国金融市场资源配置效率;另一方面需要防范人工智能模型内在问题对我国金融市场的冲击,控制其带来的潜在风险,提高金融系统的稳定性。第三,对证券投资实践来说,不仅仅机器学习能够有效地提升证券资产管理的效率和效益,为证券投资分析提供了一类新的工具,而且本文的研究结果表明,技术类因子在我国A股市场的预测行为中依旧有效。
其他文献
甜瓜是我国重要的经济作物之一,其品质优良,口感好,深受消费者喜爱。当前,在甜瓜种植过程中存在害虫种类多、危害重、化学杀虫剂滥用等问题,不仅直接影响甜瓜的品质,还对环境和人身安全构成了极大威胁。因此,寻求安全有效的害虫防治措施成为甜瓜生产过程中亟需解决的问题。本论文通过实地调研和问卷形式,调查了当前广东省甜瓜种植方式和施药情况、以及甜瓜主要害虫的全年发生动态。在此基础上采用药膜法测定了田间常用的5种
2020年初,我国遭遇了自新中国成立以来传播速度最快、感染范围最广、防控难度最大的重大突发公共卫生事件。面对这一危机与考验,我国用了一个多月的时间初步遏制了疫情持续蔓延趋势,用了两个多月的时间取得了疫情防控阻击战的重大战略成果。在这样的背景下,抗疫纪录片《一封家书》作为一部非常时期非常态创作下的影像作品,及时且客观的展现了中国政府对中国人民和世界人民负责任的大国担当,展示了众志成城中国力量和自强不
大数据时代,数据堪比“黄金和石油”,个人信息的作用愈加凸显。依托大数据技术,我国个人信息处理者对公民个人信息进行大规模处理,在这过程中处理不当导致个人信息泄露侵害个人信息权益,甚至沦为诈骗等违法犯罪的上游的现象越来越普遍和严重。目前我国对于个人信息保护的救济,仍然是以传统保护模式“赋权+责任”型的私力救济模式为主,让公民个人去面对拥有资源、专业技术等优势的信息处理者,这显然难以保护其自身的个人信息
随着中国经济的不断发展,生活水平和医疗水平不断进步,人民平均寿命增长,中国社会呈现出老龄化的趋势。在这样的时代背景下,庞大的老年人群体如何看待自我,如何顺应新时代的潮流,是人们关注的热点。本文结合叙事学理论以毕业作品《老年摄影团》为例,认为人物纪录片可以在直接电影的基础上交叉线性叙事和声音叙事。结合运用主观和客观表达的镜头及较为丰富的剪辑手段,借此来表达出人物纪录片与时俱进的面貌。此外,由于拍摄对
围岩的稳定性是岩体工程中的重要研究课题,围岩分级方法是评价围岩等级的有效手段。但由于高原隧道地质条件复杂多变,应用现有的围岩分级方法很难准确的判定高原隧道的围岩稳定性。目前还没有一种合理的分级体系对高原隧道围岩等级进行准确判定。本文以西藏地区高原铁路某隧道为依托,对高原隧道围岩等级的判定方法进行研究,建立了一套相对完整的高原隧道围岩分级方法,构建了高原隧道围岩分级系统,并通过实际工程案例验证了系统
采用硝酸预处理-烧碱石棉吸收重量法,结合高频红外碳硫分析仪测定晶质石墨中的固定碳,建立了测定固定碳的分析方法,对样品的称样量、灼烧时间、灼烧温度选择等进行了优化研究,实验证明,该方法流程简单,自动化程度高,分析速度快,结果准确、可靠。适用于一切石墨样品中固定碳的测定。
赣州离子型稀土矿由于早期开采过度,对矿区生态环境造成严重破坏。从矿区土壤生态修复和土壤改良的角度,通过实地调研、采样及测试分析,利用室内盆栽试验,开展了为赣南地区的废弃稀土尾矿治理提供实地应用的土壤改良剂、微生物品种及联合修复模式研究,为矿山生态修复提供科学依据和技术支撑。本文通过盆栽试验,针对尾矿土壤贫瘠、偏酸、恶化的现象,通过种植黑麦草,施用土壤改良剂(海泡石、鸡粪、腐植酸和生物炭)、接种AM
水资源是维持人类生产生活宝贵的自然资源,在21世纪显得尤为重要,伴随着城市经济的快速发展以及人口城镇化和工业化的进程,无论是全国大中小流域还是各省市的水资源都面临着一定的压力,在此背景下,水资源承载力研究应运而生。鄂尔多斯市属于西北干旱半干旱地区,近年来伴随着工业化城镇化的快速发展,人们对于水资源需求的提升所带来的水资源问题较为明显。为了实现鄂尔多斯市水资源与经济发展的和谐共生,本研究采用鄂尔多斯
在当今的社会环境中,产品同质化情况日趋严重,使得同类产品竞争激烈,造成了企业经济收益下降和大批量的资源浪费,抑制了产品价值。同时,传统的设计方法——“以形填色”设计方法限制了色彩魅力,也遏制了产品重要的创新渠道。在此背景下,本文通过以色彩为审美核心,“以形适色”(色彩先行、色形匹配)理念与方法为指导,充分发挥色彩的魅力,完成了“舞动”与“闪耀”两种系列的公共空间灯饰设计。在此过程中,通过对产品色彩
本试验以百蜜系列10个南瓜品种为研究对象,通过对各品种的物候期、植物学性状、抗病性、营养品质及耐涝性进行研究,以期揭示百蜜系列南瓜品种的特征特性。具体研究结果如下:1.通过对百蜜系列10个南瓜品种的物候期、抗病性、营养品质以及产量等方面相关指标进行测定。结果表明,10个南瓜品种的特性不同。其中百蜜6号、百蜜9号、百蜜10号品种产量以及可溶性糖含量相对于其它品种较高;百蜜3号和百蜜7号品种β-胡萝卜