可解释排序学习选股算法的研究与应用

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:sungod123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,如何使用机器学习进行股票选择成为了量化交易领域的一个热门研究方向,并且已经为许多投资公司带来巨大的经济效益。然而,目前的机器学习选股算法仍然存在着一定的局限性:大部分算法都使用分类或回归的方式进行求解,但选股问题本质上更接近于排序问题,对分类或回归指标进行优化并不能得到最优解;与此同时,机器学习模型本身的高复杂性和低解释性,使得其决策过程难以被人脑直观理解,投资人无法赋予机器学习模型足够的信任,这也阻碍着机器学习在量化交易上的进一步应用。针对以上存在的问题以及挑战,本文的主要研究内容及贡献为:(1)针对分类和回归算法的评价指标并不完全适用于选股场景的问题,本文分别基于Ranknet和Lambda MART提出了基于排序学习的选股算法,并且通过实验与分类和回归算法进行对比,结果表明排序学习算法的夏普比率是分类或者回归算法的2倍左右,证明以NDCG为评价指标的排序学习可以更直接和有效地处理选股问题。另外,Listwise类型的Lambda MART在夏普比率上也比Pairwise类型的Ranknet要高29%,进一步证明在排序学习算法类型中,Listwise比Pairwise更适合于选股场景。(2)针对选股模型的高复杂性和低解释性问题,本文在基于排序学习选股算法的基础上进一步提出具备可解释性的选股算法ISSA,通过引入机器学习可解释方法SHAP,从而确定每个股票样本每个特征对模型或者预测值的贡献,通过对数据进行可视化,帮助投资者理解模型决策的原因,赋予机器学习模型可解释性。并且本文同时也依据对模型的解释实现了自动特征选择,对比不具备可解释性的Lambda MART,ISSA的夏普比率提升了31%,最大回撤减少了4%,证明了对模型的解释可以帮助模型作有效的自动特征选择。(3)最后,本文基于上交所深交所的Level-2实时数据接口、掘金量化平台以及宽睿交易接口将第四章提出的可解释选股算法搭建成可运行的量化交易策略,基于聚宽回测系统对回测结果进行了多角度分析和验证,达到模拟盘和实盘的运行条件,并且最终实现了策略的模拟盘和实盘运行。
其他文献
目前的研究发现,表现良好的深度学习模型可以受到微小但精心设计的对抗性噪声扰动的攻击。在原始图像中添加精心设计的微小噪声扰动后的图像被称为对抗样本。不同的对抗样本生成方法可以用于评判现有模型架构的鲁棒性以及防御方法的防御性,从而发现现有模型架构的漏洞和缺陷,同时可以用于训练更加鲁棒性的深度学习模型。本文的研究场景是图像描述生成任务的无目标对抗样本攻击。现有的针对图像描述生成任务的对抗攻击方法相对较少
学位
随着人工智能技术在生产生活场景下的广泛应用,许多场景下,人们不再仅满足于对图像中的目标进行分类或定位,迫切需要对图像信号做出更进一步的理解,语义分割任务应运而生。作为计算机视觉领域中一项基础且极具挑战性的任务,语义分割技术旨在为图像中的所有像素分配语义标签,进而达到对图像的像素级视觉理解,为诸如自动驾驶、医疗辅助诊断、照片编辑等众多需求场景奠定了坚实的技术基础。相较于传统技术,深度学习技术的快速发
学位
类风湿性关节炎(Rheumatoid arthritis,RA)是一种人和动物常见的自身免疫性疾病,容易受到遗传和环境等因素的影响,主要表现为慢性关节滑膜炎,并出现不可逆的关节损伤,最终导致身体残障甚至危及生命。但目前没有治疗RA的特效药。已有研究表明,SIRT1是RA病程变化重要的决定因素,也是研究最深入的乙酰化酶(Sirtuins)家族成员,并且已经被证明与免疫学和内分泌学密切相关,然而其与R
学位
左聚糖(Levan)是一种由左聚糖蔗糖酶合成的果糖聚合物,具有抗氧化、抗炎、抗癌、抗病毒、免疫调节和降血糖的作用,在食品和生物医药领域有广泛应用前景。但是目前我国左聚糖的大规模工业生产技术尚不成熟,阻碍了左聚糖在食品和生物医药等领域的应用。本论文的研究目的是通过基因工程技术高效表达重组左聚糖蔗糖酶,进而用重组左聚糖蔗糖酶实现左聚糖的无细胞酶法合成,并对酶法合成的左聚糖进行表征。为左聚糖的大规模工业
学位
骨髓细胞形态学检查是诊断血液病、判断疗效及监测病情变化的重要手段,随着血液病的发病率不断上升,检验工作量日渐增多,传统的人工骨髓细胞形态学分析和识别的方式,已经越来越难以满足当前检验的需求。本文利用神经网络对骨髓细胞显微图像的分类方法进行研究。在骨髓细胞形态学相关知识研究的基础上,本文首先对骨髓细胞形态特征的提取,以及基于形态特征的分类方法进行研究。其中,先对骨髓细胞图像数据集进行预处理,然后利用
学位
基于二氧化锰纳米片的玉米中伏马毒素B1免疫学检测方法的建立伏马毒素(Fumonisins)是由串珠镰刀菌(Fusarium moniliforme Sheld)、轮枝镰刀菌(Fusarium verticillioides)等镰刀菌产生的水溶性次级代谢产物,全球范围内的玉米、小麦、水稻等粮食作物均有受到其污染的可能。伏马毒素具有免疫毒性、神经毒性及器官毒性等多种毒性,是国际癌症研究机构(IARC)
学位
脑卒中是严重危害人类健康的疾病,全球脑卒中发病率呈逐年上升趋势,也是我国致残率最高的疾病,给社会和经济带来沉重的负担。脑卒中的后期康复是目前临床亟需解决的重点及难点问题。神经系统结构及功能的恢复与神经细胞的再生及突触可塑性密切相关。研究发现,脑源性神经营养因子(BDNF)是神经可塑性和功能恢复的关键介质之一。然而BDNF在脑缺血再灌注损伤及神经元突触可塑性的研究中,所涉及的分子受体和细胞内信号通路
学位
人体在行走过程中被物体遮挡在监控视频中是一种很常见的现象,遮挡问题一直困扰着后续视频分析任务。为减轻遮挡所带来的影响,需要修复人体被遮挡的部位。现有方法在修复时没有考虑人体的语义信息,会出现使用背景信息修复人体部位的情况,导致修复的区域不清晰或颜色错误。本文提出了一种基于姿态的人体行走视频修复模型,从而显式地考虑人体信息。本文认为人体行走视频修复应先从人体姿态着手,即先修复视频中残缺的人体姿态序列
学位
脂肪细胞分化和脂肪沉积是影响肉牛生长发育和牛肉品质的重要因素,也是现代肉牛育种和生产中密切关注的技术重点和难点。miRNAs作为一类重要的遗传调控元件,通过与靶基因mRNA结合,在转录后水平调控反刍类动物肌肉发育和脂肪分化性状候选基因的表达和功能。目前,部分研究表明miRNA与脂肪细胞分化和脂肪细胞功能有关。实验室前期亦通过牛前体脂肪细胞和终末成熟脂肪细胞差异表达miRNAs筛查分析,获得脂肪细胞
学位
牛肠道病毒(bovine enterovirus,BEV)和柯萨奇病毒、脊髓灰质炎病毒等同属于小RNA病毒科(Picornaviridae)肠道病毒属的成员。BEV感染能够在临床上引起牛呈现以消化系统和呼吸系统症状为主要特征的传染病,且可与其它病毒混合感染,给我国养牛业造成了较为严重的经济损失。前期研究发现,HY12毒株对小鼠具有很高的侵袭力,感染后短时间就能够在多个组织中定殖,甚至能够侵袭中枢神
学位