基于图神经网络的基金收益预测

来源 :上海财经大学 | 被引量 : 0次 | 上传用户:wgrlxh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着公众金融管理意识的逐步增强,加之金融市场行情火爆,我国基金业发展迅速。中国基金业协会数据显示,从2015年至2020年,我国基金总规模在数量、管理规模和份额规模方面均有显著性提升。随着基金业快速发展,基金收益预测和净值估计问题引起金融市场多方参与者的关注。基金投资者对估值不准的容忍度低,因其择时行为受短期波动影响,申购和赎回操作常参考估值结果;基金销售平台为提升用户体验和使用便捷性,致力于提高净值估计精准度;金融研究员希望从公募基金净值变化推测其持仓变动,从而把握机构投资者对市场的观点变化。以往研究主要使用时间序列分析和回归分析来建模。时间序列方法从基金净值本身的序列特点出发,较少考虑外部性;回归分析在人工挑选与预测目标相关的外部宏观经济变量和金融市场指标时,较少考虑单只基金的细粒度特征。考虑以往研究存在的问题,本文提出可加入基金底层资产的信息,将外部变量精细化到基金粒度,通过图神经网络捕获基金和底层资产之间的关联,提高预测精度。针对以上问题,本文提出了当日收益率预测框架:当交易日即将结束,框架输出当日基金收益率预测结果,使参考者的交易能够以当日基金净值结算。本文在建模时,将基金和其底层资产的关系建立为二部图,提出了基于图神经网络的基金收益预测模型GNNF,模型包含序列嵌入模块、图卷积模块和预测模块。第一,序列嵌入模块通过循环神经网络,对基金净值主时间序列和底层资产价格(股票、债券和货币)子时间序列建模,获取时序上的依赖关系和变化模式,从过往信息中提取对预测目标更有价值的深层特征,将时间序列编码为向量嵌入形式。第二,图卷积模块将底层资产子时序的信息聚合到基金主时序上,使用边权重以平均子时序的向量嵌入,生成新的主时序向量表示。该模块以两种方式生成边连接,识别主子时序之间的交互关系。第一种显式知识嵌入方式,是将基金对股票的持仓比例作为单向边连接权重。从基金公开季报中获取的持仓比例,以季度频率变化,保证了一定的动态边演化性。第二种隐式嵌入方式,是基于注意力机制,以主序列嵌入向量和子序列嵌入向量之间的余弦相似度作为边连接权重,从而能够捕获基金对各底层资产的动态持有比例。图卷积模块最终将两种嵌入转化为新的基金聚合嵌入表示,转化时两种嵌入之间的交互联系,使得持仓权重能够对相似度产生一定影响。第三,预测模块拼接前两个模块的输出,得到最终基金嵌入表示。基于残差网络的思想,将预测目标拆解为直接映射和残差:直接映射通过十大重仓股得到日收益率预测的先验信息;残差通过最终基金嵌入表示变换得到,代表预测日收益率的先验值和真实值的残差,反映基金最新季报公开持仓和实际持仓的差距。预测模块将直接映射和残差预测的结果相加,输出最终日收益率预测。为了验证GNNF模型的有效性,本文收集了A股市场数据进行实验并分析得到结论。首先,各基线模型的对比说明,基于持仓数据的Hold模型显著优于仅使用时序信息的传统时序、机器学习和深度学习模型,预测误差降低75%以上,证明底层持仓股票信息的重要度高;其次,本文提出的GNNF模型预测精度优于Hold模型7%。将不同换手率基金和不同时间段上的实验进行对比,证明了GNNF模型有效识别了基金持仓变化,克服了Hold模型的静态缺点;再者,消融实验设计证明了图卷积模块的有效性,同时使用两种嵌入可获取额外增量信息,仅使用显式知识嵌入的效果较于仅用隐式嵌入更优,公开的基金持仓信息在预测精度具有更大的价值;最后,以实际案例说明模型具有一定可解释性,相似度能识别持仓变动情况。本文展望指出,本研究提出的模型在以下角度仍存在进一步优化空间,包括基金报告的及时性、序列特征的丰富性、序列嵌入的复杂性、基于NLP的新连接边构造。
其他文献
随着4G、5G网络的快速普及和智能手机的广泛使用,短视频已经成为人们日常生活中不可或缺的娱乐方式之一。据2020年研究报告显示,截至2020年,我国短视频用户规模达到8.18亿,占全体网民的87%、我国人口的58%。随着其用户规模的不断扩大,短视频的影响力和商业价值也在迅速增加。所以短视频广告逐渐受到更多商家的青睐,其市场规模在2020年已经达到1200亿元。短视频的播放量直接决定了商品的曝光人数
学位
抽动障碍(TD)是以运动性抽动和发声性抽动为特点的神经精神类疾病,由法国医生Tourette在1885年首次发现并描述的,而在我国早在1963年就首例报道了此病。近年来,TD患病率的逐年升高,严重危害了患儿的身心健康,所以寻找实验室指标辅助TD的诊断、病情评估变得至关重要。关于TD和注意缺陷多动障碍(ADHD)的病因大部分国内外学者都认为与神经递质异常密不可分,其中多倾向于与多巴胺系统功能异常相关
学位
通过定量而不是定性的方法,构建各种各样的数学模型,从各式金融数据来源中探寻出金融市场的统一规律,赋予统一的范式是量化投资方法中“量化”的本质。量化投资技术具有极高的公式化、范式化以及重视数据的特点。从特点上看,人工智能技术在量化投资领域具有很好的应用价值:量化投资是人工智能技术的良好应用场景。人工智能算法的应用,使投资者具备智能,可以随时根据金融金融市场的变化进行学习,并且比人类投资者更为冷静理性
学位
当前我国经济逐步转入高质量发展阶段,提升出口产品质量作为贸易高质量发展的内涵之一,对于中国出口竞争力提升具有重要意义;同时,随着贸易保护主义兴起及劳动力比较优势的消减,我国制造业“大而不强”及出口产品国际竞争力偏低仍是不争事实。目前,提升制造业企业的出口产品质量已成为亟待解决的难点。地区质量声誉是影响企业出口质量的重要因素,反映消费者对一国企业产品质量的信念,高声誉地区在质量信息不对称的困境下有助
学位
习近平总书记在联合国大会上宣布了碳达峰、碳中和的目标,碳中和不仅关系到绿色效益,也关系到经济效益,两者相互联系,不可分割。对于碳减排而言,市场机制要优于行政手段,因此我国从2011年开始逐步建立国内碳排放权交易市场,并在深圳、上海、北京、广东、天津、湖北、重庆、四川和福建等9个地方逐步开展试点工作,整体而言地区碳市场各具特色、交易规模和交易活跃度不断提升,积累了碳交易的丰富经验。碳交易试点政策能促
学位
随着国家层面对技术创新的重视度逐步提升,中国企业也提升了对技术创新方面的重视程度,企业在专利申请与技术并购方面的积极性显著提高。作为能够快速提升企业自身创新研发实力的一种手段,技术并购一直受到企业的重视。尽管理论界对技术并购有着大量的研究,但对地理距离与其之间的关系研究相对较少且宽泛,并且研究也较少考虑主并企业的研发型子公司在技术并购中的作用。本文研究的对象为中国A股上市公司的技术并购事件,研究的
学位
汽车工业属于国民经济中的支柱型产业,同时它也与人们的生活息息相关,已经成为现代社会必不可少的组成成分。但是,以石油为燃料的传统汽车工业虽然为人们提供了便捷、舒适的交通工具,但也同时增加了汽车尾气对城市空气的污染程度。更关键的是,它加剧了国民经济对化石等不可再生能源的依赖,进而加深了能源生产与消费之间的矛盾。在这种国际背景下,各国都在千方百计地降低汽车的燃料消耗和致力于代用清洁燃料和新能源的开发研究
学位
近年来我国经济形势稳中向好,国内互联网普及率逐步提升,互联网已然成为大众通讯、社交、学习、娱乐和购物等的必要途径。与此同时,大批社交媒体平台也借助互联网的盛行走入公众视野,为民众提供了交流的新平台。新时代网民的生活方式、购买习惯也因互联网形式的更迭而发生着巨大的变化。一方面,传统的电商平台如淘宝、京东等开启了网友们线上购物的新旅程,成为了各大品牌方和商家的新营销主阵地,时至今日已然发展得较为成熟,
学位
<正>笔者有幸跟随国医大师刘嘉湘教授侍诊,现将其辨治皮肤T细胞淋巴瘤难治性瘙痒病验案1则报道如下。何某,男,61岁。既往有左肺腺癌Ia期手术史(2015年11月)。2019年8月28日初诊:主诉:躯干反复皮疹伴瘙痒3年余,泛发全身1年半。2016年7月在无明显诱因下出现躯干部反复皮疹伴有瘙痒,西医口服及外涂药物效果均欠佳,皮疹范围、瘙痒程度逐渐加重,于2018年10月在外院行PET-CT、
期刊
纵隔肿瘤是指在纵隔内生长的肿瘤,属于罕见肿瘤,其真实患病率难以估计,但近些年随着肺癌筛查的进行,越来越多的纵隔肿瘤患者被发现。大多数纵隔肿瘤的形成病因不明确,形态性质各异、复杂多样,多数患者无典型症状,临床上无统一的诊疗指南,这些都对医生的诊断提出了挑战。临床上,医生需要在术前对肿块的性质进行准确的诊断,才能够评估手术风险、制定合适的治疗方案。而培养这样一个经验丰富的外科医生需要漫长的周期和大量的
学位