基于多模态数据与模糊学习的股票预测研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:lichong0324
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会经济的不断发展,各类金融投资工具应运而生。有效的股票价格建模和预测在金融市场上表现出较高的经济价值。因此,股票市场的预测和交易也成为人们普遍关注的话题之一。由于股票价格的非线性和波动性以及金融交易的特殊性质,保证较高的预测性能和可解释性对于预测模型至关重要。然而,现有的方法并不能同时实现这两个目标。主流预测方法普遍基于时序数据进行建模,而金融文本数据对于股票价格的波动也具有影响。有效结合金融文本数据和时序数据可以提高预测精度。为了填补这些空白,本文构建了基于模糊学习方法建立高精度股票预测模型,并在该模型基础上提出了一种模型可解释性方法和一种多模态数据融合方法。本文的主要研究贡献包括:(1)为了建立高准确率的股票价格预测模型,在现有预测方法的基础上,本文提出了一种直觉模糊预测模型(简称IFIM)。通过嵌入机器学习拟合模型替代传统的模糊规则推理方式,解决了传统模糊学习模型计算效率低,参数指数增长的问题。同时该模型借助数据驱动方法构造直觉模糊集,可以充分挖掘输入数据的潜在信息和数据间的关联信息。得益于模型结构设计,有效地提升了预测准确率。该模型在公开的A股股票数据集上与嵌入的机器学习拟合模型相比,收益率提高了20%~40%。该模型与其他模糊学习模型相比,具有更高的模型收益率和较低的回撤。(2)为了在保证模型预测精度同时使模型具备可解释性,本文提出了基于直觉模糊集的可解释性方法。该方法可与IFIM结合构建模型可解释性,依赖模型可解释性可以以可视化的方式查看各个特征对于预测结果的贡献度。同时本文通过实验验证通过模型可解释性可以对特征进行筛选,进一步提高模型预测精度。(3)为了有效使用丰富的金融文本信息,本文提出了一种多模态混合融合方法。相比于其他多模态融合方法,本文所提出的方法降低了不同模态之间的噪声影响,结合金融文本信息特点设计跨模态融合方法。由于有效利用了金融文本信息,在实验中,基于多模态混合融合的预测模型可以取得更高的收益率。
其他文献
沼泽湿地是最主要的全球天然湿地类型,具有重要的生态作用。沼泽湿地土壤氮含量影响着氮循环,不仅能保持土壤的肥力,同时也能保护沼泽湿地生态系统的物质与能量平衡。东北冻土区是我国高纬度地区重要的沼泽湿地分布区,其冷湿气候适宜沼泽湿地土壤氮素的储藏。随着全球气候逐渐变暖,东北冻土区环境发生变化,沼泽湿地土壤氮含量也随之变化。通过对东北冻土区沼泽湿地土壤氮含量进行预测,揭示沼泽湿地土壤氮素在不同土壤深度及不
学位
住院患者跌倒是全球各医院关注的重点问题,住院患者跌倒也是医院不良事件发生率较高的事件之一,年龄越大的患者,跌倒所造成的损伤也越高。跌倒风险预测作为医护人员跌倒预防工作中最重要的一环,仅凭各类量表对患者跌倒风险进行评判不足以满足医护人员对跌倒风险相关因素分析的诉求。随机森林算法作为机器学习中的一大分支,在医疗健康应用领域具有巨大的潜力,可用于跌倒风险的预测分析。因此,本文基于随机森林算法,从医护人员
学位
近年来,我国人口出生率逐年下降,人口老龄化趋势逐年上升,国家逐步开放二孩和三孩鼓励政策,促进生育和减轻育儿压力已成为我国社会重点问题,而目前年轻父母工作压力较大,很难同时兼顾好工作和婴儿照顾事务,因此祖辈参与婴儿照顾现象也越来越普遍。同时随着AI和智能硬件快速发展,越来越多的监护产品出现在婴儿家庭中,但目前绝大部份婴儿监护产品还处于模仿欧美产品阶段,很难真正适合中国婴儿家庭监护需求。针对以上问题,
学位
音乐不仅能带给人们基本的音乐视听享受,还能满足成员的情感共鸣需求与自我表达需要。疫情背景下,大学生承受着来自学业、就业等多方面的压力,社交距离的限制给他们带来了沉重的心理距离和社会疏离感,且无法通过大规模社群活动参与排解压力。音乐是大学生情绪调节解的重要手段,是一种相对游戏等其他方式更积极和有益于身心的情绪疗愈方式,越来越多的大学生也愿意通过乐队参与的方式,享受音乐,创作音乐,并通过乐队群体进行垂
学位
近年来,我国高速公路建设蓬勃发展,由抛洒物导致的交通事故数量也在不断增加。目前对高速公路抛洒物的检测主要以人工值守监控视频的方式进行,难以保证及时、准确的检测效果。因此,设计抛洒物检测算法对高速公路视频进行快速、精准的抛洒物检测具有重大实际意义。现时的抛洒物检测算法在对高速公路视频进行检测时面临着两大难题:一方面抛洒物的种类繁多,不具有图像上的通用特征;另一方面高速公路环境复杂,监控视频中存在多种
学位
背景:当前,中国老龄化程度持续加深,痴呆患病率不断增加,但是目前尚无治疗痴呆的有效方法。轻度认知障碍(MCI)是痴呆的临床前期,是痴呆防治的最佳窗口,早期筛查并及时发现MCI期,对于科学有效的护理干预方案的制定与实施,延缓痴呆的发生发展具有重要意义。虚拟超市是基于计算机通过购物相关活动实现老年人认知功能智能筛查的软件,与在医疗环境下进行的纸笔神经心理学测试相比,其更贴近老年人的日常生活习惯,受试者
学位
复杂网络广泛存在于食物链网、神经网、智能集群网等诸多科学与工程领域,是当前大数据与人工智能时代倍受人们关注的重要课题之一.在研究实际问题时,人们常常通过一定的规律或性质,对特定的复杂网络进行约化建模,三角网络和多尺度系统就是其中较为重要而普遍的约化模型.几何奇异摄动理论是多尺度系统研究中的重要方法之一,其本质是分析相应系统所对应的快变量和慢变量,然后根据所得局部性质进行综合分析,得到原系统的整体动
学位
随着社会的急剧变迁和城镇化的快速推进,广东乡村正在经历社会、经济和文化的变革,随之而来的是传统村落的衰落,大量村落建筑面临常年闲置、坍塌甚至消失的困境。伴随着这种困境的是对传统村落肌理的破坏,文化遗产的丢失。如何打破村落建筑的困境,保护传统村落肌理,更新传统村落,协调其与城市化进程之间的关系,成为亟需解决的问题。无独有偶,广州埔心村也面临传统村落建筑闲置坍塌,村落肌理被破坏的困境,因此,笔者将以对
学位
本文旨在研究对图片和视频中的主要对象进行分割。根据被分割的数据类型不同,可具体分为针对图片的显著性检测(Salient Object Detection)和针对视频的无监督视频对象分割(Unsupervised Video Object Segmentation,UVOS)。显著性检测主要分割图像上的主要物体,因此其逐渐成为无监督视频物体分割的一个先前步骤或者预步骤。全卷积网络(Fully Con
学位
本文主要研究了三维实李代数上的Rota-Baxter算子和线性形变及其应用。全文共分为五章。在第一章中,我们首先介绍了研究课题的背景及其进展,然后介绍了本文的研究动机和主要结果。在第二章中,我们列举了本文所需要的基本概念和定理。在第三章中,我们计算其中一类三维实李代数上的Rota-Baxter算子。根据三维实李代数的分类,利用Rota-Baxter算子的定义,将此问题归结为方程组的求解问题。在第四
学位