融合多模态数据的时间序列趋势预测方法研究

来源 :山东财经大学 | 被引量 : 0次 | 上传用户:yohoban
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,时间序列趋势预测已经成为工业界和学术界的研究热点,并在各种实际场景得到了广泛应用,比如金融领域的股票投资、气象领域的温度预测以及交通领域的车辆流量预测等。同时,随着互联网的飞速发展,与时序数据相关的多模态数据比如关于股票的网络评论、财报等快速增加。仅基于单一模态时序数据进行趋势预测越来越呈现出其局限性,这就使得更多的应用需要涉及多种模态的信息。由于多模态时序数据的高度随机性,现有的部分预测模型的泛化能力较弱,而且在训练过程中会出现梯度爆炸或梯度消失的情况,进而导致预测效果不佳。针对上述问题,本文进行了如下工作:(1)针对模型泛化能力较差的问题,本文提出了一种基于门控正交循环单元(Gated Orthogonal Recurrent Unit,GORU)和变分自编码器(Variational AutoEncoder,VAE)的新型股票走势预测模型(SVGN)。具体地,GORU对文本信息进行编码并与标准归一化的历史价格信息进行融合得到市场信息,然后VAE对市场信息进行推断和解码。同时,GORU引入的正交性可以缓解梯度爆炸或梯度消失的问题,增强模型的泛化能力。我们通过消融研究的结果评估文本信息和历史价格对预测准确性的相对贡献。经过实验证明,SVGN模型在公开可用的数据集上表现出色,明显优于Stock Net、Adv-LSTM等新近模型,这表明GORU和VAE可以有效提高模型预测股票趋势的泛化能力和准确性。(2)针对SVGN模型仅能捕捉一元时序数据的时间相关性,而不能有效处理多元时序数据间相互依赖的问题,本文进一步提出了基于多级上下文的多变量时序趋势预测模型(MTTM)。首先,为了捕捉每一时序数据内的时间相关性,MTTM模型将原始时序数据进行趋势分解后进行编码后得到隐藏状态。然后,通过多模态数据融合模块,将单个时序的隐藏状态与综合时序的隐藏状态进行融合。最后,利用自注意力机制将不同时序之间的影响结合起来,并为各时序趋势生成其最终预测结果。在多个公开数据集上的实验结果表明,相较于Informer、Adv-LSTM等新近时序趋势预测方法,MTTM取得了更高的准确度、MCC以及F1值,这表明了MTTM模型在多元时序预测领域具有较好的预测性能。SVGN模型主要用于股票时序数据预测,实现了较为准确的预测结果。然而,此方法需要使用文本信息才能进行预测,对于其他不含文本信息的时序数据预测能力较弱。此外,SVGN无法有效处理多元时序数据的相互依赖。针对SVGN的问题,MTTM方法利用Transformer较强的特征提取能力和并行处理能力对多元时序数据进行预测,得到了不错的预测效果。MTTM和SVGN为时序数据趋势预测领域提供了两种准确且有效的预测方法,并为后续工作提供一定的研究思路。
其他文献
为科学评价地铁车站暴雨内涝应急能力,减少暴雨内涝灾害事故,基于三度空间理念,采用熵权云模型进行地铁车站暴雨内涝应急能力评价分析。首先从三度空间的物理空间、社会空间、信息空间出发,结合灾害应急的预防能力、准备能力、响应能力、恢复能力过程属性,构建地铁车站暴雨内涝应急能力分析框架。参考借鉴地铁内涝灾害相关文献,建立了地铁车站暴雨内涝应急能力评价指标体系。随后,建立地铁车站暴雨内涝应急评价熵权云模型。利
期刊
近年来,我国跨境电商贸易发展迅猛,成为我国对外贸易发展的新拉动力。而随着各国之间贸易往来更加频繁和深入,如何更好简化交易手续、加快流程成为了各国关注和探讨的热点问题,贸易便利化协定的出现为全球经济发展打开了新的局面。在贸易壁垒依旧存在的当今,与传统的贸易相比,跨境电商具有更大的灵活性和便利性,但依然会受到运输效率、基础设施、电子商务、服务环境等隐性壁垒的限制,所以研究贸易便利化水平对跨境电商有何影
学位
报纸
目的 采用系统评价及Meta分析方法评价膏摩疗法治疗痛症的效果及临床决策。方法 计算机检索中国知网CNKI)、万方数据库(Wanfang Data)、中国科技期刊数据库(VIP)、中国生物医学文献服务系统(CBM)、PubMed、Embase、Cochrane library、Web of science数据库,根据纳入排除标准筛选出膏摩疗法治疗痛症的随机对照试验,检索时间为各数据库建库至2021
期刊
目的 探究骨髓细胞形态学检查与血清铁蛋白(SF)、乳酸脱氢酶(LDH)联合用于多发性骨髓瘤(MM)临床诊断中的价值。方法 以126例确诊的MM患者(观察组)和21例同期因其他原因接受骨髓穿刺的受试者(对照组)为对象。测定分析2组骨髓浆细胞占比和血清SF、LDH水平。受试者工作特征曲线(ROC)分析各指标在不同分期MM诊断中的价值。结果 对照组和观察组不同分期患者骨髓浆细胞占比,血清SF和LDH水平
期刊
报纸
在互联网迅猛发展的时代,数字经济、数字贸易成为全球各国经济发展中重点关注并积极推动的方向。据联合国贸易和发展会议(United Nations Conference on Trade and Development,简称UNCTAD)官方统计,2020年全球数字服务的出口总额占其服务出口总额的63.55%,发达国家的该比重为68.10%,即使是发展中国家该比重也达到了 51.99%。显而易见,数字
学位
<正>光伏发电作为一种清洁、可再生的能源形式,受到了广泛的关注。然而,光伏发电系统存在着土地占用、光伏组件的低效率和光照不均匀等问题。为了解决这些问题并提高光伏发电的效率,渔光互补光伏电站应运而生。在渔光互补电站中,光伏组件被安装在渔网架、渔船或浮动平台上,与渔业活动实现互补发展。这种模式不仅可以有效利用水域空间,还可以减少光伏系统对土地的占用,同时提供了额外的经济收益。本文对大型渔光互补光伏电站
期刊
<正>化学元素的中文命名是科技术语规范的重要内容。用汉字给化学元素确定中文名称,以利社会日常使用,对推动科学技术普及、教育与发展具有重要意义。关于化学术语的翻译,曾有人建议全部采用或部分采用外来语,用汉语拼音进行转写等,但都没有得到化学界的认同。对此,才磊(2016)认为,"原因是汉语不是日语,日本人喜欢多音节,日语针对西方外来语,除一部分的外来语是用汉字表示的(基本上读音保持不变),其他西方外来
会议
随着世界5G技术迅速普及,射频滤波器的市场需求持续增长,体声波(BAW)滤波器因其性能高、成本低、尺寸小的优势成为了移动端射频滤波器的首选。然而,目前BAW滤波器的研制存在设计迭代周期长、时间成本高、依赖工程师经验的缺点。本文选题针对当前BAW滤波器设计中存在的问题,提出了引入AI算法来优化BAW滤波器设计的新方法,可有效缩短滤波器的设计周期,并提升滤波器的填充比,具体的研究工作如下:为快速获得B
学位