面向股票价格预测的深度学习过拟合问题研究及其优化

来源 :深圳大学 | 被引量 : 0次 | 上传用户:angelleosy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
准确地预测股票价格对降低投资者的风险有着十分重要的意义。投资者可以通过对股价的合理预测来确定自身的投资组合,从而规避风险,获取更大的收益。虽然深度学习已经在股票价格预测上拥有很多的研究成果与实际应用,但是,仍然存在着泛化能力较弱,训练容易导致过拟合等基本问题,模型在预测阶段的表现较差。通常,数据增强以及合理调整模型架构能够有效地避免这类情况发生。本文主要针对长短期记忆网络(LSTM)在股票价格预测时泛化能力不强,训练容易导致过拟合的问题,提出了三种不同的解决方案。其中,前两个方案主要是基于数据增强的方式,对数据集进行合理扩充,并结合不同的功能模块对数据进行预处理来提高模型的泛化能力。第三个方案提出了一种全新的架构,该架构能有效防止过拟合问题,具有较强的泛化能力。本文的主要创新点如下:(1)提出了一个基于生成对抗网络(GAN)的数据增强模型c WDCGAN-LSTM。该方案创新地将GAN用到了股价数据的增强上,其核心在于利用GAN生成与真实股价数据分布相同并且相关性较高的数据。通过这种数据增强的方式,能够在一定程度上提升LSTM的预测性能。(2)提出了一个基于跨市场数据的数据增强模型MMDA-LSTM。该方案的创新点在于提出了一个使用国内外不同市场数据进行股价预测的架构,其核心是使用卷积神经网络与转置卷积神经网络对跨市场数据进行特征提取,并得到一个包含有跨市场间关系的特征映射。该特征映射结合真实股价数据作为LSTM的输入,可以有效提高LSTM的预测性能。(3)提出了一个基于LSTM的过拟合预防模型RLSTM。RLSTM由预测模块、防止模块以及全连接层组成,其中,预测模块的输入为需要预测的股票价格,而防止模块的输入为一组随机数。预测模块为模型的主要功能模块,防止模块为辅助功能模块。RLSTM的预测精度较高,能较好的缓解过拟合问题。
其他文献
多目标优化问题在现实生活中广泛存在,这些问题具有复杂度高,不易求解等特点,传统的数学方法难以对该类问题进行很好的求解。为解决这个问题,多目标进化算法被提出来并获得了广泛应用。多目标进化算法是启发式搜索算法中的一种,在处理多目标优化问题上,该类算法表现出了良好的鲁棒性和适用性。然而,随着目标个数的增加,这些多目标优化算法的有效性将逐渐地失效。原因是当目标数大于三个时,非支配解的数量将快速的占据整个种
多目标与超多目标优化问题广泛存在于现实世界当中,处理好这些问题具有重要的现实意义。然而,这些问题具有多个需要被同时优化且可能相互间存在冲突的目标函数,导致传统的数学方法很难进行处理。进化算法是一种基于种群的启发式算法,具有较强的搜索能力,能够解决很多传统方法无法解决的优化问题,已被广泛用于求解多目标与超多目标优化问题。近年来,为处理好超多目标优化问题,学术界提出了大量超多目标优化算法(Many-o
随着我国商品经济的飞速发展,人民精神需求水平日益提高,城市商业空间愈发受到公众关注。其中,动线系统和室外公共空间不仅是设计中的主要关注点和要素,更可作为整个商业建筑的点睛之笔和亮点所在,增添城市商业中心的活力。本文以环境行为学及消费心理学作为全文的理论铺垫和基础,以空间的合理性、流畅性、趣味性和活力性的分析视角来研究现当代商业综合体动线系统及外部公共空间的设计的现状情况,并以问卷调查和实地调研的研
在金融市场,股票预测一直是投资者和学术界的热门研究话题之一。随着经济全球化和股票市场的不断成熟,发展出了多种股票投资方式。近年来机器学习在多个研究领域取得了显著的成果,其中在股票预测方向除了传统的预测方法外,研究人员提出许多新的方法,并对已有的方法不断进行改进。例如利用深度学习预测股票中使用深度卷积网络、深度Q网络以及基于LSTM(长短期记忆网络)的深度循环神经网络预测股票。还有基于SVR(支持向
强化学习是一类关键的机器学习方法,普遍应用于以目标为导向的训练环境,并基于目标在环境中自发地探索最优策略。近来已在一些领域,如游戏操控、机器人操控、车辆自动驾驶等工程应用的部分问题中,获得显著的成绩,其中包括动态规划算法,应用于已知完整的马尔可夫问题模型;蒙特卡洛算法,与时间差分算法基于无模型问题进行寻策,是本文的主要研究内容。深度学习在机器学习中作为另一大热门研究技术,使用非线性的神经网络于分析
多目标优化问题广泛存在于科学研究与实际工程应用中。由于多个优化目标之间相互冲突,单个解不可能同时使所有的目标都是最优的。因此,多目标优化问题的最优解是由多个帕累托最优解组成的集合。进化算法是一种基于种群的元启发式算法,能同时优化一组解。因此,在求解多目标优化问题时,进化算法是一种非常适合的优化算法。然而,随着多目标优化问题复杂性的变化,现有的多目标进化算法越来越难以平衡种群的收敛性与多样性。因此,
目前,物联网、边缘智能和边缘计算等技术在网络边缘上生成了大量数据,而这些日益增多的数据需要在越来越复杂的深度学习算法上进行训练,以检测、分类和预测未来事件。这个趋势在未来还会继续扩大,为了加快深度学习算法的训练速度,分布式计算正变得越来越重要。然而分布式训练在主节点与计算节点间进行着频繁的梯度交换,这使得训练承受着巨大的通信开销,并且限制了分布式深度学习的训练效率。为了降低分布式深度学习的通信开销
多任务学习作为机器学习的一个重要分支,在处理多个小样本相关联任务和挖掘相关任务之间的内在联系与共享信息等方面发挥了重大的作用。其中多任务支持向量机(Multi-task Support Vector Machine,MTSVM)是多任务学习中的一个重要的发展方向。然而现有的多任务支持向量机大多并不具备特征选择的功能,在面对高维度任务或者高噪声任务并不能达到很好的效果。此外,多任务支持向量机通常假设
近年来,预测股价对国家,社会具有深远意义而引起了研究者们广泛的关注。使用深度学习算法预测股票是该领域重要的一个分支。由于股票数据集较小,不平稳,存在不稳定性,使预测股价难度增加。并且传统的算法难以有效提取股票序列的非线性特征。随着深度学习算法的发展,循环神经网络和卷积神经网络因有较好的非线性特征提取能力而逐渐在股价预测应用中崭露头角。尽管使用传统的神经网络算法预测股价能取得一定准确度,优化算法的预
近年来,随着新兴社交媒体的火热发展,越来越多的人们使用在线社交平台来获取感兴趣的信息,而随着用户网络规模的越来越大,在线社交平台上信息鱼龙混杂,真假难辨,这就导致在线信息系统的治理出现诸多问题。例如不实新闻大肆传播导致社会公信度降低,哄抬物价非法赢利,传播不当言论导致的舆情监控等问题,本文从以下两个小方面切入,旨在为在线信息系统的治理做出贡献。一是从信息的传播过程。在追踪一条信息的传播时,我们通常