基于机器学习方法的金融股票预测研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:wgl_future
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
金融股票预测可以理解为:通过严谨的科学方法对股票历史数据进行分析后,能有效的预测股票市场最新走向。股票预测基于假定潜在的规律以过往数据为载体,其意图为企业或个人财务风险投资提供有效对策,使投资方获得最大利益的同时,风险无限接近于零。对股票的正确预测,能给投资者、公司带来可观的收益,从而使得股票预测成为现阶段研究的热点。与此同时,机器学习作为数据驱动的方法,在文本处理、图像分析等问题研究取得突破性成就,巧妙的利用机器学习算法对金融股票进行预测正是本文研究的课题。本文的主要工作如下:(1)对有关股票预测的国内外文献从三个不同的角度进行分类、总结后,提炼出本文主要工作的创新点:分类预测和集成学习,并绘制支撑该灵感的理论依据图。分别介绍在股票研究中较热门的6个机器学习和深度学习算法。对金融股票预测问题进行形式化定义后,对金融股票相关术语进行了解释。最后从分类和回归预测两方面阐述常用的综合性评估指标。(2)使用模拟开发者模式的爬虫技术从雪球网上获取交易相关数据,概括了本文所使用的12个著名的技术指标和计算公式。此外,现有的大量研究已表明深度学习模型在股票预测方面的优越性。本文首先对深度学习优化器的设计原理和改进点进行概述,从增加动量、自适应调整学习率到两者的混合应用。构建了深度学习模型ANN神经网络,然后选取17个输入特征且在6个数据集上比较了5个优化算法。通过在选定的数据集上开展实验,证明了在非批量计算梯度的情况下,简化的Adam优化算法效果更好,这为未来的研究工作奠定实验基础。(3)本文在充分阅读相关文献后,对K-means聚类和集成学习算法在金融股票预测中的研究进行归纳、总结,在基础的两阶段混合模型框架上进行有效的改进,提出了改进的两阶段混合模型。在金融股票预测问题上,多数的现有研究成果表明,根据特征的异质性进行分类预测是一种可行的研究方案。根据这一原理,本文将K-means聚类算法应用于两阶段混合基础模型的第二阶段输入特征中,提出了C-SVR-SVR、C-SVR-RF算法。集成学习通过将弱算法重组达到增强的效果,本文有效的利用这一优点,在基础两阶段混合模型的第二阶段加入Bagging集成学习算法,提出了E-SVR&RF模型。为了验证所提算法的有效性,在四支股票数据集上进行实验分析,证明了C-SVR-SVR、C-SVR-RF模型在特定的股票数据集上的有效性。而E-SVR&RF模型能提高四支股票预测的准确率。单独将K-means聚类或Bagging集成学习算法应用于两阶段混合模型的第二阶段中显然是有效的。本文探索性的将K-means聚类和Bagging集成学习算法相结合,加入基础模型的第二阶段中,提出了C-E-SVR&RF算法。采用递进实验的方式证明了C-E-SVR&RF算法能进一步提高股票预测的准确率,尤其是提前预测更远日期的收盘价。
其他文献
作为抗日战争时期中国的陪都,重庆曾是战时西方主流媒体关注的中心。作为西方一流的报刊媒体,《纽约时报》更是时刻关注着战时的重庆。基于话语分析的研究方法,论文把重点放
原人参二醇(PPD)为人参提取物中的有效成分,研究证实其具有诱导癌细胞凋亡、抑制癌细胞转移等作用。但其在水中的溶解性差,降低了生物利用率。需要更加合适的制剂增加其生物
背景心血管疾病是威胁人类生命的最重要的疾病之一。许多研究证实,血管平滑肌细胞异常增生在心血管疾病中起着关键作用,如动脉粥样硬化和冠脉支架内再狭窄。血管平滑肌细胞(v
随着大数据技术的飞速发展,传统的机械硬盘已经无法满足当前海量存储的性能需求,闪存凭借其高性能、低能耗、高可靠和抗震等优点脱颖而出,然而闪存具有非对称的I/O操作延迟、写前擦除和有限的寿命等缺陷,需要设计面向闪存的缓冲区算法来优化闪存的性能。当前面向闪存的缓冲区优化算法研究仍然不够成熟:一方面,缓冲区管理算法没有深入考虑访问负载的局部性特征导致性能有限;另一方面,地址映射算法存在映射项命中率低且垃圾
在电改的大背景下,电网企业越来越重视网损管理工作,而对于海南电网而言,目前的网损分析统计工作仍采用人工按月报表的形式,难以对网损管理精细化管理的需求;同时,由于缺乏对
论文以引言、主论、结论、附录等四个部分组成。第一章,简要概述了巴尔虎史诗和《三岁的古纳罕乌兰巴托尔》。首先介绍了巴尔虎史诗的发源形成。以前在巴尔虎地区怎么命名《
高分子量谷蛋白亚基(HMW-GS)和Wx蛋白是影响小麦理化品质和终产品品质的两个重要因素。为研究HMW-GS和Wx基因变异对小麦理化品质的影响及其对面条感官、质构特性的影响,本研
合作的作用在科学研究中日益显著,科研合作对完成科研任务,创新科研成果,提高科研生产力具有重要意义。发表文献是科研合作中最常见的合作方式,如何通过分析合著文献来研究科研合作、促进学科良好发展已成为近期研究的热点话题。高等农业院校学科中的作物学是高等农业院校的核心学科之一,其科研成果在我国农业与农村经济发展中发挥着重要作用,因此本研究从作物学学科的科研合作状况视角,探讨学科科研合作状况对科研生产力的影
夏嘎巴大师是近代西藏历史上出现的一颗璀璨的巨星。他的一生云游各地,以苦修闻名。他刻苦钻研佛学理论,精通五明。在佛学理论上,他无门户之见,对藏传佛教各派精要兼收并蓄,
梅克尔(Mekelle)市通过吞没周围的定居点而水平扩展,尤其是在最近几年。扩大城市的原因是吸引投资的潜力很大,这主要是由于各种基础设施的可及性以及政府的投资政策。城市的扩张是以牺牲周围定居点的大量农业用地和绿地为代价的。这项研究是在Mekelle市郊区进行的,旨在探索和分析城市的快速扩张及其对农业社区的影响。因此,抽样调查了172个因城镇扩张而从其土地上流离失所的家庭。此外,来自各种来源的辅助数