基于组合核函数的高斯过程股票价格预测

来源 :云南大学 | 被引量 : 0次 | 上传用户:wusuowei282736
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
股票是现代社会众多获取投资收益的投资方式之一。股票是股份公司获取资金的重要方式之一。股票预测一直是研究的重点与难点,人们为了在股票投资中获取收益,一直尝试不同的预测模型对股价及其走势进行预测,好的股价预测模型可以帮助股民获取更多的投资收益。时间序列模型由其时间复杂度低、短期预测有效而得到广泛应用。近几年机器学习得到了广泛研究与应用,许多机器学习算法被应用于金融问题的研究,如随机森林、神经网络和高斯过程回归等。本文采用数据驱动的方法,针对所选取的万科股价的特点,形成新的组合核函数,并利用粒子群算法对核函数的超参数进行优化,基于新的组合核函数建立单指标和多指标的高斯过程回归预测模型,对万科股价做出长短期预测。本文的主要工作如下:(1)针对高斯过程回归模型中核函数类型选择、核函数超参数求解初始迭代值的设置到目前为止没有统一理论支撑的问题,通过统计软件详细分析了单一核函数、组合核函数及核函数超参数对预测分布的影响,为后文的建模分析提供参考一定的参考。(2)利用粒子群算法对组合核函数的超参数进行优化,建立了基于组合核函数的单指标股价高斯过程回归预测模型,并对万科地产的股价做出了短期预测,将预测结果与ARIMA模型短期预测效果做对比,得出高斯过程回归预测模型预测精度高,稳定性好。(3)针对股票价格多个指标,采用传统的指标选取方法——过滤法,从多个指标中选取具有代表性的几个指标,建立多指标的高斯过程回归预测模型。利用粒子群算法对高斯过程回归模型中核函数的超参数进行优化,对万科地产的股价做出长期预测。
其他文献
澜沧黄杉(Pseudotsuga forrestii)是第三纪孑遗植物,松柏目松科黄杉属的物种,属国家二级保护植物,其树形高大挺拔、四季常绿。澜沧黄杉为我国特有种,集中分布于我国云南省西北部和西藏东南部,沿着河谷两侧的陡坡分布。由于人为过度的砍伐利用,加之其生境的特殊,导致澜沧黄杉数量逐渐减少。为了阐释原生澜沧黄杉森林群落,从而对澜沧黄杉有更好的保护,本论文在澜沧黄杉群落分布的4个县,共设置49个
学位
全球气候变暖已成为人类面临的最严峻的环境问题之一。温室气体是全球变暖的主要促动因素,而氧化亚氮(N2O)作为三大温室气体之一,在百年尺度上的增温潜势是二氧化碳(CO2)的298倍。土壤氮(N)库占森林生态系统总氮储量的近90%,土壤是氧化亚氮(N2O)重要的排放源。而亚热带常绿阔叶森林土壤含有大量的碳氮储量,气候变暖可能会通过促进土壤有机氮矿化产生更多的无机氮从而进一步加速硝化作用和反硝化作用产生
学位
目前针对大空间建筑火灾空气升温的数值模拟基本都采用规则的矩形几何模型,然而在实际工程中,大空间建筑为满足使用功能和建筑造型等要求,几何形状经常采用曲面体或壳体。通过FDS程序模拟火灾场景,采用矩形单元拟合圆弧墙的算法,考察了圆弧形壁面对大空间建筑火灾下空气升温过程的影响;同时,基于MATLAB程序非线性拟合方法,建立了考虑圆弧形壁面影响的大空间建筑火灾空气升温经验公式。
期刊
浮萍,作为一种全球分布的水生漂浮植物,因能吸收水体中营养物质并生产富含淀粉和蛋白质的生物质,是实现水质净化及高品质生物质生产的理想植物。研究表明,浮萍附生有大量固氮菌并表现出较强的固氮能力,然而,截止目前,浮萍附生固氮菌组成以及附生固氮菌与浮萍的相互作用及其影响因素,尤其是氮浓度的影响几乎未见报道,有待进一步研究。因此,本研究以浮萍(Lemna japonica)及其附生固氮菌为对象,先在实验室的
学位
作为陆生生态系统中重要的干扰因子,火对植物演化的作用一直是火生态研究的重点。云南松(Pinus yunnanensis)是我国西南地区的特有种,有典型的火适应特征。本研究以分布在滇中地区的云南松为对象,从表型性状和基因转录组两个方面,研究云南松表型和遗传变异的分布格局及其与环境因子之间的关系。通过比较不同火险等级下云南松表型性状变异,探讨表型性状种内变化模式及其与火的关系;在基因水平对云南松群体进
学位
藏医药学是具有民族传统特色、理论体系完整、历史文化悠久,起源和形成于青藏高原的一门民族传统医学。该文在查阅藏医五味甘露药浴疗法及郎西(银屑病)的相关书籍、文献的基础上,概述郎西的病因及其发病机制、藏医五味甘露药浴疗法的发展起源及其历史背景,深入剖析藏医五味甘露药浴疗法独特的药物制备方法、作用机制与临床应用、禁忌证及其注意事项,简述藏医五味甘露药浴疗法治疗郎西的特点,以期为藏医五味甘露药浴疗法治疗郎
期刊
医学研究者能够通过生物成像技术从多个异构来源收集大量高维数据,继而用于医学研究。在乳腺癌的研究中,通常有多个来源的数据集,如乳腺超声数据集、乳腺钼靶数据集和乳腺MRI数据集等,联合两个或两个以上的数据源对乳腺癌的研究是有利的,通常医学研究者通过乳腺超声+乳腺MRI或乳腺钼靶+乳腺MRI来提高乳腺癌的预测能力。本文获取的数据是2017年3月-2020年12月昆明医科大学第二附属医院的乳腺患者超声数据
学位
洛伦兹曲线是比较和分析财富分配问题的重要参考指标,通常被用于衡量一个经济区域内的财富分配是否合理。洛伦兹曲线的拟合通常基于收入数据,在以往的研究中,统计学者们大多是基于是完全数据的情况来研究洛伦兹曲线。然而,在现实生活中,数据缺失的情况普遍存在。在数据不完整的情况下,继续采用传统的统计分析方法会导致估计结果出现偏差。目前对洛伦兹曲线进行研究的文献中,很少有文献讨论数据存在缺失的情况下如何对洛伦兹曲
学位
随着当今世界医学成像技术的快速发展,核磁共振成像(MRI)和功能性核磁共振成像(FMRI)技术普遍用于医学疾病的诊断研究中,例如阿尔茨海默症。医学研究者们普遍认为阿尔茨海默症是一种由于大脑功能紊乱造成的疾病,从而研究阿尔兹海默症的脑区功能连接网络是医学研究者重点关注的问题。脑区功能连接网络的确定通常根据医生的经验和文献查询的方式来获得,这类方法缺乏以数据分析为基础去探讨脑区功能的连接网络,因此如何
学位
基尼系数是衡量收入分配平等程度的指标,根据基尼系数的大小,可以准确地判断居民贫富差距。因此,精确估计基尼系数是尤为重要的。而基尼系数的计算依赖于收入数据,在实际生活中,由于收入涉及个人隐私,使得收入数据往往是存在缺失的。因此,从缺失数据的角度出发考虑基尼系数的估计问题更加具有现实意义。本文分别研究了完全数据和缺失数据情形下基尼系数的统计推断问题,以标准化的基尼平均差计算公式为基础,在完全数据集下,
学位