高斯过程及其扩展对股票价格的预测及对比分析

来源 :山东大学 | 被引量 : 0次 | 上传用户:Liuyuly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
预测金融时间序列对投资者和学者来说是一个有吸引力的话题,因为金融社会市场是一个复杂的动态系统,具有大量的时间序列数据。有效的预测可以帮助投资者产生超额利润。而高斯过程回归(GPR)是一种基于核的非参数方法,已被证明在许多领域有效且强大,包括时间序列预测。在本论文中,我们将重点介绍贝叶斯非参数高斯过程回归的框架及其扩展,包括高斯过程回归、学生-t似然的高斯过程回归和学生-t过程回归。通过将所有这些模型应用于股票市场,高斯过程回归及其扩展在金融时间序列预测方面显示出了强大的能力和实用性。首先,我们从权重空间视角和函数空间视角介绍了高斯过程回归的详细信息,包括所有假设和推导。此外,对高斯过程回归的几个重要部分给予了额外的关注,包括模型结构、核、均值函数和参数估计。内核包含我们对我们希望学习的函数的假设且定义了数据点之间的接近度和相似度,而均值函数支配在远离训练数据的区域中进行的预测。当提到参数估计,一个很重要的点是,只有当所有未确定的参数都从数据中学习时才能获得预测均值和方差。最后,介绍了几种模型评估方法。接着,我们研究了当使用似然函数的数值优化时,在高斯过程回归模型中初始超参数的各种先验分布对参数估计和模型的可预测性的影响。几个数值计算的结果研究表明,超参数估计的灵敏度取决于内核的选择,先验分布对参数估计有巨大影响。然而,值得注意的是,尽管估计不佳,高斯过程回归模型在可预测性方面始终表现良好,尽管某些情况下的超参数估计很差。特别地,使用各种先验的高斯过程回归模型的性能在预测方面与真实时间序列模型差距很小。总体而言,超参数的先验分布对高斯过程回归模型的性能影响不大。最后,我们介绍高斯过程回归及其扩展,包括学生-t似然的高斯过程回归和学生-t过程回归,并将上述所有模型应用于预测来自世界各地的10个主要股票指数。通过简单地比较,我们发现学生-t过程回归完全优于高斯过程回归。与经典时间序列模型ARMA比较时,这个结论是一致的。然而,在更多基于统计的实验中,结论并不那么明显。使用留一法交叉验证和k-折交叉验证,比较高斯过程回归和学生-t过程回归后的结论是,学生-t过程回归与高斯过程回归的性能基本相同。具体来说,高斯过程回归和学生-t过程回归的性能在留一法交叉验证中的指标预测方面不好,甚至没有比简单的线性预测有更好的指数预测;不过特别地,在对数收益预测方面要好一些,且学生-t过程回归略优于高斯过程回归。在k-折交叉验证中,学生-t过程回归对股票市场做出了与高斯过程回归相当的预测,甚至更好。当我们讨论滑动窗口分析时,学生-t过程回归模型比高斯过程回归有稍好一些的预测性能,尤其是在做短期预测时,例如特定市场的提前一周预测。总之,学生-t过程回归与高斯过程回归可以对股票指数做出相当的预测。
其他文献
在本篇论文中,我们主要研究了带无界生成元的一般情形的平均场超前倒向随机微分方程,此时方程的系数不仅依赖于解和解的超前项,也依赖于它们的联合分布。我们的研究内容分为三部分。首先,在第三章中,我们考虑了如下超前倒向随机微分方程:其中s+δ(s),s+ζ(s)≤T+K。对任意的s∈[0,T],g(s,ω,y,z,ξ,η):Ω ×Rm ×Rm×d × L2(Fr,Rm)×L2(Fr,Rm×d)→L2(Fs
学位
随着我国经济及综合实力的进步,人民消费理念和保险理念显著增强,社会保险和商业保险快速发展,公民同时投保工伤险、交强险、意外伤害险的情形越来越多,职工因工受交通意外伤害时上述三种保险同时触发的情形也越来越多。但我国法律对于该情形下三险赔付请求权冲突如何处理没有规定,现行中国法律规范中规定人身保险合同项下的保险金理赔不适用损失补偿的原则,这一国家立法制度现状似乎又与目前实际生活场景中投保人对健康保险、
学位
癌症是危害人类身体健康的疾病之一,且成为我国第三大死亡原因。研究发现慢性炎症与癌症的发生、发展及抗癌治疗的疗效密切相关。宿主内的持续感染诱发慢性炎症,反复的组织损伤和组织再生导致永久性的基因组改变。因此,开发选择性高的抗癌药物和活性高的抗炎药物以改善癌症治疗的疗效,仍然是当前重要科学问题之一。大黄素和大黄酸是广泛存在于中草药植物中的蒽醌类化合物,被证明具有抗癌和抗炎活性。但其水溶性较差,生物利用率
学位
恒星大气物理参数(有效温度Teff、表面重力logg、金属丰度[Fe/H])以及元素丰度([C/Fe]、[Mg/Fe]、[N/Fe])对于研究银河系结构和演化以及星系的组成等至关重要。随着世界各国的大型望远镜相继投入巡天,天文学家可以获取海量的测光数据与光谱数据。如何从这些观测数据中准确测量恒星参数(恒星大气物理参数与元素丰度)是天文学家最为关心的问题。随着机器学习技术的发展与人工智能的进步,使用
学位
GC含量一直是分子系统学研究的重要参数,是基因组重要组成特征之一,在不同物种间、基因组间和基因组内不同区域的GC含量差异显著。这种差异产生的原因一般是由于在进化过程中更倾向于增加rDNA的GC含量,这个过程被称为偏向GC的基因转换(gBGC)。gBGC理论通常用于解释哺乳动物和酵母菌基因组GC含量的变化,但在植物界中仅在禾本科植物中得到验证,其普遍性尚未证实。有关gBGC的研究目前未能与RNA特有
学位
人体随着年龄的增长在逐渐衰老的过程中,大脑是最先开始衰老的器官之一。大脑在生理性衰老过程中,结构和功能会发生一系列变化。在某些内部和外部因素的共同作用下,大脑会从生理性衰老逐渐转变为病理性衰老,最终导致了神经退行性疾病的发生。当前,人们对神经退行性疾病的发生机制仍然不是很清楚,临床上的治疗手段有限。目前,普遍认为衰老是神经退行性疾病的最大风险因素,因此,针对衰老制定的保护策略可能会成为抑制神经退行
学位
圆法(又称δ-恒等式)是研究解析数论问题常用的重要方法.圆法的形式多种多样,采用不同形式的圆法对所研究的问题有重要影响.本文令g是Γ0(D)上的本原全纯或Maass新形式.通过研究与g有关的Bessel积分,我们推导出与g有关的Besselδ-恒等式的渐近展开.这是对圆法形式的创新.作为应用我们证明了下述混合亚凸界,即对于任意的ε>0,L(1/2+it,g(?)χ)<<g,ε(q(1+|t|)εq
学位
过分散计数数据是指具有方差大于均值特性的一类非负离散整数型数值,刻画了在固定时间段内某行为的发生次数,广泛存在于各应用和科学领域。对于过分散计数数据的研究,主流方法是使用负二项分布对其进行分析,但在现实生活中计数数据往往是多维的,且存在多重相依结构,可总结为时间相依性、空间联动性和变量相关性三种情况,常用的统计模型已经不能满足此类数据研究的需要。倘若忽视数据的过分散性或相依结构则可能会降低模型的准
学位
滚动接触疲劳试验是一种模拟轴承、齿轮、轧辊、轮箍等滚动接触零件工况的失效实验,它可以为这些零件的设计、选材、制订冷、热加工工艺提供依据。目前,传统疲劳试验机试件疲劳失效判别主要采用人工停机检测、测量振动信号检测、油样分析检测,以及同时监测试件的摩擦扭矩信号和温度信号来检测等方法。上述方法试验人员需要长时间值守在试验机旁,工作强度大,不但提高了滚动接触疲劳试验的试验成本,而且因为难以捕捉滚子试样初始
学位
党的十九届四中全会提出“打造人人有责、人人尽责、人人享有的社会治理共同体”,是新时代背景下党和国家对社会治理理论与实践的创新性阐述。社会治理共同体的本质在于多元社会治理力量的交往互动和情感共生。但随着我国城市化进程的不断加快,旧有的熟人社会不断被打破,居民间的认同感和归属感低,何为构建社会治理共同体的良方悬而未决。近年来,中国本土化实践中的公共空间生产热潮,为我们分析社会治理共同体的建构提供了可行
学位