面向函数型数据的高斯过程回归方法研究与应用

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:queenie88
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在连续空间密集采样得到的数据往往具有函数型特征,用经典的多元统计方法可以研究这些数据,但忽略了数据背后潜在的函数所包含的信息,而函数型数据分析(FDA)利用基函数将离散的数据转换成函数形式,并将沿着连续空间观测的离散数据视为一个整体进行分析,因此较少的依赖假设条件,同时可以求解曲线的微分进而挖掘更多信息。FDA建模过程中最重要的一步是将离散的数据转换为函数型数据,进而可以对函数型数据进行回归分析;高斯过程回归(GPR)以贝叶斯统计理论为支撑,它的核心方法在于利用核函数对协方差结构进行建模,由于假设了回归模型服从高斯过程的先验,因此GPR模型不仅拥有核函数的良好计算性质,同时拥有良好的统计性质,能够给出预测值的95%置信区间,但由于GPR模型仅对协方差函数进行建模,因此导致其在预测新样本时效果很差。所以,我们结合函数型数据分析和高斯过程回归,同时对均值结构和协方差结构进行建模,首先假设均值结构为函数型线性数模型,再将其转换为GPR模型的参数估计求解,利用最大化边际似然函数来估计核函数的参数θ,从而构建基于高斯过程回归的函数型数据回归(GPFR)模型,并对GPFR的核函数进行改进,发现改进的GPFR模型预测性能非常好。本文利用三种不同类型的数据(北京地区气象数据中的气压、温度数据;多维仿真数据;以及我们采集到的盾构机工作的掘进速度数据)对GPR、FDA和GPFR三种模型进行实验探究,并以均方误差(MSE)、绝对平均误差(MAE)、R平方误差(R~2)为评价指标进行对比分析,发现改进的GPFR模型在预测精度和准确度方面都要优于GPR和FDA模型,尤其是在多维数据上的优势更加明显。盾构机是地铁建设中的利器,如何利用盾构机的主要参数对盾构机的掘进速度进行精准预测一直是施工过程的难点。本文还将上述三种回归模型对采集到的多维盾构机数据进行研究,发现改进的GPFR模型利用盾构机运行的主要参数(运行时间、刀盘转速、推进压力)对推进速度的预测误差(MSE、MAE)小,精度高,预测效果远优于FDA和GPR模型,同时发现对盾构机的真实推进速度值均落在预测值的95%置信区间内,说明改进的GPFR模型利用盾构机的主要参数对掘进速度给出了较为精准的预测。
其他文献
薄皮甜瓜是榆林市榆阳区多年来特色种植产业,但生产中种植户自行留种,品种退化和混乱问题突出,调查产业现状和存在问题,对于这一特色产业的可持续发展具有重要意义。本研究采用问卷调查和实地考察等方法,对榆阳区薄皮甜瓜产业现状和存在问题进行了分析,对芝麻香瓜品种筛选和播种期确定以及配套栽培技术进行了系统总结,针对产业存在问题提出了对策建议。主要结果如下:(1)我们农技部门通过薄皮甜瓜品种引进和筛选试验,从栽
本文是一篇英汉翻译项目报告,项目原文节选自美国知名犹太女性作家安吉亚·叶捷尔斯卡(Anzia Yezierska)的代表作《养家糊口的人》(Bread Givers)第一章和第二十一章内容。作家以自传式叙事的方式讲述了移民美国的犹太女孩萨拉,如何逃离当时犹太社会传统父权的压迫,努力追求教育、自由和爱情的历程,并展现了其在美国化历程中对自我文化身份的迷茫和遭遇的种种挫折。笔者希望通过本次翻译实践,探
随着互联网的飞速发展,目前已经步入大数据时代,这也带来了新环境下的网络安全问题。为了降低网络安全风险,对于能够泛化检测恶意代码的分类检测方法展现出了其在网络中的必要性。恶意代码使用者通常使用复杂的加壳、变形等混淆技术来规避杀毒软件的查杀风险,面对这些变种的恶意代码,如何能够高效、准确的对变种恶意代码进行检测和分类具有一定的研究价值。对于恶意代码识别检测,目前通常是采用的特征提取的方法,通过提取出恶
目的本课题研究发现PIN1在正常皮肤中的功能不是很重要,条件性敲除小鼠皮肤中的PIN1不会影响皮肤的发育及其保护屏障的功能。在皮肤鳞状细胞癌中,PIN1作为一个重要的调控者能
背景:先天性膈疝(congenital diaphragmatic hernia,CDH)是由于胚胎发育异常导致的先天性畸形疾病,是新生儿急危重症之一。探索CDH的发病机制,寻找有效的治疗方法,是临床和科
现代汉语“从+X”在现代汉语中存在三种共时词汇状态,分别是词、短语和跨层的状态。文章在大规模真实语料的基础上,对已被《现代汉语词典》(第7版)收录为词的39例“从+X”进行考察,通过在所选语料库中具有较高词频的词条、成词状态和非词状态分布较为均匀的词条、现有的分词软件对其切分时易出现歧义以及具有“词”“短语”“跨层结构”三种共时词汇状态四个标准进行筛选,继而选出“从前”“从此”“从小”为研究对象,
高温磨损是热作模具在严酷工作条件下的一种典型的失效形式,高温下热作模具钢的耐磨性的差异直接影响着热作模具的使用寿命。然而目前,针对热作模具钢高温磨损失效机理以及影
近年来,铁路行业发展迅猛,铁路运营里程与客货运数量提升明显,而列车行车安全是铁路运输的根本保障。随着列车运行速度的不断提升,由于人为因素或自然灾害带来的铁路异物侵限问题已经变得十分突出,而仅靠列车司机观察与人工巡检的方式已经不能满足现实情况要求。因此,迫切需要在铁路重点路段设置一套具有检测精度高、速度快、性价比高的异物检测系统,能够及时准确的发现异物。在此背景下,本文开展了基于结构光的铁路异物检测
命名实体识别作为自然语言处理领域一项重要的基础任务,应用于机器翻译、自动问答、文本摘要、信息检索等众多领域。传统的基于规则和统计的实体识别方法需要依赖人工设计的特征,通用性较差。而深度学习方法可以通过神经网络自动学习样本来获取有效特征,自问世以来就逐步成为命名实体识别任务的主流方法。在基于深度学习的命名实体识别现有研究中,Word2Vec、Glove等分布式词向量包含了单词的语义信息,被作为单词的
氨是现代社会重要的化学品之一,目前主要是通过“Haber-Bosch”法以N2和H2为原料在高温高压的条件下合成NH3。光催化固氮是以水和N2为原料在常温常压的条件下制备氨,因此受到