基于随机缺失函数型非参数/半参数模型的k近邻估计

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:jiangliang87
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现代科学技术的发展为海量数据的收集及存储提供了技术支持,函数型数据分析(Functional data analysis,FDA)方法则作为一种专门基于高维数据的函数特性进行分析的方法,已经在环境科学、化学、生物学、经济学、水文等领域得到了广泛的应用,是统计学界近几十年的一个热门研究方向。函数型非参数回归模型以及半函数型部分线性回归模型是近年研究函数型数据统计推断的常见模型,其中,半函数型部分线性回归模型作为一种特殊的半参数模型,主要是在非参数回归模型的基础上结合了易于解释的参数部分,从而增加了模型的适应能力以及预测能力。k近邻(k-Nearest Neighbor,kNN)方法也是在函数型数据分析中的有力工具,通过离散参数k代替核回归估计中的连续参数h来选取局部自适应性窗宽,将大大提高模型的计算速度。而由于客观及主观等各种因素,数据缺失的情况广泛存在于各个领域中,如何处理实际数据中的缺失情况对于统计方法在现实领域的应用方面有很大的影响。随机缺失数据在有限维场合下已被广泛研究,但在函数型场合下还未得到较多发展,如何将kNN估计结合函数型非参数/半参数模型在响应变量存在随机缺失的情形下得到较好的结果并应用到实际场景中是一个巨大的挑战。本学位论文主要基于响应变量随机缺失的函数型非参数/半参数模型,构造了相应的kNN估计量并理论证明了估计量的渐近性质,模拟实验及真实数据分析也进一步验证了估计量良好的预测效果。主要研究内容分为以下两部分:(一)基于随机缺失函数型非参数模型的k近邻估计在响应变量随机缺失的情况下,通过kNN回归估计得到了解释变量为函数型数据的非参数回归算子的估计量,并理论证明了该估计量的渐近性质;其次通过不同样本量的模拟曲线验证了数据量以及样本量缺失率对于预测结果的影响,并展示了kNN估计相较于核回归估计的优势;最后,通过温度曲线对北京市PM2.5含量的预测分析结果检验了模型的可行性以及预测能力,阐明了用kNN方法构造估计量的实际意义。(二)基于随机缺失半函数型部分线性回归模型的k近邻估计半函数型部分线性回归模型实际上是对非参数模型的一个延伸,第四章主要工作是进一步在响应变量随机缺失的情况下,构造了半函数型部分线性回归模型中线性算子以及非参数回归算子的kNN估计量,详细梳理参数向量β估计量的渐近性质及非参数回归算子m(?)估计量的一致收敛速度两部分的证明过程后,又通过模拟实验进一步验证了样本量以及样本缺失率对于预测结果的影响,并通过与非参数模型下得到的预测结果进行对比,展示了半函数型部分线性回归模型良好的预测效果。
其他文献
脉诊在传统中医的临床实践中有着几千年的历史,是中医里的四诊(望、闻、问、切)之一,属于切诊。脉诊所依据的原理是:由于心脏有节奏的收缩和舒张形成了脉搏波信号,同时该信号也受到血液和血管体积变化的影响,使其对判别和分析某些特定的疾病有着重要的参考依据。然而,脉诊技巧需要长时间的训练和临床经验才能熟练掌握,并且,由于脉诊十分依赖于个人经验导致不同医生的脉诊结果也会有所不同。为了克服以上缺陷,计算机脉诊近
机器人在航空航天、灾后救援、防暴除暴、仓储物流等诸多领域得到了广泛的应用,而机器人如何通过传感器完成对自身的定位,同时构建环境地图是机器人实现智能化的一项关键技术,为解决此问题,SLAM(Simultaneous Localization and Mapping,同步定位与建图)技术应运而生。近些年来随着计算机视觉和相机技术的发展,如何使用视觉传感器构建精度更高的SLAM系统逐渐成为研究热点。视觉
余光中是中国文坛的重要人物,是当代著名的诗人、散文家,在他的一生中,笔耕不辍,从事诗歌、散文、评论、翻译事业,称为自己写作的“四度空间”。作为中国文坛的重要人物,国内外研究和评价他的文章数不胜数,不胜枚举。他的作品也多次被选入中学语文教材。在教学中,人们逐渐认识到现代诗歌的教育价值和意义,其对促进学生全面发展有十分重要的作用,另外也进一步拓宽了新的教学发展路径——借助诗歌来丰富学生的文化涵养、提高
本文共完成了两方面的研究:一是不可约特征标维数和对群结构的影响:二是单群的ONC-刻画.一.不可约特征标维数和对群结构的影响:设G为有限群,好为G的非平凡子群,T为G的所有不可约特征标之和,且T(G)=T(1).对任意的ф∈Irr(H),令a(ф)=[TH,ф].因此T(G)=T(1)=Σ/ф∈Irr(H)a(ф)(ф)和(1).令δ(G,H)=T(G)-T(H)=Σ/ф∈Irr(H)(a(ф)-
从2014年开始,我国正式将金融体制改革纳入政府重要管理工作中,并在接下来的四年时间里反复提及金融体制改革并要求尽快落地执行。与此同时,国内金融市场的发达程度较高,市场开放性和包容性的能力增强,涌现出了许多农村商业银行和民营银行。在对公业务和同业业务市场逐渐趋于饱和的情况下,个人业务市场将成为银行类金融机构新一轮业务竞争的增长点和关键点。正是基于上述宏观环境和发展背景,LZ银行应运而生,作为典型的
为满足我国日益增长的交通需求,促进社会经济的快速发展,越来越多的近海桥梁在我国范围内兴建起来。由于所处地理位置的特殊性,近海桥梁在服役期内不免受到海洋环境侵蚀和地
随着社会不断发展,船舶现代化、信息化程度不断提高,舰船内的电磁辐射越来越严重,电磁环境越来越恶化,已经影响到了船舶电推系统和雷达等通信系统的正常运行。所以对船舶电推系统进行电磁兼容测试提出了新的要求。而且各类大型设备因为体积原因不能进入传统测试平台进行电磁兼容测试。数字电波暗室技术提供了解决这个问题的有效途径。信号处理算法研究是构建数字电波暗室的核心,针对船舶综合电力推进系统电磁辐射信号的多通道、
一直以来,利用子群和商群来刻画有限群的结构是一个热门课题.其中研究正规子群的性质来讨论有限群的结构是群论研究中一个非常重要的方面,在这方面已经取得了许多丰富和重要的结果.这里我们讨论其对偶问题,也就是非正规子群的性质对有限群结构的影响.基于非正规子群的共轭类类数为4,5的有限群的结构,运用局部分析的方法,给出恰含10个非正规子群的有限群的完全分类.为恰有2p个非正规子群的有限群的研究开拓了思路.全
孩童时期,我们便知道人类的性别划分为男性与女性。依据性别的这种分类,我们受到严谨的教导:如何装扮、如何谈吐以及如何行事。然而,在现阶段越来越多的舞蹈作品中对性别的描绘似乎有悖我们日常的认知,大多数人对于性别的理解远远超出身份证上所显示的对于男性或女性的认知,但同时又如此模糊。在牛顿发现万有引力之前,苹果也是从树上落下,只是当时还不存在一种可以解释这一现象的机制。同样,在性别操演理论出现之前,性别曾
近年来,随着互联网和信息技术的发展,云计算受到了工业界和学术界的广泛关注。云平台规模的扩大,一方面,给用户带来了计算能力更强的云服务,另一方面,加剧了云平台日益突出的