高维半参数回归模型的统计推断及相关问题研究

来源 :曲阜师范大学 | 被引量 : 0次 | 上传用户:jinr0op3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机能力和科学技术的快速发展,人们获得的数据所包含的信息越来越多,高维数据的统计推断问题研究已经成为十几年来炙手可热的研究热点.在一些实际问题中,除了样本信息之外,通常人们还可以获得有关回归系数的相关信息.利用这些回归系数的信息,很大程度上可以提高估计的效率,进而提高模型的效率.另外,在许多回归问题中,我们需要找出对预测响应变量起重要作用的解释因素,而这些因素通常具有组结构的特点.常见的例子包括:回归中的多水平类别型协变量需要用一组哑变量来表示;非参数回归中,将变量的光滑函数用一组基函数来表示.因此,有关组结构变量的选择方法的研究有着非常重要的理论意义和应用价值.第一章介绍了本文的研究背景和预备知识.作为一个最经典、最简单、最流行的回归分析方法,线性回归分析是研究响应变量和一组协变量之间统计关系的一种至关重要的方法.然而,在实际数据分析中,我们不可能知道真实的模型结构.如果响应变量和协变量之间真实的关系不是线性的,那么用线性模型进行推断则会造成模型设定的偏差,进而导致错误结论的出现.非参数回归模型对模型的假设相对弱很多,可以拟合数据中变量的非线性关系.这类模型的优点在于回归函数的形式相对灵活,能根据数据的特点较好的拟合出变量之间的关系.但当协变量的维数较大时,此类模型会产生维数祸根的问题.半参数回归模型即含有参数部分又含有非参数部分,在保留参数回归模型简单性的同时又具有非参数回归模型灵活性的特点.因此半参数回归模型在实际中具有非常广泛的应用.在部分线性回归模型的框架下,第二章研究了参数部分的维数发散时参数部分回归系数满足某些线性约束条件下的统计推断.对非参数部分的估计我们使用B样条基函数的方法.本文考虑用B样条基函数的方法来估计未知函数,因为此方法在计算上效率是非常高的,估计的精度也比较高.而且B样条基函数方法是一种全局光滑法.因此,系数的估计可以一步实现,而核方法在计算上非常耗时,因为它需要对每个数据点或多个数据点进行重复.理论上,在某些常规条件下给出了约束轮廓最小二乘估计的相合性和渐近正态性.并通过数值模拟来验证估计的有限样本表现.模拟结果说明如果回归参数向量满足某些先验信息,利用这些先验信息得到的约束估计比无约束估计更有效.第三章将第二章的部分线性回归模型推广到部分线性可加回归模型,由于含有多个非参数函数,部分线性可加回归模型具有更广泛的应用.本章考虑了线性部分的参数个数发散且满足某些线性约束条件时的相关统计推断问题.首先,对非参数部分的函数利用B样条基函数进行估计后,给出参数部分的约束轮廓最小二乘估计.在常规条件下建立了约束轮廓最小二乘估计的相合性和渐近正态性.其次,为了检验参数部分的线性约束条件是否成立,我们给出了轮廓似然比检验统计量,并证明了在原假设和备择假设分别成立的条件下轮廓似然比检验统计量的极限分布为卡方分布.最后,利用数值模拟和实例分析验证轮廓最小二乘估计和轮廓似然比检验统计量的样本表现.数值结果说明在各种情况下约束估计的表现比无约束估计的表现好很多,轮廓似然比统计量对备择假设是很敏感的.第四章考虑了参数部分的协变量具有组结构情况的高维部分线性回归模型.我们提出了自适应group bridge方法来实现参数部分的组变量选择问题,同时我们考虑了自适应group bridge方法中参数γ的选择.利用leave-one-observation-out交叉验证方法选择调整参数λ和bridge中的参数γ.通过推导,该方法与标准的交叉验证方法相比可以大大的降低计算量.理论上,我们给出了目标函数的全局最小值点,同时证明了该最小值点的相合性、收敛速度以及渐近正态分布.数值模拟结果说明自适应group bridge方法表现良好,同时通过对工人工资数据的实例分析说明该方法给出的预测误差相比group Lasso和group bridge来说要小.因此,自适应group bridge在组变量选择的问题中是一中非常好的方法.局部线性逼近算法是一个非常有效的算法,用来求解非凹惩罚问题的全局最优解.然而该方法的有效性高度依赖于一个相当好的初始估计.当变量间存在多重共线性问题时,局部线性逼近算法就失效了.本文第五章提出了一个新的局部线性逼近岭算法来解决变量的多重共线性.取岭回归估计作为初始估计,局部线性逼近岭算法在求解估计时稳定并且有效.并且从理论上证明了算法的收敛性以及参数估计的Oracle性质.数值模拟通过多个例子验证局部线性逼近岭算法的有效性.由模拟结果可知,在多重共线性存在的情况下,我们提出的算法表现要远远好于局部线性逼近算法.第六章对全文工作进行了总结,同时给出了下一步将要开展的研究内容.
其他文献
生物物理学是近年来发展迅速的一门交叉学科,它将物理学中的许多原理和方法引入生命科学,以描述从分子生物学到系统生物学的各个层次的生命现象;而生物学中物质结构与功能的揭示也受助于物理学在技术手段上的进步.因此,生物物理学有着极为丰富的内涵.本文以不同的计算方法为手段,研究了生物物理学中的两个前沿问题:一个是与生物系统中定向输运与力的产生紧密相关的布朗马达定向运动问题,另一个则是关于如何分析高通量测序数
正系统是指当初始条件非负时,输入、输出和状态变量都被约束为非负的动态系统.这种系统已经被广泛应用于许多实际过程的建模,如经济学、生物学、生态学和通信.由于实际控制系统的性能或多或少会受到未建模动态、参数摄动、外源干扰、测量误差等不确定性的影响,因此控制系统鲁棒性研究在控制理论和技术的发展中始终具有重要的地位.针对非线性控制系统的鲁棒性分析,Sontag等学者提出了输入状态稳定性(Input-to-
非常规超导体的新奇物性及其机制一直是凝聚态物理学与材料研究的前沿问题。在本论文中,利用分子束外延(MBE)、氩离子刻蚀退火(IBA)和低温扫描隧道显微镜/谱(STM/STS)等技术,我们在原子尺度系统研究了β-Bi2Pd拓扑超导体、铋基铜氧化物高温超导体和多种铜氧化物薄膜的制备和超导机理。拓扑超导体是一种新奇的量子态,体态因非平庸配对能隙完全打开,边界态则是无能隙的马约拉纳(Majorana)费米
随着科学技术的快速发展,其在教育领域中的应用也愈加普遍,将教学模式和信息技术进行有效结合,从信息化视角创新教学方式,可以帮助学生构建更完善的知识体系。高中阶段数学课程以培养学生的核心素养为重点,传统的教学模式逐渐落后,无法满足学生的认知需求,所以要引进新的教学技术,寻得更好的教学模式。而信息技术对高中数学教学方式的创新主要体现在以下几个方面。
期刊
伴随网络技术发展和移动终端多样化,学习者得以随时随地获取互联网中的学习资源,泛在学习逐渐成为数字化时代的新学习样态。泛在学习所带来的学习内容和学习方式的鲜明变化冲击着人们对传统学校、校园和教师的概念,渲染出学校教育将在泛在学习冲击下消亡的可能性。但应当明确,学校教育之所以能够在不同时代不同社会中承担主要的教育任务且至今未变,是因为其教育供给始终依据学习者个体需求和社会对劳动者的需求而调整。学校的存
本论文课题为铷85-铷87超冷混合气体的实验平台搭建与高分波Feshbach共振研究。作者作为设计者和第一搭建者介绍了我们实验小组第二套冷原子系统――超冷里德堡原子及铷85-铷87超冷混合物平台,论文内容将涉及到真空系统、激光系统、时序控制系统、微波系统、磁场控制系统、电场控制系统、原位成像系统、离子探测系统等诸多子系统的设计、搭建和组合。我同时将介绍铷85-铷87超冷混合物中Feshbach共振
在国家话语体系内,探索行为体如何用语言来建构国家身份的相关热度正日渐升温。此外,国家身份的建构问题也是国际关系研究中不可或缺的组成部分。近年来,在人文学科研究日益呈现出注重交叉与应用研究的大趋势下,国内外学界特别是国内学者以高度的社会责任感表现出以理论联系实际来解读社会现象及参与社会管理的巨大热情。尤其面对当前复杂的国际情势,对国家身份建构的相关研究不仅仅是国际政治研究领域的热门课题,话语研究领域
随着物联网、区块链、5G、大数据和人工智能技术的快速发展,大规模的智能设备接入物联网中,产生了海量的物联网数据。基于物联网、区块链、密码学等技术,能够对海量数据进行采集、存储、分析及挖掘,加快物联网设备走向智能化进程,提升用户体验。然而,大量的物联网数据由数据持有者独立享有,采用中心化服务器对数据进行管理,形成了数据孤岛。同时,物联网设备资源的有限性,进一步阻碍了数据潜在价值的实现。为了解决物联网
光和原子相互作用是量子光学的主要研究内容。其常用的研究方法包括仅把原子量子化的半经典理论,以及把光场和原子都量子化的全量子理论。光和原子的相互作用表现出很多独特的量子现象,如拉比震荡、相干布居俘获、慢光和里德堡阻塞等。本文研究光场和原子相互作用的过程,我们不仅关注光场的变化,也关注原子的行为。全文主要分为两个部分:一是光场的相干调控及其应用,二是这一过程中由单原子构成的自给式热机。光的相干调控是指
Hopf代数是代数学中的重要分支,不变量是数学研究中重要课题,其中自同构群是一个非常重要的不变量,本学位论文将研究若干类Hopf代数上双积的自同构群.由于确定代数的完全自同构群通常非常困难,本文主要研究满足一定条件的自同构群.鉴于张量范畴研究的迅速发展,将进一步在严格辫子张量范畴中研究扭曲张量双积的Hopf代数自同构.在后续研究中,讨论了相对Hom-Hopf模范畴作成张量范畴的充要条件.本文共五章