基于复杂数据的两类统计模型的研究

来源 :陕西师范大学 | 被引量 : 2次 | 上传用户:jjq769015
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
部分线性模型是一类具有较强实际背景的半参数模型,由Engle等在1986年首次提出,之后有大量研究与众多应用.而广义线性模型理论是对线性模型经典理论的重要推广,可以用来分析实际问题中遇到的各种不同类型的数据.它在应用问题的研究中,特别是在社会、经济以及生物和医学数据的统计分析中,有重要的理论和实际意义.另外,在实际应用中常常遇到诸如缺失数据、测量误差数据以及相依数据等类型的复杂数据.关于复杂数据的统计分析已成为当前统计研究的前沿与热点问题之一因此,研究基于复杂数据的部分线性模型和广义线性模型中的统计推断有一定的理论意义和实用价值.经验似然(EL)方法是由美国斯坦福大学教授Owen于1988年提出的一种非参数统计推断方法.这一方法与经典的正态逼近或现代的Bootstrap等方法比较,在构造置信域方面有很多突出的优点,例如,无需估计渐近方差、置信域形状由数据自行决定、Bartlett纠偏性以及域保持性等.EL方法的出现开辟了统计推断方法的新篇章,引起了许多研究者的关注和兴趣,他们将该方法应用到处理各种数据下的统计建模及各种应用领域.本文将经验似然方法应用到复杂数据下部分线性模型和广义线性模型中的估计问题中,推广了经验似然方法的应用领域.本文主要在相依数据、测量误差数据以及缺失数据等复杂数据下,研究了部分线性模型和广义线性模型中的统计推断问题.首先,讨论了相依序列下的部分线性回归模型,得到了参数和非参数M估计的渐近性质,推广和改进了已有结果.其次,研究了全部协变量都有测量误差时的部分线性回归模型,考虑了未知参数的经验似然推断问题.最后,将经验似然方法应用于广义线性模型,包括固定和自适应设计下未知参数的经验似然推断,以及数据有缺失时未知参数拟似然估计和经验似然问题.论文共分为五章,主要内容如下:第一章首先介绍了本文研究的主要内容,研究的意义和现状;接着对所研究的两个模型的相关知识和理论进行了回顾,并详细讨论了本文所研究的复杂数据类型和用到的主要研究方法;最后列出了本文的主要工作.第二章主要研究具有随机适应误差的部分线性模型中M估计的渐近统计性质,通过逐段多项式方法和稳健估计方法,得到了参数的M估计和非参数函数的稳健M估计.利用鞅差序列中的不等式和极限定理,我们证明了参数M估计的渐近正态性和非参数函数M估计的最优收敛速度.最后利用数据模拟和实例分析说明了所提方法的稳健性.第三章主要讨论数据有测量误差时,部分线性模型中的经验似然问题.在所有协变量都含有测量误差的情形下,我们利用逆卷积方法处理非参数部分有测量误差以及利用偏差校正方法处理参数部分有测量误差,得到了改进的辅助随机向量,并利用经验似然方法构造了对数经验似然比统计量.证明了所提统计量在参数真值处收敛于标准卡方分布.同时,我们讨论了参数的极大经验似然估计和广义最小二乘估计,得到了它们的渐近分布.通过数据模拟和实例说明了所提方法的有限样本性质.第四章主要探讨固定和自适应设计下广义线性模型的经验似然问题.在响应变量为多维以及设计矩阵分别是固定设计和自适应设计情形下,利用经验似然方法,得到了未知参数的对数经验似然比统计量,并证明了该统计量收敛于标准卡方分布,从而可以构造参数的经验似然置信域.另外,讨论了参数的极大经验似然估计及其渐近正态性.最后利用数据模拟解释了我们提出的方法.第五章主要研究缺失数据下,广义线性模型中拟似然估计的渐近性质和经验似然推断问题.首先在响应变量随机缺失下,从自然联系拟似然方程出发,得到了未知参数的拟似然估计并证明了该估计的强相合性和收敛速度.然后利用经验似然方法,在响应变量随机缺失下,构造了未知参数的经验似然置信域,并在三种缺失比率下利用模拟研究说明了所提方法的有效性.
其他文献
健康的社会交往和稳定的社会联系能力的减弱是许多精神疾病如抑郁症,成瘾,精神分裂症和自闭症等普遍的症状之一。理解正常社会联系发育、形成的神经生物机制和遗传机制对理解上述这些精神疾病非常重要,也可为药理干预和治疗这些疾病提供可能的靶标。社会联系在生命活动中普遍存在,它可以影响社会、心理、生理和行为机能。关于社会联系的发育形成机制目前还不清楚,但是社会联系涉及一系列复杂的过程,包括通过感觉发现同伴、识别
近年来,复杂网络引起了科学家的广泛关注,已经成为包括数学、力学、物理学、计算机、生命科学、管理科学、系统科学、社会学、金融和经济学等许多科学领域的研究热点。复杂网络上的动力学或物理状态的演化是一个重要研究领域,而复杂网络上自旋系统的相变行为研究是一个具有重要意义的方向。如果给复杂网络的节点赋予某种自旋状态,给连边赋予某种耦合或相互作用就可以建立复杂网络上的自旋系统,这类自旋模型可以用于刻画诸如复杂
本文主要研究解析数论和Diophantine方程中占有重要地位的经典问题,特别是著名的Gauss和的均值估计,D.H.Lehmer问题,椭圆曲线整数点问题,指数Diophantine方程组以及其它各类Diophantine方程的可解性等特殊情形.即利用解析方法研究了一个特殊的Gauss和的均值估计,并讨论了两类椭圆曲线的整数点问题,一类指数Diophantine方程组以及三类Diophantine
产生于上世纪80年代的Quantale理论是理论计算机科学的数学基础之一,与拓扑、代数、逻辑等学科有着密切的联系.作为Quantale理论的一个相关结构,m-半格把V-半格的结构和半群的乘法运算结合起来,从而剩余格、]Erame.Qua-ntale和格序半群等都是特殊的m-半格.m-半格在Quantale理论的研究中有着重要的作用,因为每一个凝聚式Quantale都同构于某个含最大元的m-半格的V
模糊图是经典图的模糊化,也可以视为一种广义的赋权图.本博士论文主要研究了模糊软图和区间值模糊图的运算性质以及图格的有关图论方面的性质.具体内容如下:第一章,介绍了模糊图、区间数、模糊软集以及格论中的一些概念.第二章,定义了模糊图的割点、割边及块的概念并讨论了它们的相关性质,包括点和边分别成为模糊图的割点和割边的充要条件、阶至少为3的模糊图成为块的充要条件、模糊圈成为块的充要条件、模糊图中两顶点间距
量子绝热定理是量子理论中的一个定律,它揭示了具有含时哈密尔顿算符的量子系统的演化规律,同时也提供了求解薛定谔方程的近似解的一种重要方法.近年来,量子绝热定理的自洽性受到了许多学者的关注.量子态的纠缠或可分性反映了量子态的本质特性,量子纠缠被认为是量子信息处理的重要资源.本文利用算子理论和矩阵分析理论,系统研究了量子绝热演化理论与可分态的动力学性质,给出了经典的绝热定理和绝热逼近误差,提出了广义量子
赋值代数是一种与局部计算密切相关、用于描述信息处理方式的代数结构模型.赋值代数的实例涵盖了关系数据库、约束系统、信任函数、贝叶斯网、命题逻辑等多个领域.而在这些诸多实例中,由半环诱导的赋值代数扮演着重要的角色.本文主要对全序半环、约束半环诱导的赋值代数的解、解的结构及其算法等问题进行了研究;并且讨论了信息代数与信息系统之间的关系,得到信息系统与信息代数在相互诱导时连续性与紧性的较为完整的相互对应关
数学生态学是用数学方法来定量研究生态系统变化过程的一门学科.非线性分析和非线性偏微分方程理论(特别是反应扩散方程理论)的发展,以及计算机模拟仿真技术的介入,使得生态模型的定量/定性研究进入到一个新的阶段,也取得了越来越多有实际应用价值的成果.本文利用非线性理论和反应扩散方程理论来研究几类生态模型在不同边界(Dirichlet、Neumann、Robin)条件下的动力学行为.研究内容主要包括平衡态正
在自然界和人类社会中广泛存在着大量的复杂系统都可以通过复杂网络来加以描述,如因特网、信息网、交通网络、电力网络和社会网络等.随着现实网络规模的日益扩大和连接的日益复杂,用一般的网络拓扑结构和理论有时并不能全面刻画真实网络的特性,超网络随之应运而生,它为研究超大规模的网络系统提供了崭新的视角.在超网络的相关研究中,超网络重要测度的研究是最基本也是最重要的一个方面.本文以Estrada指标和谱半径作为
青藏高原被誉为“世界屋脊”和“地球第三极”,其与毗邻地区一起构成全球物种多样性中心之一。该地区植物种类丰富,特有植物物种比例高,一直是物种界定、物种进化和生物多样性研究的热点地区之一。固沙草属Orinus Hitchcock(禾本科Poaceae)是青藏高原及其邻近地区的一个高山特有属,是在该地区极端沙地环境下生长的关键或唯一类群,作为野生牧草和适应极端环境植物资源,具有重要的生态价值。自该属确立