一类零过度数据的建模及诊断分析

来源 :东南大学 | 被引量 : 0次 | 上传用户:ljc20090204
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在公共卫生、生物医学、经济、道路安全、制造业和农业等众多的领域中存在着大量的计数数据(count data),为了分析这类数据,常常借助于经典的离散广义线性模型.然而,实际问题中计数数据里往往会含有大量超过标准模型能够预测的零,称之为零过度(zero inflation,记为ZI),此时,标准离散分布将可能不再适合分析它们.取而代之,ZI离散模型成为分析零过度数据的有效方法,受到越来越广泛的重视,并且在理论和应用上都有十分重要的意义.本文系统地研究了零过度偏差泊松回归模型和相应混合效应模型的统计诊断问题.   第二章致力于研究零过度偏差泊松回归模型的统计诊断.首先基于普通似然和EM算法下完全数据似然研究了模型的参数估计;其次基于数据删除方法和局部影响分析方法研究了影响诊断问题,得到了参数估计的一步近似、广义Cook距离、似然距离、WK统计量以及各种扰动情形下的影响曲率;然后研究了ZI参数和非退化部分散度参数的显著性检验,并基于参数化方法探讨了它们的齐性检验,得到了Score检验统计量;最后基于ZI广义泊松(ZIGP)和ZI双泊松(ZIDP)回归模型分别通过随机模拟和实例说明了统计量的有效性.   纵向数据分析是当前统计学的热点课题之一,主要用于探索各组受试单元在不同时间或空间上的重复观测数据的统计性质,这时,组内与组间相比,组内常是相关的.第三章系统地研究了零过度偏差泊松混合效应模型的参数估计和统计诊断问题.首先基于最佳线性无偏预测(BLUP)型对数似然和约束极大似然估计(REML)方法研究了参数估计,并同时给出了参数估计的EM算法;其次基于BLUP型对数似然研究了模型的数据删除度量和局部影响度量问题,得到了参数估计的一步近似、广义Cook距离、似然距离、WK统计量以及各种扰动情形下的影响曲率;然后基于BLUP型对数似然研究了回归系数和非退化部分散度参数的显著性检验,并利用参数化方法探讨了散度参数的齐性检验,得到了多个检验统计量;最后基于Laplace近似方法研究了方差成分检验,得到了梯度检验统计量.本章还通过实例和随机模拟方法结合ZIGP混合效应模型说明了检验方法的有效性.   统计推断一般都是基于数据和假定的概率模型进行的,且推断的有效性依赖于模型的正确程度.然而,在多数场合,它们是否正确我们不能完全确信.若模型被误判则可能导致参数估计和协方差阵估计的不相合.第四章研究了零过度偏差泊松模型均值函数的误判检验问题.首先基于累加残差研究了零过度模型中退化部分和非退化部分的协变量函数形式以及联系函数的误判检验,得到了相应的检验统计量并研究了它们的渐近性;其次采用相同方法探讨了零过度混合效应模型中协变量函数形式以及联系函数的误判检验,并得到了相应的检验统计量;最后通过实例和随机模拟方法结合ZIGP模型说明了检验统计量的有效性.   另外,Bayes统计是统计学发展最快的分支之一.在Bayes统计中,一般假定参数为随机变量且服从某先验分布,然后利用参数和样本的联合分布得到参数的后验分布,并在此基础上进行Bayes统计推断.第五章探讨了零过度偏差泊松回归模型和相应混合效应模型的Bayes统计分析.首先利用马尔可夫链蒙特卡罗方法中Gibbs抽样并结合Metropolis-Hastings(MH)算法研究了模型的Bayes估计;其次基于Kullback-Leibler(K-L)距离研究了关于联合后验分布和边际后验分布的Bayes数据删除影响诊断问题,得到了相关的诊断统计量;最后通过随机模拟和实例说明了本章估计方法和诊断统计量是有效的.   综上所述,本文比较深入系统地研究了零过度偏差泊松回归模型和基于重复测量数据的混合效应模型的参数估计、统计诊断以及模型误判检验等问题,并得到了一系列新的诊断统计量.大量的数值实例和随机模拟结果表明,这些统计量都是很有效的.
其他文献
当今世界信息化发展十分迅速,在二十一世纪,一个国家的教育事业,决定了民族的未来。因为祖国的明天,永远掌握在下一代的手n中。教育的重要性毋庸置疑,在我国现代教育的实际发展中,
学位
结核病感染了大约世界上三分之一的人口,平均每年全世界有大约300多万人因结核病去世。流动人群是结核病全球传播的主要原因之一。本文采用了建立数学模型的方法来研究流动人
本文主要研究以下具临界增长的非线性p-Kirchhoff型方程{-(a+b∫RN|▽u|p dx)Δpu=|u|p*-2u+μf(x)|u|q-2u,x∈RN,(0.1)u∈D1,p(RN)的非平凡解的存在性,其中a≥0,b>0,1<p<N,1<q<p,p*=Np/N-
2014年10月26日—29日,题为“用诗的语言绘画”的全国政协委员韩必省书画作品展在全国政协礼堂举办。共展出韩必省创作的写意山水、人物、工笔动物、花鸟、诗词、书法等作品
在复数域和体上,由于方阵的Drazin逆总是存在的,所以对于矩阵的Drazin逆,我们主要是研究其表示.在一般的代数结构上,矩阵的Drazin逆不一定存在,故研究其存在性非常具有价值,
自古以来,一些伟大的数学家一直都乐衷于对数论的研究,同时数论也是当今数学的主流之一.初等数论是数论中最古老、最基础的分支之一.随着数学竞赛活动的不断展开,逐渐形成了
唐山沟矿上仓带式输送机是由大同煤矿集团公司设计研究院进行总图设计,其零部件均选用了国家电力标准,生产厂大同煤矿集团公司中央机厂没有标准图纸。由于土建基础部分已经完
近年来,从我国大学生的思想政治来看,其教育的结果根本达不到理想的标准,分析目前我国思想政治教育的存在因素,还是因为目前n对大学生的教育模式没有引起学生们的重视。如果想改
我国当前的高职教育人才培养模式下,教育目标有明显的职业技能性和技艺性.学生人才培养,与市场、职业、技术等条件的形成有密切的联系.因此,高职院校所培养的人才要得到社会