重尾过程下广义混合效应模型的统计分析

来源 :南京信息工程大学 | 被引量 : 0次 | 上传用户:po54321s
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对于离散型数据的分析,本文提出了基于Student-t(T)过程下的广义混合效应模型,对于纵向离散型数据之间的相关性由潜在T过程来刻画,该模型为建立非线性随机效应提供了新的框架,T过程的重尾实现了可靠的推断并且该过程的协方差内核可以自适应的捕获变量上的特征。本文基于蒙特卡洛EM(MCEM)算法得到了有效的估计结果,并通过条件推断提出了一种预测方法。数值研究表明,与高斯模型相比,该方法对异常值具有鲁棒性。最后,本文用肾性贫血数据以及交通流数据为例做实例分析。该硕士论文的主要研究如下:第一章主要描述了本文研究的关于离散型数据的研究背景、研究现象以及主要工作,说明了本文的创新点,初步介绍了传统的广义混合效应模型以及本文涉及的主要推断方法。第二章介绍了本文重点研究的T分布的结构,证明了T分布的条件分布仍是T分布这一重要性质,对于一些数据的研究特性进一步给出了截断T分布及其相关期望的求解,为后面离散型数据的统计分析提供了理论基础,最后给出了本文重点研究的T过程下广义混合效应模型。第三章主要针对二元数据,构建了基于T过程下的广义混合效应模型,通过引入新的潜变量来更好的解释二元数据在实际生活中的意义。该模型的构建是基于传统的高斯过程模型再结合相关的正态尺度混合分布,然后对模型中的相关变量做出分布假设,推导中在EM算法的基础上进一步改进,运用MCEM算法进行统计推断,避免了复杂期望的求解。然后在模拟研究中,首先对模型中的参数进行了估计,研究主要针对的数据类型是有异常值和数据来自高斯过程这两种情形,比较了本章提出的模型与高斯过程模型下估计的结果以及相关变量的预测效果,实验表明本章提出的模型具有较好的稳健性。最后用肾性贫血数据做实例分析,同样运用本章提出的模型得到了较好分析结果,具有很好的实际意义。第四章主要针对的是计数数据,同样构建了基于T过程下的广义混合效应模型,在模型的推导中我们和上一章相同都是基于EM算法下进行相关的理论推导,推导过程中由于条件分布的复杂性,积分求解相对较困难,由此本章结合了MCEM算法以及Metropolis-Hastings(MH)抽样算法来进行统计推断。同样通过模拟分析证实了本章所提出的模型的可行性和推断结果的有效性,最后,本章将该模型运用至交通流数据中,得到了较为可靠的研究结果。第五章对整篇文章的模型、研究方法、结论以及现实意义做出一系列的总结,并且对今后关于离散数据的研究进行了展望。
其他文献
丙烯作为地位仅次于乙烯的轻质烯烃,附加值高,其下游衍生物的需求量也呈逐年递增的趋势。为了补充蒸汽裂解生产丙烯的缺口,各种专产丙烯的技术受到越来越多的关注。其中烯烃
现阶段,世界范围内均存在着能源匮乏、环境污染等问题,越来越多的国家开始选择低碳发展道路,努力推进可再生能源的发展。其中风电便是极具代表性的一种。风电资源相对而言极为丰富,并且风电设施的建立相对较为简便、灵活。与其他能源类型相比较而言,风力发电是发展较为成熟的一种利用可再生资源的发电技术,拥有更高的发电效率,能够在获得足够电力资源的同时,避免对地球环境的污染与破坏。随着时间推移,我国在风电装机方面,
本研究对采自海南与云南不同市县的橡胶树与相思树上的病原灵芝菌进行了分离和种类鉴定,并对引起橡胶树红根病的病原灵芝菌进行了致病性测定,对引起相思树红根病的病原灵芝菌
我国环境公益诉讼诉前程序逐渐完善,有效节约了司法资源,提高环境问题的处理效率。诉前程序制度是在实践中不断总结经验并进行优化的结果,2012年第二次修订《民事诉讼法》,环
广西扶绥喀斯特地区的黑叶猴(Trachypithecus francoisi)和白头叶猴(T.leucocephalus)属我国珍稀濒危灵长类动物,两者呈隔江相望的分布格局。它们的生理结构相似,食物组成部
研究背景:氧化应激是造成血管内皮细胞生理功能损伤,进而引起高血压、动脉粥样硬化等血管疾病的主要因素之一。心血管疾病中调控氧化应激的相关病理生理机制尚不明确。FAT10作为类泛素家族中的一员,目前发现在自噬、凋亡、炎症、肿瘤等方面均有重要作用。氧化应激的重要参与者线粒体活性氧(mtROS)主要由线粒体呼吸链复合物I、III生成。FAT10对mtROS的具体调节机制尚未见报道,有待进一步研究。研究目的
在哺乳动物中,DNA甲基化(DNA methylation)主要发生在胞嘧啶和鸟嘌呤二核苷酸(CpG)上,它作为真核生物调控基因表达的主要方式之一,在基因转录调控、遗传物质稳定、基因组印记
2018年8月31日《中华人民共和国土壤污染防治法》颁布,对我国土壤污染防治基金制度的建立提出了明确要求。我国因历史原因遗留的土壤污染问题十分严重,而土壤污染防治工作实
最经典的参数估计方法是最小二乘法(OLS),但是OLS对于异常值是非常敏感的.最小一乘(LAD)和分位数回归(QR)方法对于响应变量重尾分布是稳健的,然而LAD具有任意小的相对效.当随
细颗粒物作为室内空气污染源之一,具有粒径小,表面积大,且易附带有毒有害物质等特点,可以通过呼吸进入人体内部,对人身体健康产生极大威胁。研究表明,沉积能有效降低室内颗粒