纵向二分类资料缺失数据处理方法的研究与应用

来源 :中国人民解放军海军军医大学 | 被引量 : 1次 | 上传用户:luming123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究背景:在生物医学及社会学等各种领域,纵向研究是探索与解释某事物发展过程的一种十分常见的研究方法。由于纵向研究是在一段时间内对研究对象进行重复地调查,因此可以观察到研究对象在时间轴上所产生的变化。然而纵向研究经常遇到研究对象脱落、缺乏随访等现象,因此不可避免地遇到缺失数据问题。常见的用于处理缺失数据的方法有完整病例分析法、末次观测值结转法,这些方法的优势是简单易实施,然而这些方法都要求严格的完全随机缺失假设。在实际情况中,完全随机缺失通常很难满足,因此这些方法所得到的结果是有偏的。多重填补是一类十分常见的用于处理缺失数据的方法,能够在随机缺失机制下得到有效的估计。虽然目前已有许多可用于处理纵向二分类资料缺失数据的多重填补方法,但却鲜有研究对这些方法的性质表现进行评估。研究目的:由于常用的纵向二分类资料缺失数据处理方法在缺失机制为随机缺失下得到的估计是有偏的,而多重填补方法在随机缺失下可以得到有效估计,本研究通过广泛的模拟研究来对比常用的纵向二分类资料缺失数据处理方法以及七种多重填补方法的表现,以期为纵向二分类资料缺失数据的处理方法选择提供参考。研究方法:本研究包括模拟研究以及实例应用两部分。研究模拟了缺失机制为随机缺失和完全随机缺失两种情形,同时在每种情形下又根据个体观测间相关系数的大小以及样本量大小分别模拟不同的情境。在每个情境下,利用九种分析方法对单组率、两组间的率差进行估计,从偏倚、标准误、均方误差、检验效能四个方面评价九种分析方法的处理效果。在实例部分,将研究方法应用于一个多中心、随机、双盲、平行组对比两组口服药治疗趾甲真菌病的临床试验,同时采用临界点分析法进行敏感性分析。研究结果:模拟研究结果显示,当缺失机制为随机缺失时,完整病例分析法(Complete case analysis)和末次观测值结转法(Last observation carried forward,LOCF)的估计结果是有偏的,而多重填补方法则可以减小偏倚。在多重填补方法中,基于倾向性评分的多重填补法(Propensity score-based multiple imputation,PS-MI)、应用Logistic回归的单调方法(Monotone method with logistic regression,MONO-L)、应用Logistic回归的全条件指定法(Full conditional specification with logistic regression,FCS-L)、应用自适应取整的马尔科夫链蒙特卡洛法(Markov chain Monte Carlo with adaptive rounding,MCMC-A)控制偏倚相对较好,而应用随机的马尔科夫链蒙特卡洛法(Markov chain Monte Carlo with coin flipping,MCMC-C)、应用判别函数的单调方法(Monotone method with discriminant function,MONOD)、应用判别函数的全条件指定法(Full conditional specification with discriminant function,FCS-D)产生的偏倚相对较大。同时,多重填补方法的标准误也小于完整病例分析法。在多重填补方法中,MCMC-A的标准误最小,尤其是当样本量小的时候。在综合考虑了偏倚和标准误的MSE上,多重填补方法的表现也好于完整病例分析法和LOCF。从检验效能上看,多重填补方法在大部分情境下也好于完整病例分析法,特别是MCMC-A。当缺失机制为MCAR时,LOCF依然产生较大的偏倚,而完整病例分析法的偏倚则较小,多重填补方法相较于完整病例分析法,在控制偏倚上并没有优势,除了PS-MI,其他多重填补方法甚至会加大偏倚,但是多重填补方法能够减小标准误。在综合考虑了偏倚和标准误的均方误差(Mean square error,MSE)上,多重填补方法的表现依然好于完整病例分析法。从检验效能上看,多重填补方法在大部分情境下也好于完整病例分析法,特别是MCMC-A。研究结论:在分析纵向二分类资料缺失数据时,不应该盲目地应用完整病例分析法或末次观测值结转法,这会导致在缺失机制为随机缺失时,产生的结果是有偏的。根据研究结果,更加推荐使用多重填补方法,在缺失机制为随机缺失时,多重填补方法能够减小偏倚,在缺失机制为完全随机缺失时,多重填补方法则可以减小标准误。
其他文献
随着信息技术的进步,信息的安全变得日益重要。在互联网的环境下,很大一部分信息的传输都经过了加密的处理,再由数据的接收方进行脱密得到原始信息,其中加密和脱密的过程属于密码学的研究领域。加脱密算法主要可分为对称密钥和非对称密钥两个大类。它们的区别在于,对称密钥在加密和脱密时所用到的密钥是相同的,而非对称密钥在加密和脱密时需要用到不同的密钥(分别称为公钥和私钥)。目前,主流的对称密钥算法是由美国国家标准
目的观察牛蒡子苷联合银杏叶提取物对糖尿病大鼠视网膜中血管内皮生长因子(VEGF)及血小板源性生长因子-B(PDGF-B)的影响,以探究牛蒡子苷联合银杏叶提取物对糖尿病大鼠视网膜
背景:弓形虫是专性的细胞内寄生原虫,它能够感染几乎所有的温血动物,包括人。许多研究已经证实弓形虫是一种嗜神经的寄生虫。当宿主感染弓形虫后,弓形虫速殖子随血流进入宿主
目的:探究形神理论指导下晚期非小细胞肺癌(NSCLC)中医综合疗效标准的可行性及有效性。资料与方法:采用回顾性分析病例研究方法,选取2018年1至2019年10月于辽宁中医药大学附
克尔凯郭尔(1813-1855)是丹麦著名哲学家、神学家,他的整个思想深受其宗教神学背景的影响,具有浓厚的基督教色彩。正因如此,他重视基督教的永恒精神性,而提出与其相对的感官
目的:通过体外实验和体内实验两个方面研究不同剂量桂郁金多糖的抗凝血作用及机制,为桂郁金的临床研究提供科学依据。方法:(1)桂郁金多糖对H2O2致人脐静脉内皮细胞(HUVECs)损
近年来,国内外的科研工作者在HgCdTe探测技术与激光辐照效应方面进行了大量的工作。超短超快脉冲激光的发展给HgCdTe探测器辐照效应的研究带来了机遇。本课题主要研究在短脉
电重构波导阵列是指在波导阵列上施加不同偏置电压,改变其中光的传输特性。作为片上光学系统中的可电控光互连器件,电重构波导阵列具有广阔的应用前景。本文主要提出了一个电
量子偶是一类非常重要的Hopf代数,这个概念是由Drinfeld在研究量子Yang-Baxter方程时提出的,随后便引起了代数研究者们的关注,极大地推动了 Hopf代数及其表示理论的发展.作为
幼儿健康教育是终身健康教育的基础阶段,幼儿时期的身心健康不仅能提高儿童的生命质量,而且为一生的健康和生活奠定了基础。学前儿童健康教育将为学前儿童一生的健康和生活奠
会议