带有信息删失的多元区间删失数据的回归分析

来源 :吉林大学 | 被引量 : 0次 | 上传用户:zhangmin6278
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,生存数据广泛出现在生物学、医学、社会学和可靠性工程学等领域.我们经常感兴趣的变量指的是从开始实验到发生感兴趣的事件之间的时间,这也是文中的失效时间,感兴趣的事件常被称为失效事件.但是由于很多原因,失效时间有时无法被精准观测,这也就是删失的失效时间.我们常见的删失数据有左删失,右删失和区间删失.其中,区间删失是指失效时间无法被精准观测,只能知道在某两次观测时间之间,即落在某个时间段中.由此可见,右删失其实是区间删失的特例.如果个体只发生一次感兴趣的失效事件,我们常常称为一元的区间删失数据,也就是最常见的区间删失数据.然而,在现实生活中,经常会有两个相近的人发生同样的事件,或者一个个体身上发生多种感兴趣的失效事件,我们常称这种数据是多元数据.而且如果感兴趣的失效时间不能被准确观测,而是落在某一个观测区间内,我们称为多元区间删失数据.然而,在实验中也可能存在一个治愈亚族,即有些个体会发生我们感兴趣的失效事件,但是还有一小部分免疫,始终不会发生我们感兴趣的失效事件.比如,在艾滋病研究中,血友病患者感染了HIV病毒,但其中只有小部分被确诊患有艾滋病,换句话说,在血友病患者总体中,存在对艾滋病免疫的群体.对于研究治愈率,目前主要有两种方法,分别是混合治愈模型和非混合治愈模型.除此之外,对于大多数现有的方法,它们仅适用于删失是非信息性的或感兴趣的失效时间与删失机制无关的情况.但这种情况不是经常成立的,我们将讨论可能面临带有信息删失的区间删失的情况.信息删失,我们通常是指删失变量或机制与感兴趣的失效时间相关,或带有一些信息失效时间的信息的情况(Huang and Wolfe,2002;Sun,2006;Ma et al.,2015;Wang et al.,2016;Wang et al.,2020).这个研究在感兴趣的疾病事件发生之前可能会出现一些症状,因此患有某些症状的患者可能比预定的就诊次数进行更多的临床就诊,或者在不同的时间而不是预定的时间就诊.我们要强调的是,对于右删失失效时间数据,删失的特征可以是由一个变量衡量,而对于区间删失数据,通常需要使用两个变量来描述删失(Wang et al.,2018;Xu et al.,2019;Zhang et al.,2007).论文的第二章主要讨论了在可加风险模型下带有信息删失的多元区间删失数据的回归分析问题.首先,使用潜变量描述失效时间和观测过程之间的相关性,其次通过估计等式的方法估计感兴趣的未知参数,并证明了估计量的相合性和渐近正态性.除此之外,数值模拟的结果表明所提出的估计方法在有限样本下具有良好的表现.最后,我们将所提出的方法应用于一组有关艾滋病的实际数据中.论文的第三章主要考虑了在半参数转换模型下带有信息删失的多元区间删失数据的回归分析问题.虽然许多学者研究了多元区间删失数据,但是都没有考虑带有信息删失的情况.有时候感兴趣事件的失效时间和删失机制之间是具有相关性的,如果忽略这种相关性,最后可能会得到有偏或者具有误导性的结果.基于此,我们使用脆弱项或者潜变表示失效时间和观测过程之间的相关性,假定感兴趣事件的失效时间服从半参数转换模型,先利用观测过程求出潜变量,再使用EM算法来极大化伪似然函数从而得到参数估计.并且,证明了估计量具有相合性和渐近正态性.数值模拟表明所提出的方法表现良好,在实际数据中也加以佐证.论文的第四章主要在第三章的基础上,研究了带有治愈亚组的信息多元区间删失数据的回归分析问题.我们对于感兴趣事件的失效时间建立了非混合治愈率模型,把失效时间和观测过程之间的相关性用潜变量表示,采用两步法和EM算法估计感兴趣的未知参数.除此之外,证明了估计量具有相合性和渐近正态性,数值模拟体现了所提出的方法在有限样本下具有良好的表现.最后,我们将所提出方法应用到一组老年性黄斑病变的眼类数据中.
其他文献
在深度学习过程中,个体表现的思维水平虽然是动态变化的,但是其思维层次的分类是可观测的。SOLO分类理论是一种以等级描述为特征的质性评价方法,可观察学生学习结果的结构,能应用于对学生的学业评价。深度学习发生时,基于SOLO分类理论界定学习主体的思维层次,有利于教师界定学生的思维水平,进而探索更高效的教学。
期刊
在石油、化工等行业以及人类日常的生产生活中均会产生大量的含油废水,严重危害了人类的生存环境。如何高效分离含油废水,仍然是当今社会所面临的一个重要难题和挑战。受自然界生物表面特殊浸润性研究的启发,研究人员开发了一系列超浸润性材料用于含油废水的处理。其中,液下超双疏性材料在选择性高效分离含油废水方面凸显出较大的优势。由经典的浸润理论可知,在一个油-水-固三相系统中,水中油滴和油中水滴接触角的加和为18
学位
运动控制作为实现自动驾驶的关键技术之一,近年来得到了长足的发展。基于模型预测控制(MPC)的运动控制方法已成为学术界和工业界的主流方案。近年来基于MPC的稳定性控制策略已然成为一个研究热点,而且朝着集成稳定性控制的方向发展。基于MPC的轨迹跟随控制也越来越多地集成了稳定性控制的内容。本文所述的运动控制包含稳定性控制和轨迹跟随控制两方面的内涵。尽管基于模型预测控制的运动控制技术得到长足发展,但是其依
学位
检测海洋中溶解CO2浓度及其碳同位素丰度(δ13CO2),对海洋生态环境监测和海底资源勘探等领域发展具有重要意义,特别是可燃冰资源勘探。可燃冰是一种新型绿色能源,分布广泛且储量巨大,对其精细勘察后合理开采可以解决能源危机。可燃冰主要由CH4的水合物组成,因其外观像冰且遇火即燃而得名。可燃冰以稳定形态存在需要严格的温度和压强条件,随着海水升温和地质运动其形态会裂解,导致可燃冰周围海水溶解的CH4气体
学位
介孔碳材料由于其既具有碳基材料高的化学和热稳定性、易于加工和改性等的优势,同时兼具介孔材料高比表面积、大孔容、特殊的孔道结构、可调的介孔尺寸等特征属性,使其在催化、吸附、气敏和能量转换与存储等领域有着广泛的应用。将氮原子引入碳基体是改善碳骨架本征物理化学性质的有效途径,可以大大提高碳材料的表面润湿性、给电子性、导电性和反应性。然而,到目前为止,氮掺杂介孔碳材料的合成和应用仍然存在着以下问题:(1)
学位
工业生产过程中总会不可避免地产生各种污染物,如废水、废气和固体废弃物等,危害人类健康。重金属是对人体危害最大的水体污染物,通常来自采矿、冶炼、造纸和化工等行业。吸附或离子交换法在处理低浓度重金属阳离子污水时有优异的表现和显著的成本优势。具有HEU拓扑结构的天然斜发沸石有着发达的孔道体系和丰富的阳离子交换位点,对特定重金属阳离子有良好的选择性吸附作用,因此十分适合用于水体重金属离子的吸附脱除。片沸石
学位
由于全球变暖、化石能源价格飙升等原因,人类社会正面临着迫切的调整能源结构和降低能耗需求,以实现碳达峰、碳中和的节能减排目标,因此急需发展高效太阳能电池、光电探测器和发光二极管(LED)等先进半导体光电器件。有机金属卤化物钙钛矿作为新一代半导体材料,因为具有光电性质优异、原料来源广泛、可溶液法加工等诸多优点,成为当前科学研究的热门材料。而钙钛矿单晶材料由于无内部晶界、缺陷密度低等结构特点,导致了载流
学位
傍河地下水开采是一种重要的水资源开发利用方式,在激发河水补给以增大地下水补给资源量的同时,可有效过滤河水中有毒有害物质,提升地下水水质。近年来随着河水富营养化及氮污染的日趋严重,在傍河地下水开采驱动下,与地表水存在密切水力联系的地下水面临着潜在的氮污染风险。而江水入渗过程伴随发生的硝酸盐衰减作用是降低氮污染浓度的有效途径之一。但是目前针对傍河开采驱动下江水入渗带内硝酸盐的衰减过程及其影响因素有待深
学位
重对数律是概率极限理论研究中重要分支之一,是关于强大数定律的精确化.常见的重对数律形式有四种,经典的重对数律(Hartman-Wintner重对数律),Chover型重对数律,Strassen型重对数律(泛函型重对数律),Chung型重对数律.关于这四种形式重对数律的研究一直是众多学者研究的热门,从19世纪中叶以来从未间断过.本文对重对数律进行了进一步研究,首先就一类满足Rosenthal型矩不等
学位
纤维素作为一种可再生资源,在自然界中储量丰富,其内部的高度结晶部分—纤维素纳米晶,可以通过化学或物理研磨手段制取。纤维素纳米晶由于其独特的手性向列结构而被广泛应用于光学防伪、显示器以及机械性能增强等领域。相比于普遍使用的硫酸水解制备纤维素纳米晶的一步法途径,羧基化纤维素纳米晶的制备可以通过二步法实现,使得纳米晶体尺寸、形貌以及表面电荷密度的精确调控成为可能。另外,羧基官能团的可修饰性和化学活性为开
学位