多重填补方法估计存在不依从与缺失值的随机对照试验的因果效应

来源 :复旦大学 | 被引量 : 2次 | 上传用户:lcy38
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
因果效应估计的困难在于反事实效应的存在使得估计个体的因果效应值成为不可能的事情。随机干预试验是进行因果效应估计的唯一金标准,能够突破反事实效应进行因果效应估计的坚实保证是随机化。理想的随机化认为,随机被分配到试验组与对照组的个体是均衡可比的,实质上就是对照组的个体与试验组的个体除了处理不同之外完全相同。在随机化的保证下,因果效应的估计成为可能。而实际研究过程中往往很难做到完美的随机化,不依从的出现严重的破坏了随机化。由于不依从出现的背景是比较复杂的,不会仅仅是研究样本的随机样本,总会和某些因素存在着关联,致使干预试验研究的因果效应估计值出现较大的偏倚,甚至给出错误的估计。因此不依从数据的因果效应估计方法的研究是非常有必要的。目前不依从数据的因果效应估计方法很多,本文针对连续型变量,非交叉设计的干预试验研究进行因果效应估计。本研究将处理缺失值的思想应用于不依从数据的因果效应估计中。应用比较成熟的缺失数据处理方法:多重填补方法,将不依从数据看做是缺失值进行多重填补。首先通过意向性分析(ITT, Inte ntio n-to-treat)估计填补完成之后的多个完整数据集的因果效应值,再应用Rubin (1987)规则将多个ITT估计值进行合并获得最终的估计值。多重填补过程选用SAS9.2软件中的MI过程完成,通过模拟实验比较研究多重填补ITT估计(MIITT)与另外四种现存的估计方法:实际治疗分析(AT, As-treated)、符合方案集(PP,Per-protocol)、ITT估计以及工具变量估计(Ⅳ, Instrumental Variable Estimate)。模拟实验研究通过计算估计值的以下四个指标对各个估计方法的准确性与可靠性进行评价:偏倚(Bias),均方根误差(RMSE, Root Mean Square Error)以及95%置信区间覆盖率以及95%置信区间的平均长度。并通过风华中学心理抗逆力干预试验研究数据评价估计方法的实用性效果。模拟研究结果显示,样本量与不依从率是影响估计准确性的两个重要因素,小样本时各个估计值的均方根误差都比较大,并且各个估计值之间的差别比较大;随着样本量的增加,各估计值的均方根误差有降低的趋势,而且估计值之间的差别也有减小的趋势。不依从率的增加使估计值的均方根误差有增加的趋势。另外,这两者之间存在着交互效应。样本量的增加可以抵消一部分由于不依从率增加带来的均方根误差的增加,样本量较大的时候,各估计方法之间的均方根误差差别不大。MIITT估计的95%置信区间的覆盖率总是能够保持在95%左右,PP、AT估计的95%置信区间的覆盖率也能够保持在95%左右,ITT估计的波动性比较大。95%置信区间的平均长度会随着样本量的增加显著的变窄,随着不依从率的增加又适当的变宽。该研究结果提示我们在进行试验设计的时候,可以通过适当的调整样本量来抵御不依从以及缺失带来的偏倚,但是要协调好样本量与成本效益之间的关系。完全随机缺失机制与不依从数据混合存在的情况下,模拟结果基本与无缺失仅有不依从数据的情况下一致,没有太大的改变。随机型缺失机制下,按照缺失数据的生成机制分成了两类进行模拟研究,MIITT估计准确性比较好的情况是缺失相关变量Xm与其余研究变量没有关联的情况,该情况下各个估计之间的差别变得比较明显。缺失率增加,各个方法估计的RMSE以及偏倚都会增加。另一种是缺失相关变量为基线测量X,这种情况下MIITT估计效果并不是最好的,与AT以及PP估计的均方根误差相差不大。当干预效应增加为1的时候,IV与ITT古计的RMSE在依从率比较大的时候是最大的,MIITT估计次之,PP与AT最小。当干预效应增加为3的时候,AT、PP以及MIITT估计的RMSE非常接近。估计值的95%置信区间的覆盖率与不依从率以及样本量的变化关系不明显。MIITT估计的覆盖率始终位于95%左右,但是缺失相关变量为基线测量与相关变量为Xm相比,前者的95%置信区间的覆盖率更逼近于95%。缺失率的增加会使得区间的长度增宽,并且相关变量为Xm时,区间长度更宽。AT与PP估计的置信区间随着不依从率等影响因素的变化比较明显,而MIITT估计的变化比较微小。总之,MIITT估计相对于其他四种比较方法而言,是一种比较准确、可靠的估计方法,尤其是在有缺失值存在的情况下。在只有不依从数据存在或者缺失机制为完全随机缺失的情况下,MIITT估计与PP、AT方法基本差不多,与IV以及ITT估计相比,差别比较大,但是MIITT估计的误差估计比其他的估计方法更加真实,准确稳定。当缺失机制为随机型缺失时,MIITT估计在样本量小的时候仍然表现良好,与其他的估计方法比较RMSE与偏倚都是比较小的,当样本量增加时,这种优势会有所下降,但是依然优于其他方法。而且随着不依从率以及缺失率的改变,MIITT估计的置信区间覆盖率以及置信区间的平均长度都不会有太大的改变。
其他文献
菲啶是一种广泛存在于天然生物碱中的结构单元,尤其是6-三氟甲基菲啶衍生物因其含有三氟甲基而具有特殊的理化性质,被广泛应用于功能材料、生物、药物等领域。因此,6-三氟甲基菲啶衍生物的合成受到了有机合成工作者的持续关注。光能作为一种清洁能源,已被证实可以用于光致有机转化,且可以让这一过程变得更加简单、环境友好。基于上述考虑,发展光促进的6-三氟甲基菲啶衍生物的合成方法具有重要意义。本文在查阅大量文献及
<正>2011年4月11日,国务院南水北调工程建设委员会办公室鄂竟平主任一行考察了中线天津干线保定市1段工程施工现场。河北省南水北调工程建设委员会办公室、投资计划司、建设
期刊
大型输水渠道水力响应过程的特征参数,如渠道水位降落速率和水位波动距离等,对渠道的调度运行方式的制定有着十分重要的作用。利用南水北调中线工程电子渠道平台,对中线工程总干
<正>随着科技的日新月异,互联网成为我们生活的一部分,网络时代的用户更加趋向个性的彰显和多元的选择,用户在享受互联网便捷的同时,更希望得到身心的愉悦。网络世界既是现实
采煤机是一个复杂的机电液一体化机械系统,采煤机零件的负载特性比较复杂,对这些零件的设计和分析是采煤机研发的重要环节。目前我国采煤机设计方法较为传统,设计过程智能化
水银行足促进地表水、地下水和其它形式水的合法转让和交易的一种形式,并引起广泛天注。加利福尼业州政府倡导建立的、著名的加州水银行,通过临时水权转让成功地应对了1991、19
南水北调工程的实施将缓解河北省长期缺水的严重局面,对其生态环境产生显著影响。该文从社会经济、气候环境、水环境、土壤、地质环境以及水生生物等多个层面分析了南水北调工
若将所有人类以及人类的行为看作一个系统,宇宙形成一个整体大生态,那么宇宙中除了人类以外的所有事物都属于外生态。包括天道、自然环境、时代变迁等。系统建构系列文章将财
本研究总结凉血活血汤治疗进行期银屑病211例,取得总显效率86.73%,总有效率97.63%的满意疗效.本项目通过活血化瘀指标及微循环检测,用现代免疫学和细胞生物学的方法,证明了本
本研究根据学生的实际阅读能力,把快速阅读融入课堂教学,按照语义单元训练——计时阅读训练——变速阅读训练三个梯度指导学生进行快速阅读训练。最终帮助学生实现由量变到质