论文部分内容阅读
目的:中医药临床试验研究通常涉及到受试对象、施加因素、试验效应三个环节,对其研究质量的影响较多,在研究过程中由于多种原因也不可避免的都会出现一些试验数据缺失值,这些缺失的数据可能导致在研究结果评价分析过程中产生偏倚,从而降低和影响研究结论的准确性,甚至可能由于偏倚而得出错误的结论。本文通过对临床试验研究中有关缺失数据进行分析,并总结缺失数据对临床研究分析结果解释的影响,进而比较不同处理缺失值方法的优缺点,从而在临床研究中选取适当的分析方法,以提高临床研究结论评价的准确性。方法:本文将论述缺失数据的相关概念及数据缺失的类型,分析缺失数据对临床研究结果的影响。首先模拟一组完整的临床试验研究数据,并对该数据进行统计分析,同时在模拟的完整数据集上构造不同缺失率的数据集,分别采用直接删除法、均值填补法、末次观测值结转法(LOCF)、期望值最大化法(EM算法)及多重填补法对缺失数据集进行统计处理,对数据进行评估和填补,并比较数据填补前后的差异及分析结果的稳定性。结果:在模拟的数据中,通过在不同缺失率的条件下,比较不同的缺失值处理方法的优缺点,结果显示:缺失率在10%以下时,上述几种处理分析方法的稳定性都较好;当缺失率在30%以上时,直接删除法和均值填补法的效果比较差,其缺点显而易见,末次观测值结转法在本次研究中表现相对较好,填补后的数据稳定性较高,而EM算法在本次的分析中效果一般,值得一提的就是多重填补法的效果相对其他几种的填补方法更为稳定。在此基础上,本文再通过一组中药临床试验的数据进行分析,并采用了以上几种填补方法来统计该临床数据,并分析其统计结果的差异性,由于该临床试验数据的病例脱落比例不是很高,故几种处理方法的分析结论都比较接近。结论:在对模拟数据集的分析中,通过上述几种分析方法对缺失值的处理中发现,对模拟数据中不同缺失率的数据集填补时,相对而言,多重填补方法比其他的处理方法效果要好,对数据集的统计更加接近完整数据的统计分析结果,体现了多重填补在较高缺失率的数据中的优势。同时,无可否认,在低缺失率的数据中,直接删除法和均值填补法对统计结果的稳定性也相对较好,而且在实际应用中有时也会考虑直接删除法和均值填补法运用起来相对简单可行;总体而言,当缺失率都较高时,各种填补方法对数据分析结果的稳定性都变差,甚至由于偏倚而导致对原数据处理结果的扭曲。因此,在对临床试验研究数据的统计分析中,应多考虑运用比较稳定的多重填补方法,以减少偏倚性结论的发生。当然,为谨慎起见,在中医药临床研究统计中最好同时运用两种或多种缺失数据的处理方法进行分析、比较,以减少偏倚对临床研究结论产生的影响。