五种定性资料统计分析方法比较研究

被引量 : 6次 | 上传用户:logicwords
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
CMH检验、meta分析、logistic回归模型、对数线性模型、加权卡方检验是分析定性资料的常用方法。很多情况下,它们可以分析同一类型的定性资料。有学者在处理多中心临床试验的资料时,发现用CMH检验分析中心效应,与meta分析的结果不一致;在某疾病的危险因素分析中,对数线性模型与logistic回归分析的结果有差别。如何合理选择统计分析方法,哪种方法分析的结果更加可靠,国内外已经有学者做了一些比较研究工作,如对CMH检验和logistic回归处理结果变量是多值有序变量和多值名义变量三维列联表资料的检验效能比较研究,CMH检验和meta分析处理多中心临床试验q×2×2三维列联表资料异质性检验的检验效能比较研究,研究内容还不够全面,评价指标过于单一。鉴于此,本课题采用Monte Carlo模拟对CMH检验、meta分析、logistic回归模型、对数线性模型和加权卡方检验处理四类高维列联表资料进行比较研究,评价指标包括犯I类错误的概率、检验效能、参数估计值和均方误差。从而帮助人们合理选择统计分析方法,得到更加可靠的结论。由于本课题只研究上述提及的5种处理定性资料统计分析方法的比较问题,虽然在某些场合下还可以运用其他统计分析方法,本课题不作全面论述。本课题的研究内容和结论如下:⑴比较CMH检验、logistic回归模型、对数线性模型和加权卡方检验处理一般的q×2×2列联表资料犯I类错误的概率、检验效能、参数估计值及均方误差。上述四种统计分析方法犯I类错误的概率近乎相同。当不存在空单元时,四种统计分析方法检验效能相同;logistic回归模型、对数线性模型和加权卡方检验受空单元的影响,检验效能下降。当四种方法检验效能都为1时,logistic回归模型参数估计值最高,均方误差最大,对数线性模型次之;当总体参数值较小时,CMH检验logit法参数估计值最接近总体参数值,均方误差最小;当总体参数较大时,加权χ~2检验参数估计值最接近总体参数值,均方误差最小。当模型中包含因素的交互作用时,logistic回归模型和对数线性模型对交互项分析的检验效能相同,参数估计值接近。⑵比较CMH检验、logistic回归模型和对数线性模型处理试验因素和结果变量都是无序变量的高维列联表资料犯I类错误的概率、检验效能、参数估计值及均方误差。上述三种统计分析方法犯I类错误的概率近乎相同。当不存在空单元时,三种统计分析方法检验效能相同;logistic回归模型和对数线性模型受空单元的影响,检验效能下降。CMH检验无法估计模型的参数,当logistic回归模型和对数线性模型检验效能都为1时,logistic回归模型对组间效应估计值偏高,对数线性模型对组间效应估计值更接近总体参数值。当存在因素间的交互效应时,logistic回归模型对交互效应的估计值更接近总体参数值。⑶比较CMH检验和logistic回归模型处理结果变量为多值有序变量的高维列联表资料犯I类错误的概率和检验效能。CMH检验犯I类错误的概率和检验效能都大于logistic回归模型,原因在于用logistic回归模型处理结果变量为多值有序变量的高维列联表资料时,需要对资料是否满足平行线条件进行假设检验,若满足平行线条件,方可进行logistic回归分析。当不考虑平行线假设的检验结果时,二者检验效能相同。⑷比较CMH检验和meta分析处理多中心临床试验q×2×2列联表资料犯I类错误的概率、检验效能和参数估计值及均方误差,并比较Breslow-Day检验和Q检验进行异质性检验犯I类错误的概率和检验效能,以及I~2统计量正确判断异质性的比例,简称正确率。异质性检验的比较结果显示,Breslow-Day检验犯I类错误的概率和检验效能高于Q检验。当中心数较小,检验水准a=0.05时,I2统计量判断异质性的正确率高于Breslow-Day检验和Q检验的检验效能,随着中心数的增大,I2统计量判断异质性的正确率低于二者的检验效能。对试验效应分析的比较结果显示,当总体为固定效应模型时,CMH检验犯I类错误的概率高于meta分析,检验效能低于meta分析,原因在于CMH检验中Breslow-Day检验异质性检验犯I类错误的概率较高。当Breslow-Day检验和Q检验异质性检验都是阴性时,CMH检验和meta分析对试验效应分析的检验效能相同。而当总体为随机效应模型时,CMH检验的结果不可靠,因此未对二者进行比较研究。当总体OR值较小时,CMH检验的logit法、MH法和meta分析三种方法的参数估计值接近总体参数值,均方误差都很小;随着总体参数值的增大,CMH检验的MH法参数估计值仍然与总体参数值接近,而CMH检验的logit法和Meta分析的参数估计值小于总体参数值,均方误差较大。通过以上的比较研究,研究者在处理定性资料时应根据研究目的和资料的特点选择合理的统计分析方法,可从以下几个方面考虑。⑴正确判断资料的类型。研究者需观察资料中涉及到的变量及其性质。⑵弄清楚数据的来源。若是多中心临床试验得到的资料,则应采用CMH检验或meta分析。⑶观察单元格中的频数。当高维列联表中存在空单元时,将所有格子的频数都增加0.5,再进行统计分析。⑷弄清分析目的,根据分析目的选择操作比较简单的一种统计分析方法。若只进行假设检验,CMH检验不失为一种有效而简便的统计分析方法,其检验效能不亚于其他方法;对于多中心临床试验q×2×2列联表资料,由于Breslow-Day检验分析异质性犯I类错误的概率和检验效能都高于Q检验,因此需将CMH检验和meta分析结合起来共同分析。若还需要进行参数估计,则要根据资料类型和以上的比较结果选择统计分析方法。对于一般的q×2×2列联表资料,当只估计一个因素的效应时,可选择CMH检验的logit法;对于试验因素和结果变量都是无序变量的高维列联表资料,与logistic回归模型相比,对数线性模型虽然能更好地估计试验效应,但其结果难以理解,因此,如果资料中有明确的原因变量和结果变量,仍然选择logistic回归模型;对于多中心临床试验q×2×2列联表资料,仅当异质性检验为阴性结果时,选择CMH检验的MH法,当各中心间存在异质性时,应选择meta分析,采用随机效应模型估计试验效应。
其他文献
核力量是战略威慑力量的核心构成,是实施战略威慑的基础和前提。针对俄罗斯三位一体核力量发展现状进行了研究,分析了俄罗斯核力量发展的特点,研究了俄罗斯核力量未来发展走
<正>脑室外引流术是神经外科的常见手术,简单而且有效,能迅速缓解颅内高压症状,挽救病人的生命。现总结我科2005~2009年间因蛛网膜下腔出血破入脑室行脑室外引流的69例患者手
语言具有一定的精确性,同时也具有模糊性,这种模糊性同精确性一样是自然语言本身的固有特征之一。1965年美国控制论专家L.A扎德在《信息和控制》杂志上提出了“模糊集”的问题,
在中国当代文坛,李锐无疑是一个独特的存在。他始终以“拒绝合唱”的姿态独立于主流话语之外,立足于个体生命的书写,执着地表达着“历史之外”的人的生命体验。李锐小说中充满了
水稻OsRacD是从雌雄蕊形成期幼穗中分离的小GTP结合蛋白Rho家族成员。已有的研究提示,该基因可能是一个与水稻育性有关、重要的发育调控基因。梁卫红等采用酵母双杂交技术筛选
自东汉末年战乱不断﹑军阀割据﹑各自为政,曹操依托“挟天子以令诸侯”的政治优势重新统一北方,奠定了日后全国统一的基础,同时也为日后以魏代晋打下了牢固的根基。而更为明显的是曹
云南省边疆民族地区与我国东部沿海内地先进发达地区在义务教育方面差异问题是一个既古老又现实的当代热点问题,而且随着近年来的社会发展,这一问题已引发一系列社会问题,在
酒精性肝病(alcoholic liver disease,ALD)为影响人们健康的主要肝脏疾病之一。ALD包括酒精性脂肪肝、酒精性肝炎、酒精性肝纤维化和肝硬化一系列病理改变。90%长期过量饮酒者可
本文以MOOC思想为研究起点,探讨了建立以学习者需求为导向,师生共建的适应环境变化的、半结构化的、动态的微课程体系,并对该体系的设计流程和定量测评体系做了详细研究。随
从工艺、设备、温湿度、操作等几方面分析探讨,找出梳麻车间影响亚麻纱质量的因素,这对提高亚麻纱质量是极为重要的。