论文部分内容阅读
目的
探讨条件控制对二分类Logistic回归结果影响的重要性。
方法通过病例对照研究方法,选择2010年10月至2013年3月云南省玉溪市人民医院心内科确诊的664例男性冠心病(CHD)患者及400名健康男性对照14项生理生化指标[包括:年龄、UA、TC、TG、HDL-C、LDL-C、APOA1、APOB100、Lp(a)、HCY、TBIL、DBIL、IBIL、γ-GT],比较不同统计学分析策略下,运用二分类Logistic回归分析建立各生理生化指标与CHD相关关系及数学模型结果的差异,对该模型进行ROC曲线分析。
结果(1)在未进行条件控制时,将全部14项生理生化指标直接进行二分类Logistic回归分析,经过11步回归之后,共有11个指标[年龄、UA、TG、HDL-C、LDL-C、APOA1、APOB100、Lp(a)、HCY、DBIL、γ-GT]入选,因Logistic回归本身的自我修正能力,能得到"较满意"结果,但部分结果难以解释。(2)按照Logistic回归应用条件,先对指标进行正态性检验、差异分析、相关分析等处理后,进行运用条件分析和控制,在考虑了各项指标的分布特性,排除了各变量间的内部混杂因素,筛选出9项独立性较强的变量[年龄、UA、TC、lnTG、lnLp(a)、lnHCY、HDL-C、LDL-C和lnTBIL]进行Logistic回归分析,经过7步回归后,最终有7个指标[年龄、UA、HDL-C、lnTG、lnLp(a)、lnHCY、lnTBIL]入选,曲线下面积为0.927。
结论运用二分类Logistic回归分析进行复杂疾病危险因素确认及风险评估模型建立研究时,进行严格的条件控制,可提高分析结果的可靠性和有效性。(中华检验医学杂志,2018, 41:232-236)