论文部分内容阅读
摘要:文章用Cox比例风险模型对心力衰竭的影响因素进行了数据分析,研究结论显示,影响心力衰竭的主要因素是年龄、射血分数、高血压情况、血清肌酐浓度。根据模型我们可以帮助医疗专业人员了解患者存在的潜在风险,以便专业人员能够更早地采取行动。
关键词:Cox比例风险模型;Schoenfeld残差分析;心力衰竭影响因素
心力衰竭是指人体心脏的收缩功能的减退以及舒张功能受阻,不能很好地将静脉回心血量排到心脏外,造成静脉系统血液堆积,动脉系统血液不够,从而引起肺瘀血、腔静脉瘀血等疾病。心力衰竭是心脏方面的疾病,并且发病大多是从左心衰竭开始的。随着时间的推移,心脏逐渐不能提供全身的供血进而引起下半身肿胀、心跳加快或不规则、突然严重的呼吸急促和咳嗽等症状。心力衰竭已成为全球的最大死因,我国心衰患病率估计已达1.3%,保守估计至少有1000万人患有心力衰竭,特别是老年人占据大部分比例。如今中国已成为全球拥有最多心衰患者群的国家之一。本研究将死亡事件设置为结局,探究可能引起病人死亡的主要因素,由于每一个研究对象都有其各自的生存时间(从随访开始的时间一直到死亡、失访或随访结束的时间),由于这一特性所以选用Cox比例风险模型(Cox proportional-hazards model,也称为Cox回归)进行分析处理。数据由13个变量组成,对此13个变量进行Cox生存分析以评估影响患者死亡最大因素进而尽最大的可能提升患者的生存几率。
1 相关知识
1.1 Cox回归原理分析
Cox回归模型又被人们称为比例风险回归模型。由于生存时间与生存结果作为该回归模型的因变量,并且多个变量也可被同时分析进而分析出对生存期的影响。因为该模型上述的特性,自从模型被研发以来,大量运用在了医学分析领域。并且该模型能分析带有截尾生存时间的资料,且不要求估计资料的生存分布类型。由于其上述显著的优势,该模型已被大量的学者所使用。
2 模型建立及实例分析
2.1数据集简介
本数据集为从R公司检索到的心力衰竭预测数据集。该数据集由13个变量组成分别描述了患者的基本状况。年龄:用于描述患者患病年龄的定量数据、是否贫血(1/0):为一个二进制变量、肌酐磷酸激酶、是否患有糖尿病(1/0):为一个二进制变量、射血分数百分数:用于显示每次收缩时离开心脏的血液百分比、是否高血压(1/0)、血小板:发挥的主要作用,是生理性止血以及维持血管内皮完整性。血清肌酐:一种定量数据,用于描述肾脏功能的好坏、血清钠:一种定量变量,显示患者血液中的血清钠水平,以mmol/L为单位、性别男性1女性0、是否吸烟(1/0):为一个二进制变量、到访时间:一个定量数据显示患者死亡前几天的到访时间、是否死亡(1/0):为一个二进制变量。
2.2模型构建
本次研究方法使用的软件为IBM SPSS Statistics 26统计分析软件,在进行Cox回归分析之前,先利用单变量分析的方法例如KM法绘制生存曲线或者Logrank检验等方法检测所有因变量与自变量之间存在的关系,筛选掉一些可能不存在实际意义的变量,之后再通过多因素分析的方法,以保证其结果更加精确可靠。纳入的变量主要包括单因素分析差异有统计学意义的变量,为避免漏掉一些重要因素,作为探索性分析,此时将P值小于0.1,均作为具备统计学差异。在进行单因素分析时,并没有发现差异有统计学意义,但是在实验中认为与因变量关系密切的自变量。
在创建Cox回归分析时,我们将时间选取为到访时间,状态选取为是否死亡,协变量选取为是否贫血、肌酐磷酸激酶、是否患有糖尿病、射血分数百分数、是否高血压、血小板、血清肌酐、性别、是否吸烟,对于变量的筛选选取的方法为最大似然估计的向前逐步回归法(Forward LR)。
最终得到的模型如表1所示:
由表1可发现,血清肌酐、年龄、射血分数(百分数)、高血压的回归系数均为0,其次Score统计量为77.352, P
关键词:Cox比例风险模型;Schoenfeld残差分析;心力衰竭影响因素
心力衰竭是指人体心脏的收缩功能的减退以及舒张功能受阻,不能很好地将静脉回心血量排到心脏外,造成静脉系统血液堆积,动脉系统血液不够,从而引起肺瘀血、腔静脉瘀血等疾病。心力衰竭是心脏方面的疾病,并且发病大多是从左心衰竭开始的。随着时间的推移,心脏逐渐不能提供全身的供血进而引起下半身肿胀、心跳加快或不规则、突然严重的呼吸急促和咳嗽等症状。心力衰竭已成为全球的最大死因,我国心衰患病率估计已达1.3%,保守估计至少有1000万人患有心力衰竭,特别是老年人占据大部分比例。如今中国已成为全球拥有最多心衰患者群的国家之一。本研究将死亡事件设置为结局,探究可能引起病人死亡的主要因素,由于每一个研究对象都有其各自的生存时间(从随访开始的时间一直到死亡、失访或随访结束的时间),由于这一特性所以选用Cox比例风险模型(Cox proportional-hazards model,也称为Cox回归)进行分析处理。数据由13个变量组成,对此13个变量进行Cox生存分析以评估影响患者死亡最大因素进而尽最大的可能提升患者的生存几率。
1 相关知识
1.1 Cox回归原理分析
Cox回归模型又被人们称为比例风险回归模型。由于生存时间与生存结果作为该回归模型的因变量,并且多个变量也可被同时分析进而分析出对生存期的影响。因为该模型上述的特性,自从模型被研发以来,大量运用在了医学分析领域。并且该模型能分析带有截尾生存时间的资料,且不要求估计资料的生存分布类型。由于其上述显著的优势,该模型已被大量的学者所使用。
2 模型建立及实例分析
2.1数据集简介
本数据集为从R公司检索到的心力衰竭预测数据集。该数据集由13个变量组成分别描述了患者的基本状况。年龄:用于描述患者患病年龄的定量数据、是否贫血(1/0):为一个二进制变量、肌酐磷酸激酶、是否患有糖尿病(1/0):为一个二进制变量、射血分数百分数:用于显示每次收缩时离开心脏的血液百分比、是否高血压(1/0)、血小板:发挥的主要作用,是生理性止血以及维持血管内皮完整性。血清肌酐:一种定量数据,用于描述肾脏功能的好坏、血清钠:一种定量变量,显示患者血液中的血清钠水平,以mmol/L为单位、性别男性1女性0、是否吸烟(1/0):为一个二进制变量、到访时间:一个定量数据显示患者死亡前几天的到访时间、是否死亡(1/0):为一个二进制变量。
2.2模型构建
本次研究方法使用的软件为IBM SPSS Statistics 26统计分析软件,在进行Cox回归分析之前,先利用单变量分析的方法例如KM法绘制生存曲线或者Logrank检验等方法检测所有因变量与自变量之间存在的关系,筛选掉一些可能不存在实际意义的变量,之后再通过多因素分析的方法,以保证其结果更加精确可靠。纳入的变量主要包括单因素分析差异有统计学意义的变量,为避免漏掉一些重要因素,作为探索性分析,此时将P值小于0.1,均作为具备统计学差异。在进行单因素分析时,并没有发现差异有统计学意义,但是在实验中认为与因变量关系密切的自变量。
在创建Cox回归分析时,我们将时间选取为到访时间,状态选取为是否死亡,协变量选取为是否贫血、肌酐磷酸激酶、是否患有糖尿病、射血分数百分数、是否高血压、血小板、血清肌酐、性别、是否吸烟,对于变量的筛选选取的方法为最大似然估计的向前逐步回归法(Forward LR)。
最终得到的模型如表1所示:
由表1可发现,血清肌酐、年龄、射血分数(百分数)、高血压的回归系数均为0,其次Score统计量为77.352, P