论文部分内容阅读
背景肾病综合征(NS)患者无论最终是否进展成为慢性肾脏病(CKD),其循环脂质和脂蛋白的代谢情况都会发生改变。脂质代谢紊乱可导致动脉内膜脂质浸润,增加动脉粥样硬化(AS)风险,是NS并发心血管事件的危险因素,持续未缓解的NS患者心血管风险随时间的推移显著升高。尽管他汀类药物是血脂管理的基石,但对于肾功能未明显下降的NS患者,他汀类药物是否可有效降低心血管风险尚不明确。并且,早期识别和预测NS患者发生心血管疾病的风险,及时精准地对相关危险因素进行干预,是进一步规范临床心血管疾病一级预防、改善患者预后极为重要的环节。目前机器学习在医疗方面有着广泛应用,结合机器学习算法,可以辅助挖掘出一些临床上容易忽略掉的风险因素、发现出乎意料的相关因素交互作用等。第一部分:肾病综合征患者他汀的启动时机与治疗周期对心血管疾病风险的影响目的本研究旨在评估他汀药物治疗的启动时机与治疗周期是否会影响NS患者心血管疾病结局,以及亚组分析他汀对心血管疾病的影响是否存在差异。资料与方法本课题组设计一项单中心、回顾性、巢式病例对照研究,选取1999年1月1日至2014年11月30日期间首次诊断为NS的18到85岁患者纳入最初的研究队列(2706例)。观察期结束时诊断为心血管疾病的患者归为病例组(115例),按1:2比例根据条件匹配对照组(235例)。基线资料采集自患者进入队列时的信息。观察指标为他汀类使用分布情况及治疗暴露剂量(累积时间)。在病例组及其倾向评分匹配(PSM)对应的对照组对象中,测量病例发生前的等效时间段内他汀暴露剂量。纳入基线不平衡的变量进行PSM,使用标准化均数差(SMD)进行组间的协变量平衡性检查。根据PSM后生成的研究群组,以NS患者心血管病和他汀暴露情况进行χ~2检验,分析二者间的相关性,并进一步亚组分析。应用独立样本t检验观察两组他汀治疗暴露剂量的差异,二元Logistic回归分析心血管风险与暴露剂量的关系。结果PSM后保留病例组和对照组研究对象各74例(比例为1:1),两组对应的他汀累积治疗时间差异显著(病例和对照组分别为:2.04±3.41月和7.62±9.55月,P<0.001)。他汀类药物治疗与NS患者心血管事件风险降低相关(P=0.002),且随着他汀类药物治疗时间的延长而降低(OR=0.82[95%置信区间CI 0.73-0.89],P<0.001)。在亚组分析中,≥60岁、e GFR<90m L/min/1.73m~2、Fbg≥3.8 g/L、ALB<30 g/L以及LDL-C≥2.6mmol/L的NS患者,他汀类药物治疗与心血管风险降低相关(P<0.05),而女性、HDL-C<1.04mmol/L、BMI≥25患者未见显著相关性。结论根据实验结果得出,NS患者应用他汀类药物治疗可能会降低其5年心血管疾病风险,随着治疗时间的延长,这种风险可能会进一步降低。实验结果对NS患者脂代谢紊乱治疗及心血管一级预防的临床证据提供了补充。第二部分:基于随机森林算法预测肾病综合征患者的心血管风险目的针对真实世界中NS患者可能的错综复杂的心血管危险因素,采用机器学习算法中的随机森林模型,对NS患者5年心血管疾病风险进行预测。旨在早期识别高危患者,精准指导临床治疗方案的制定,提高患者治疗效果及改善疾病预后。资料与方法将上述第一部分方法,挑选出的病例组和对照组研究对象整合成一个新的研究队列,共计350例。应用R语言软件按照约7:3的比例随机抽取并划分为训练集和测试集。随机森林模型纳入变量具体种类范围较第一部分更为广泛,实验室检测结果取值自病例组出现结局前、对照组5年随访期间检测记录的平均水平。观察指标包括:随机森林模型参数、变量预测重要性的度量指标、模型预测性能评估指标等。视变量类型应用t检验、Wilcoxon秩和检验、χ~2检验比较训练集与测试集两组研究对象特征。采用机器学习算法中的随机森林算法模型,选取随机森林最优节点值和决策树数目,袋外样本(OBB)用于模型初步的内部验证,探索最适合本模型的重要性度量,寻找并排序变量预测重要性,探寻模型中预测变量交互作用并可视化展现。进一步用测试集数据进行模型外部验证,评价随机森林模型预测性能。结合临床实际,对随机森林模型可视化结果进行分析和解释。结果本研究中用训练集构建的随机森林模型最佳节点值为6、最佳决策树数目为446。此时的模型OOB内部验证估计错误率最低(10.36%)。提示本研究中所关注的重要性度量(除P值外),两两间均有较高相关性。本研究使用四种方式探索和筛选变量重要性,分别为:(1)平均最小深度;(2)Gini降低量来评估;(3)森林树木结构相关度量多向重要性;(4)变量在预测中所起作用的多向重要性。模型中的相对重要预测因子前10位依次为:e GFR、HDL-C、年龄、apo B、apo AI、ALB、Fbg、UA、LDL-C和BMI(根据方式(4)排序)。测试集验证模型预测的准确率为0.919、精确率为0.935、召回率为0.829,AUC及95%CI为0.899(0.832–0.966)。结论随机森林模型具有良好的预测性能,并能较好地预测正例。模型筛选的重要预测因子可能为预测NS患者5年心血管风险提供有用的信息。应用模型预测患者心血管疾病风险并及时合理地进行干预,并为后续诊疗中监测指标的选择提供可靠依据,对于合理利用医疗资源及改善患者预后具有重要意义。