论文部分内容阅读
第一部分:单核细胞淋巴细胞比值是新发慢性肾脏病的独立预测因子目的:慢性肾脏病(CKD)作为一种炎症相关性疾病,严重威胁着人类的健康。本研究的目的是探讨血常规中炎症指标单核细胞淋巴细胞比值(MLR)是否是新发CKD的独立预测因子。方法:本研究是一项回顾性队列研究,连续收集14033名年度体检者的体检资料(整个研究期间至少进行两次体检,间隔时间不少于1年),并排除数据缺失及未成年参与者。研究的主要结果是新发CKD,即初次体检时肾功能正常的参与者在随访期间估算的肾小球滤过率(e GFR)下降至低于60m L/min/1.73m~2或出现蛋白尿。首先,对基线数据进行描述性分析,比较随访出现CKD和未出现CKD参与者的基线数据差异;其次,使用单因素Cox比例风险回归模型筛选与新发CKD相关的基线数据指标,并比较血常规中炎症指标MLR与新发CKD及其他基线数据的相关性;最后,使用多因素Cox比例风险回归模型明确MLR是否是新发CKD的独立预测因子。此外,对不同性别、既往病史人群中MLR对新发CKD的预测价值进行亚组分析。结果:本研究最终纳入12868名参与者,平均年龄45.97±13.54岁,男性7712(59.9%)人。经过平均1.78年的随访,414(3.22%)名参与者被诊断为新发CKD。随访后出现CKD及未出现CKD的参与者基线数据差异较大:随访后新发CKD的参与者更可能是男性、年龄更大、体重更重、既往病史更多、血压更高、炎症指标更高(白细胞数量、中性粒细胞数量、单核细胞数量、中性粒细胞淋巴细胞比值(NLR)、MLR),低密度脂蛋白、甘油三酯、空腹血糖以及血尿酸水平更高,高密度脂蛋白及e GFR水平更低。单因素Cox比例风险回归模型分析显示MLR(HR=2.84,95%CI=1.90-4.24,p<0.0001)、白细胞数量(HR=1.09,95%CI=1.03-1.16,p=0.0023)、中性粒细胞数量(HR=1.12,95%CI=1.04-1.20,p=0.0017)、单核细胞数量(HR=4.24,95%CI=2.27-7.91,p<0.0001)以及NLR(HR=1.18,95%CI=1.06-1.30,p=0.0024)均与新发CKD风险升高相关。在调整年龄、体质指数、收缩压、红细胞平均血红蛋白浓度、高密度脂蛋白、球蛋白、血尿素氮、e GFR及空腹血糖后,多因素Cox回归分析结果显示MLR(HR=2.29,95%CI=1.03-5.10,p=0.043)仍是新发CKD的独立预测因子。白细胞数量、中性粒细胞数量及单核细胞数量也是新发CKD的独立危险因素。亚组分析显示,MLR在男性且未患糖尿病、高血压、心脑血管疾病及非酒精性脂肪肝病的患者中对新发CKD有更好的预测能力。结论:MLR是新发CKD的独立预测因子。白细胞数量、中性粒细胞数量及单核细胞数量也可独立预测新发CKD的风险。降低机体持续性低级别炎症水平或有助于预防或延缓CKD的发生发展。第二部分:社区人群慢性肾脏病3年发生风险的预测模型构建及评价目的:慢性肾脏病(CKD)是一项全球重大公共卫生问题,目前缺少适用于中国大陆社区人群的新发CKD预测模型。本研究的目的是构建社区人群3年CKD发生风险的预测模型并对模型进行评价和验证。方法:选择本研究第一部分参与者中随访时长不低于3年的参与者构建训练队列及验证队列。(1)比较训练队列及验证队列3年随访后出现CKD及未出现CKD参与者基线变量水平的差异。(2)通过机器学习XGBoost算法评估各基线变量预测3年CKD的重要性,并进行排序。(3)通过单因素logistic回归分析筛选出与3年CKD相关的变量。(4)综合机器学习及logistic回归分析的结果筛选出变量构建预测模型。分别构建全变量模型、运用逐步回归基于赤池信息量准则(AIC)筛选自变量建立的逐步模型、基于多变量分数多项式构建的多变量分数多项式(MFP)模型及Bootstrap重抽样的全变量模型和逐步模型5种模型。绘制各模型的受试者工作特征曲线(ROC),并描述各模型的ROC曲线下面积(AUC)、阈值、敏感度、特异度、阳性预测值、阴性预测值等特征。并使用Delong检验比较各预测模型间是否存在差异。(5)对预测模型进行决策曲线分析和校准曲线拟合。(6)使用模型对验证队列进行检验,评估预测模型的区分度及稳定性。(7)绘制训练队列预测模型的列线图。结果:本研究最终纳入2406名参与者,平均年龄49.96±14.31岁,男性1476(61.35%)人。经过筛选,最终用于构建预测模型的变量有16个:年龄、体质指数、收缩压、舒张压、单核细胞数量、MLR、高密度脂蛋白、甘油三酯、总胆固醇、e GFR、空腹血糖、谷草转氨酶、碱性磷酸酶、血小板分布宽度、平均血小板体积及红细胞平均血红蛋白浓度。构建的5个预测模型均表现出较好的区分度,AUC均大于0.8。5个预测模型间不存在统计学差异,故选择较简洁的用逐步回归基于AIC原则筛选自变量建立的逐步模型(Bootstrap重抽样500次)为主要模型。该模型共纳入了年龄、体质指数、收缩压、MLR、高密度脂蛋白、总胆固醇、e GFR、空腹血糖、碱性磷酸酶、血小板分布宽度及平均血小板体积共11个变量。该模型AUC为0.82(0.79-0.85),敏感度为76.85%,特异度为72.27%,阳性预测值为34.37%,阴性预测值为94.29%。在验证队列中,该模型也表现出了很好的稳定性:AUC为0.81(0.75-0.87),敏感度为76.81%,特异度为77.97%,阳性预测值为44.92%,阴性预测值为93.5%。校准曲线显示该模型具有较好准确度,决策曲线分析显示该模型具有较好的净效益。结论:本研究构建了用于社区成年人3年CKD发生风险的预测模型,该模型区分能力及稳定性均表现良好。将预测模型结果可视化为列线图可直接用于3年CKD风险的个性化定量评价,具有临床实用价值。