论文部分内容阅读
目的肺癌是严重危害人类健康的恶性肿瘤之一,具有高发病率和高死亡率的特点。肺癌筛查已成为肺癌防控的有效措施,对提高肺癌预后生存期和降低肺癌死亡率具有重要意义。在目前的肺癌筛查中,首先要确定肺癌高危人群,再对其进行低剂量螺旋CT(Low Dose Computed Tomography,LDCT)检查。然而对于肺癌高危人群的识别尚无统一标准,需进一步提高识别的精准性,以降低LDCT检出肺结节中存在的高假阳性率。本研究旨在基于前瞻性社区筛查队列和代谢组学方法构建肺癌风险预测模型,以提高对肺癌高危人群的精准识别和对LDCT检出肺结节的良、恶性预测。方法2020年6月至2020年11月,在马鞍山市花山区开展了50~74岁社区居民肺癌筛查研究,对所有筛查对象进行问卷调查并评估肺癌高危人群。参考国内外肺癌筛查指南和高质量肺癌危险因素研究文献,编制本研究问卷调查内容和高危人群识别标准。问卷内容包括一般人口学信息、生活方式和行为习惯、个人疾病史及其家族史、生活环境状况、女性生殖生育史、体格测量等信息。对评估出的肺癌高危人群,进行免费的LDCT检查;同时采集检查对象的清晨空腹血液样本。采用自行设计的肺结节特征记录表和CT诊断结果表记录LDCT检查结果。追踪随访基线筛查的所有研究对象,收集确诊肺癌病例。在发现集中,采用高效离子色谱串联质谱联用仪靶向检测16例肺癌患者和32例匹配对照组血浆样本中56种中心碳代谢物的浓度。在验证集中,采用气相色谱-三重四级杆质谱联用仪靶向检测35例肺癌患者和2210例非肺癌者血浆样本中17种选定代谢物的浓度。采用描述性统计,分析本研究基线筛查时的肺癌高危人群评估率、LDCT检查参与率、肺阳性结节检出率和疑似肺癌检出率。采用单因素分析(t检验、Mann-Whitney U检验、卡方检验、或Fisher确切概率法)比较组间差异。采用正交偏最小二乘判别分析对发现集中心碳代谢数据进行分析,以变量投影重要性大于1.0作为筛选优先代谢物的标准。采用最小收缩和选择算子回归方法筛选与肺结节恶性风险相关联的最佳代谢物组。采用多因素Logistic回归模型分别构建社区筛查队列人群和肺结节人群的肺癌风险预测模型;使用曲线下面积(AUC)评价模型的预测效能,使用Hosmer-Lemeshow(H-L)检验评价模型的拟合度,使用10倍交叉验证方法进行模型的内部验证。结果本研究在基线筛查时共完成有效问卷调查和肺癌风险评估10038人,平均年龄(62.5±7.0)岁;其中男性4242人,女性5796人。评估出肺癌高危人群3376人(高危率33.6%,3376/10038),完成LDCT检查2289人(LDCT检查参与率67.8%,2289/3376),检出肺阳性结节267人(肺阳性结节检出率11.7%,267/2289),检出疑似肺癌24人(疑似肺癌检出率1.0%,24/2289)。在评估出的3376名肺癌高危人群中,以是否参与LDCT检查为因变量。多因素Logistic回归模型分析显示,与女性人群相比,男性不易接受LDCT检查(比值比(OR)=1.54,95%置信区间(CI):1.17-2.04)。与70~74岁组人群相比,50~54岁和55~59岁组人群不易接受LDCT检查,其OR值(95%CI)依次为:1.82(95%CI:1.41-2.35)和1.55(95%CI:1.22-1.96)。与吸烟人群相比,不吸烟人群不易接受LDCT检查(OR=1.40,95%CI:1.07-1.84)。与经常锻炼的人群相比,从不锻炼(OR=1.36,95%CI:1.16-1.61)和偶尔锻炼(OR=1.32,95%CI:1.03-1.68)的人群均不易接受LDCT筛查。此外,无职业有害物质暴露史者(OR=1.53,95%CI:1.28-1.84)、无糖尿病史者(OR=1.26,95%CI:1.03-1.55)、无癌症家族史者(OR=1.70,95%CI:1.45-2.00)均不易接受LDCT筛查。在10038名社区筛查队列人群的随访中,共随访到病理确诊肺癌46人,非肺癌者9992人。肺癌组平均年龄(66.9±4.7)岁,非肺癌组平均年龄(62.5±7.0)岁。在基于10038名社区筛查队列人群构建的肺癌风险预测模型中,发现65~74岁年龄组(65~69岁:OR=12.14,95%CI:1.62-91.10;70~74岁:OR=11.49,95%CI:1.50-88.04)、低晾晒被褥频次(1-4次/月:OR=1.98,95%CI:1.04-3.75;<1次/月:OR=4.83,95%CI:1.06-22.09)、吸烟包年数≥40包年(OR=5.87,95%CI:3.00-11.49)、有一级亲属肺癌家族史(OR=3.32,95%CI:1.56-7.06)与筛查队列人群的肺癌发病风险增加相关。模型的AUC值为0.832(95%CI:0.773-0.884),H-L检验显示模型拟合度良好(P=0.815),10倍交叉验证显示模型预测效果稳定,平均AUC值为0.784,标准误为0.041。在验证集中,比较35例肺癌组与2210例非肺癌组基线血浆样本中代谢物的浓度差异,发现两组间富马酸、异柠檬酸、苹果酸、葡萄糖二酸、葡萄糖酸、马尿酸、乳酸、乳清酸、2-氧代己二酸的浓度差异具有统计学意义。在基线结节特征明确的823例肺结节人群中,随访到确诊肺癌患者31例和非肺癌者792例。基于823例肺结节人群构建了肺癌风险预测模型,发现年龄增大(OR=1.11,95%CI:1.02-1.20)、结节最大径增大(OR=1.22,95%CI:1.15-1.30)、边界不清楚(OR=4.03,95%CI:1.63-9.99)、葡萄糖二酸浓度升高(OR=2.23,95%CI:1.46-3.42)与肺结节人群的肺癌发病风险增加相关;2-氧代己二酸(OR=0.15,95%CI:0.04-0.59)和异柠檬酸(OR=0.49,95%CI:0.35-0.68)浓度升高与肺结节人群的肺癌发病风险降低相关。模型的AUC值为0.921(95%CI:0.872-0.963),H-L检验显示模型拟合度良好(P=0.680),10倍交叉验证显示模型预测效果稳定,平均AUC值为0.911,标准误为0.021。结论有针对性的在社区人群中开展肺癌LDCT筛查,有利于及时检出肺部病变。性别、年龄、职业有害物质暴露史、吸烟状况、锻炼状况、糖尿病、癌症家族史与肺癌高危人群接受LDCT检查的依从性有关联。基于社区筛查队列人群构建的包含年龄、石棉暴露、晾晒被褥频次、吸烟包年数、一级亲属肺癌家族史和慢性呼吸系统疾病既往史的肺癌风险预测模型,有助于提高肺癌高危人群的精准识别。基于肺结节人群构建的包含年龄、结节最大径、边界、2-氧代己二酸、葡萄糖二酸和异柠檬酸的肺癌风险预测模型,有助于对筛查检出的肺结节进行良、恶性预测。