论文部分内容阅读
目的:本研究旨在获得胃癌患者外周血单个核细胞(PBMC)的全基因组DNA甲基化图谱,筛选可用于胃癌诊断的异常甲基化CpG位点,建立多位点联合诊断模型并评估其诊断效能,为胃癌的早期非侵入性诊断提供新的方法和依据。方法:1.对发现队列中46例胃癌患者和37例健康对照者的PBMC样本进行850K甲基化芯片测序,绘制胃癌PBMC全基因组DNA甲基化图谱,获得差异甲基化位点(DMPs)。采用基因本体(GO)分析和京都基因与基因组百科全书(KEGG)分析预测DMPs所在基因的功能。采用基于随机森林的多因素过滤方法筛选差异明显的DMPs作为候选标志物。2.通过焦磷酸测序在训练队列(包括49例胃癌患者和49例健康对照者)PBMC样本中检测候选DMPs的甲基化状态,通过绘制受试者工作特征曲线(ROC)评估候选DMPs诊断胃癌的效能。采用Pearson相关性分析对候选DMPs之间的相关性进行分析。使用Logistic回归构建基于PBMC异常甲基化的多位点联合诊断模型,建立模型风险评分公式Multi-score,用于胃癌诊断。通过绘制ROC曲线,计算曲线下面积(AUC)以评估模型的诊断效能,并与传统血清学标志物进行比较。分析训练队列中胃癌患者的Multi-score与临床病理特征的相关性。3.采用多重目的区域甲基化富集测序在验证队列(包括64例胃癌患者和50例健康对照者,其中胃癌患者大多为TNMⅠ期)PBMC样本中检测模型所包含CpG位点的甲基化水平,以验证模型的诊断效能,并与传统血清学标志物进行比较。分析验证队列中胃癌患者的Multi-score与临床病理特征的相关性。结果:1.通过对发现队列的850K甲基化芯片数据进行分析,获得了胃癌PBMC的全基因组DNA甲基化图谱。以|Δβ| ≥ 0.06、adjustp<0.05作为预筛选条件,得到8615个DMPs(包括3501个高甲基化的DMPs和5114个低甲基化的DMPs)。GO分析和KEGG分析显示,DMPs所在基因主要富集在免疫细胞功能相关通路。通过基于随机森林的多因素过滤方法筛选得到6个DMPs(包括4个高甲基化的DMPs和2个低甲基化的DMPs,adjust p<0.001)作为候选标志物。2.在训练队列中通过焦磷酸测序验证6个候选标志物的异常甲基化趋势及诊断效能,6个DMPs对于胃癌均具有良好的诊断效能(AUC均大于0.770)。根据Pearson相关性分析的结果排除位点cg11754974、cg15792125及cg23416081,利用Logistic回归建立了最优的多位点联合诊断模型:Multi-score=(16.1523 × cg22792587)+(12.3013× cg22678228)+(-7.4275 × cg27077475)-15.1012。模型对于胃癌具有良好的诊断效能,AUC 可达 0.916(95%CI 为 0.842-0.962,灵敏度=93.88%,特异度=81.63%),明显优于传统血清学标志物CEA(AUC=0.718,95%CI为0.596-0.819)。通过ROC曲线分析模型对于Ⅰ期胃癌的诊断效能,AUC可达0.936(95%CI为0.846-0.982,灵敏度=100.00%,特异度=83.67%)。通过分析发现,训练队列中胃癌患者的Multi-score与患者的年龄、性别、肿瘤的大小、TNM分期等临床病理特征均没有明显相关关系(p>0.05)。3.在验证队列中经多重目的区域甲基化富集测序验证模型用于早期诊断胃癌的效能,AUC 可达 0.862(95%CI 为 0.785-0.920,灵敏度=82.81%,特异度=74.00%),优于CEA(AUC=0.621,95%CI为0.514-0.720)。与训练队列中结果一致,验证队列中胃癌患者的Multi-score与患者的年龄、性别、肿瘤的大小、TNM分期等临床病理特征也无明显相关关系(p>0.05)。结论:1.本研究发现并初步分析了胃癌患者和健康对照者PBMC的差异全基因组DNA甲基化图谱。2.本研究所筛选的 6 个 DMPs(cg11754974,cg15792125,cg22792587,cg22678228,cg23416081及cg27077475)在胃癌患者的PBMC中异常甲基化,均可作为胃癌早期诊断的潜在标志物。3.本研究所构建的基于PBMC DNA甲基化的多位点联合诊断模型,为胃癌的早期非侵入性筛查提供了新的方法,优于现有的血清学标志物。