论文部分内容阅读
【研究背景】食管癌和胃癌是两种常见的消化道肿瘤,环境和遗传因素与食管癌和胃癌的发病密切相关,胃癌最常见病理类型为胃腺癌,食管癌主要由两种病理学类型组成:食管鳞状细胞癌(ESCC)和食管腺癌(EAC)。其中ESCC是我国最常见的病理类型,而EAC是欧美国家的主要类型。食管癌和胃癌解剖位置相近,其危险因素既具有特异性也有共性。吸烟与ESCC和EAC风险增加相关,而饮酒是ESCC明确的危险因素,胃食管反流病、肥胖和巴雷特食管与EAC的易感性增加相关。胃癌危险因素包括幽门螺杆菌感染、吸烟、饮酒、新鲜水果和蔬菜的低摄入量以及高盐饮食等。近十年来,全基因组关联分析(GWAS)被用来探索影响食管癌和胃癌易感性的遗传变异,其中PLCE1(rs2274223)的错义突变被发现与食管癌和胃癌风险均相关,提示食管癌与胃癌的遗传基础具有一定的共性。为了进一步探讨食管癌与胃癌遗传易感性的相似性,本研究将基于食管癌GWAS发现的食管癌遗传位点,应用大样本胃癌病例对照研究探讨食管癌遗传位点及其遗传风险评分与胃癌发病风险的关联。【研究方法】(1)本研究首先通过GWAS Catalog及Pub Med数据库检索食管癌相关GWAS研究,采用以下标准筛选已报道的食管癌遗传位点:1)关联的显著性水平达到5.0×10-8;2)中国人群中的等位基因频率(MAF)不小于1%;3)遗传变异位点之间存在连锁不平衡(LD)(r~2>0.1)纳入P值最低的位点。本研究人群来源于三个胃癌GWAS,分别为南京(NJ-GWAS)、北京(BJ-GWAS)及美国国家癌症研究院(NCI-GWAS)。我们对胃癌GWAS原始数据进行统一的质量控制,以1000 Genomes计划PhaseⅢ的中国汉族人群数据为参考库对GWAS进行填补,剔除填补质量差的SNP(评分<0.3)并进一步进行质量控制。质控后,NJ-GWAS纳入550例病例和1155例对照的7192774个位点、BJ-GWAS纳入456例病例和1118例对照的7192774个位点,NCI-GWAS纳入1625例病例和2100例对照的7641942个位点。(2)单个遗传位点、遗传位点累积效应以及加权遗传评分(WGS)与胃癌风险之间的关联。采用Logistic回归模型进行遗传关联分析,采用Logistic回归相加遗传模型分析单基因位点与胃癌风险的关联;对于胃癌风险相关的基因位点,进一步将危险等位基因的个数纳入Logistic回归模型分析它们的累积效应,此外将WGS分别作为连续变量和分类变量纳入Logistic回归模型分析食管癌与胃癌的遗传关联;在NJ-GWAS和BJ-GWAS分析中调整了年龄、性别、吸烟、饮酒状况和人群分层的第一主成分,在NCI-GWAS分析中调整了年龄、性别和4个显著主成分。利用Meta分析的固定效应模型对三个GWAS结果进行合并,并采用Cochran Q进行异质性检验,当I~2(按100%×(Q–(n–1)/Q计算得到)大于75%时,使用随机效应模型进行重复分析。通过Haplo Reg数据库对胃癌相关位点及其高度连锁不平衡(r~2>0.6)的遗传变异位点进行功能注释,通过SIFT、Poly Phen-2和Clin Var对外显子区的位点进行功能预测。(3)利用The Cancer Genome Atlas(TCGA)数据库的胃癌、食管癌患者基因表达数据对胃癌与癌旁组织以及食管癌与癌旁组织进行表达分析,采用双样本t检验或配对t检验进行差异表达分析。使用TCGA数据库中415例胃癌全转录组标化表达数据,分析与候选目的基因存在显著共表达关系的基因群,最终选取经FDR校正(P<0.01)的基因,通过“cluster Profiler”的R包进行共表达基因的KEGG通路富集分析。【研究结果】(1)本研究共纳入来自9项GWAS研究(包括ESCC 8项和EAC 1项)21个已知的食管癌风险相关遗传位点。单位点分析显示,3个遗传位点与胃癌风险显著相关:10q23.33区域的rs2274223的G等位基因(相关基因:PLCE1)显著增加胃癌发生风险(OR=1.26,95%可信区间(CI):1.16-1.38,P=6.51×10-8);以及5q11.2区域的rs10052657(相关基因:PDE4D)和12q24.12区域的rs671(相关基因:ALDH2)也与胃癌发生风险显著相关(OR=1.12,95%CI:1.01-1.25,P=3.28×10-2;rs671:OR=0.83,95%CI:0.75-0.91,P=1.14×10-4)。上述3个遗传位点(rs2274223、rs10052657和rs671)联合后与胃癌风险呈显著剂量-反应关系,随着风险等位基因数增加,胃癌风险显著增加(OR=1.31,95%CI:1.19-1.44,P=2.34×10-8)。(2)食管癌WGS与胃癌发生风险的分析结果显示:食管WGS与胃癌(OR=1.15,95%CI:1.06-1.25,P=1.20×10-3)及连续WGS显著相关(OR=1.08,95%CI:1.03-1.13,P=9.11×10-4);进一步分析发现该关联主要存在于ESCC WGS与胃癌风险(OR=1.16,95%CI:1.07-1.27,P=5.52×10-4;连续WGS的OR=1.09,95%CI:1.04-1.14,P=2.71×10-4);EAC WGS与胃癌并不存在这一关联(OR=1.02,95%CI:0.92-1.13,P=0.66;连续WGS的OR=0.99,95%CI:0.95-1.04,P=0.700)。(3)对上述3个胃癌相关位点功能注释显示,10q23.33区域与rs2274223存在高度连锁不平衡的位点主要位于PLCE1和NOC3L的内含子区域;5q11.2区域与rs10052657存在高度连锁不平衡的位点均位于PDE4D的内含子区域,其中rs78423157位点存在启动子、增强子及DHS信号的富集;位于12q24.12区域的rs671可导致ALDH2基因外显子504位密码子错义突变(Glu>Lys);差异表达分析显示:PDE4D和ALDH2在ESCC和胃癌组织中的表达显著下降,PLCE1表达水平无明显差异。通路富集分析显示:PDE4D显著共表达基因主要富集于Ras通路、c GMP-PKG通路、PI3K-Akt通路等肿瘤相关通路以及T细胞受体信号通路;ALDH2共表达基因主要富集于甘油酯代谢、脂肪酸代谢等代谢通路以及氧化磷酸化通路。【研究结论】本研究探讨了食管癌遗传位点与胃癌发病风险的关联,发现位于染色体10q23.33、5q11.2和12q24.12区域的遗传位点可能同时影响ESCC及胃癌的发病风险,ESCC的遗传位点与胃癌的发生风险存在联合效应。本研究结果进一步证实了胃癌与ESCC存在一定的共同遗传基础,二者的遗传易感性存在相似性,为上消化道肿瘤高危人群识别提供了新证据。