论文部分内容阅读
【研究背景】胃癌(Gastric cancer,GC)是全球危害最严重的恶性肿瘤之一,其发病率和死亡率分列第五位和第三位。胃癌的发生和发展是环境因素与遗传因素共同参与的复杂过程,幽门螺旋杆菌感染、烟草暴露、新鲜果蔬摄入不足、腌渍食物的食用,是导致胃癌发病的主要环境因素。然而,处于相同环境暴露的不同个体胃癌发病的风险存在差异,疾病易感性的差异目前被认为是由个体间基因组遗传变异所决定。全基因组关联研究(Genome-wide association study,GWAS)作为一种效率较高的研究策略,被广泛地应用于包括胃癌在内的许多人类复杂疾病的遗传易感性的研究。2008年,GWAS研究首次被运用于探索胃癌遗传易感性,发现了染色体8q24.3区域与胃癌易感性之间的关联;至今已报道了10余个胃癌易感区域,包括染色体1q22,3q13.31,5p13.1,5q14.3,6p21.1,6p22.1,8q24.3,9q34.2,10q23.33,12q24.11-12和20q11.21区域。然而,GWAS鉴定的遗传位点仅解释了胃癌较小一部分遗传度,这种现象被称为“遗传度缺失”。遗传度缺失的一个可能的解释是GWAS研究中严格的全基因组显著性阈值(即P<5×10-8),许多对遗传度有微弱贡献、可能存在生物学功能的遗传变异因不能满足该显著性水准而被忽略。中心体作为细胞中微管聚合中心和纺锤体的核心成分,能够控制细胞的分裂、极性、生长和迁移,并参与肿瘤的发生、发展。研究证据提示中心体调节关键基因上的遗传变异与乳腺癌、子宫内膜癌等多种肿瘤发生风险显著相关。但是中心体调节基因的遗传变异在胃癌中的作用尚不明确。因此,本研究基于课题组胃癌GWAS数据库,系统筛选中心体调节基因中与胃癌易感性存在关联的遗传位点,并通过分子生物学实验挖掘其潜在的致病机制。【研究方法】本研究采用病例对照研究设计。首先,基于Molecular Signatures Database(MSig DB)数据库,我们系统筛选五条中心体调节通路上136个候选基因。以千人基因组计划(1000 Genomes Project,1KG)汉族人群数据库为参考,纳入候选基因及其上下游10kb范围内共计29392个单核苷酸多态性位点(Single nucleotide polymorphism,SNPs)作为候选;在4个胃癌GWAS数据中(总计3771例胃癌病例和5426例健康对照)中分别采用logistic回归评估单个位点与胃癌易感性关联,并在此基础上进行Meta分析确定遗传变异的关联及其效应强度;随后,针对候选遗传变异,结合Genotype-Tissue Expression Project(GTEx)数据库,在正常胃组织中筛选出受其调控的靶基因,并利用胃粘膜及胚胎胃组织的组蛋白H3K4me1、H3K4me3和H3K27ac的CHIP-seq数据,将与候选遗传变异存在高度连锁不平衡(Linkage disequilibrium,LD)关系的所有遗传位点进行功能注释,筛选处在组蛋白活性信号峰上的功能性位点;通过双荧光素酶报告基因实验评价这些候选功能性位点是否影响所在区域转录活性;同时,使用The Cancer Genome Atlas(TCGA)公共数据库,分析候选基因在胃癌组织和癌旁组织的m RNA表达差异;利用包含48对胃癌癌组织和癌旁组织的芯片,对候选基因进行免疫组织化学染色(Immunohistochemistry,IHC),以检测候选基因的蛋白水平;通过Kaplan-Meier在线绘图工具,分析候选基因表达与胃癌患者预后的关联;最后使用CCK8、克隆形成、细胞迁移侵袭等实验评估候选易感基因对胃癌细胞系恶性表型的影响,探究易感基因在胃癌发生中的作用。【研究结果】研究结果显示,882个中心体调节基因相关SNPs与胃癌发生风险存在关联(P<0.05);经过FDR校正(去除PFDR≥0.2的位点)及连锁不平衡分析后(r2>0.2),筛选出6个与胃癌发生风险相关且在4个GWAS数据库中异质性较小(I2<25%)的独立位点;最后通过计算位点与对应候选基因的e QTL关系,发现两个与胃癌发病风险显著相关的遗传变异,分别为位于5p13.33区域的rs1697950(OR=1.15,95%CI=1.07-1.24,P=1.07×10-4)和7q11.23区域的rs6465096(OR=1.25,95%CI=1.11-1.41,P=3.17×10-4)。e QTL分析显示,rs1697950风险等位基因A和rs6465096风险等位基因T分别显著增加CEP72(P=7.30×10-4)和YWHAG(P=1.60×10-3)的m RNA表达水平。通过对所有与rs1697950和rs6465096存在高LD的遗传变异进行功能注释,结果提示位于基因组调控区的rs924607(与rs1697950:r2=1.00)和rs2961037-rs2961038(与rs6465096:r2=1.00)可能是两个候选区域的潜在功能性位点。报告基因实验证实位于CEP72转录起始位点上游2312bp的rs924607所在区域具有启动子活性,而位于YWHAG下游的rs2961037-rs2961038所在区域具有增强子活性;差异表达分析显示,CEP72和YWHAG在胃癌组织中表达水平均显著高于癌旁组织(P成组=1.96×10-13,6.44×10-7;P配对=8.85×10-9,3.61×10-3);免疫组化结果也证实CEP72和YWHAG在胃癌组织中呈现高表达状态(P=8.91×10-11,1.24×10-5)。通过si RNA分别敲降CEP72和YWHAG后,胃癌细胞的增殖、迁移和侵袭能力显著降低,而细胞凋亡显著增加;同时敲降CEP72和YWHAG后,胃癌的细胞增殖、迁移和侵袭能力进一步下降;CEP72敲降后,细胞G2期细胞的比例显著增加。这些结果提示这两个基因在胃癌的发生中起到促癌作用,且两者在胃癌的发生中能够发挥协同作用。【研究结论】本研究系统探究了中心体调节基因相关遗传变异与胃癌发生风险的关联,发现rs1697950、rs6465096分别影响CEP72、YWHAG的表达水平并与胃癌易感性相关;功能性SNP rs924607、rs2961037-rs2961038分别调控启动子、增强子活性影响CEP72、YWHAG表达水平,进而影响胃癌的发生。本研究结果初步阐明了中心体调节基因相关遗传变异影响胃癌易感性的生物学机制,为进一步探索胃癌易感机制、筛选胃癌高危人群奠定理论基础。