论文部分内容阅读
目的:结直肠癌是严重威胁人类生命健康的重大公共卫生问题。全基因组关联研究(Genome-Wide Association Study,GWAS)已报道超过100个结直肠癌遗传易感区域,绝大部分易感位点位于基因组非编码区,提示其可能影响调控元件活性而参与基因表达调控,从而与结直肠癌发生风险相关。然而,鉴定基因组活性调控元件并确定其调控的靶基因是目前巨大的挑战。本研究通过整合多组学数据,系统性构建结直肠癌增强子-靶基因映射图谱,并结合病例对照研究及生物学功能实验开展进一步分析,旨在发掘真正的致病位点,为阐明遗传因素在结直肠癌中的作用提供一定线索。方法:首先,利用染色质转座酶可及性测序(Assay for Transposase Accessible Chromatin with high-throughput sequencing,ATAC-seq)、染色质免疫共沉淀测序(Chromatin Immunoprecipitation and high-throughput sequencing,Ch IP-seq)技术检测结直肠癌组织的染色质活性状态,并通过RNA测序(RNA-sequencing,RNA-seq)测定基因表达水平。此外,利用ENCODE数据库的Hi-C数据获取染色质物理接触频率。基于接触活性模型(Activity-by-Contact Model,ABC Model),系统整合以上多组学数据,在全基因组范围内鉴定活性增强子元件及其调控的靶基因,进而构建结直肠癌增强子-靶基因映射图谱,并通过位置比对鉴定位于增强子元件上的遗传变异。其次,利用生物信息学手段对增强子遗传变异及其调控的靶基因进行系统性功能注释。针对位于增强子上的遗传变异,利用组蛋白修饰数据以及转录因子结合数据揭示其潜在的调控功能,并通过GWAS区域富集分析评估这些遗传变异在解释结直肠癌遗传易感性中的作用。针对增强子调控的靶基因,通过基因差异表达、功能富集分析来预测这些基因在结直肠癌中的潜在生物学功能。通过多中心病例对照研究发掘与结直肠癌风险相关的增强子遗传变异。利用欧洲人群结直肠癌GWAS数据集筛选易感位点。样本数据申请自db Ga P数据库,包括17 789例病例和19 951例对照。针对其中基因表达调控效应最强的位点rs4810856,进一步在中国人群中开展两阶段病例对照研究进行验证。第一阶段样本来自北京地区,包括1 524例病例和1 522例对照,第二阶段样本来自武汉地区,包括4 500例病例和8 500例对照。采用Logistic回归模型评估遗传变异与结直肠癌风险的关联。此外,通过一系列生物学功能实验探索目的位点及其靶基因潜在的分子机制。采用双荧光素酶报告基因实验和凝胶电泳迁移率实验探索目的位点对增强子活性的影响;基于CRISPR-Cas9基因编辑系统构建单碱基突变的结直肠癌细胞系,检测目的位点对靶基因表达和细胞增殖能力的影响。通过Western-Blot实验探索靶基因参与的细胞信号通路,并利用细胞增殖实验和裸鼠皮下成瘤实验评价其潜在的促癌作用。结果:结直肠癌增强子-靶基因映射图谱共鉴定出34 130个增强子-靶基因精准映射对,包括15 121个增强子和12 351个受调控的靶基因。通过位置信息比对,鉴定出26 877个位于增强子元件上的遗传变异。功能分析结果显示,增强子遗传变异显著富集在染色质活性区域和结直肠癌GWAS区域内,提示这些遗传变异具有一定的调控潜能,且与结直肠癌易感性相关。增强子靶基因则具有一定的肿瘤分子特征,显著富集在多个癌症相关的细胞信号通路中。dbGaP欧洲人群的GWAS数据集共鉴定出4 847个与结直肠癌风险相关的增强子遗传变异。其中,位于20q13.13区域的rs4810856具有最强的基因表达调控效应,其所在的增强子区域可同时调控三个靶基因:PREX1、CSE1L及STAU1。中国人群两阶段病例对照研究进一步验证该位点C>T变异能显著降低结直肠癌的发病风险(OR=0.90,95%CI=0.86-0.94,P=8.43×10-6)。双荧光素酶报告基因实验和凝胶电泳迁移率变动实验表明rs4810856所在片段具有增强子活性,且C>T变异可减弱与转录因子ZEB1的结合能力,进而削弱增强子活性。基于CRISPR-Cas9单碱基突变细胞系的结果提示该位点C>T变异可降低靶基因PREX1、CSE1L及STAU1的表达,并显著抑制结直肠癌细胞增殖能力。染色体构象捕获实验进一步证实该变异可抑制其所在区域与靶基因启动子之间的染色质交互作用。此外,Western-Blot实验提示三个靶基因共同参与AKT信号通路,并可发挥协同作用激活该信号通路。体外细胞增殖实验和体内裸鼠皮下成瘤实验均证实靶基因在促进结直肠癌细胞增殖中也发挥一定的协同效应。结论:本研究通过整合基因组、表观基因组、转录组等多组学数据,在全基因组范围内系统地构建了结直肠癌增强子-靶基因映射图谱,为阐释结直肠癌的遗传病因提供了重要线索。进一步,结合病例对照研究、生物学实验等手段,阐明rs4810856C>T变异可减弱与转录因子ZEB1的结合能力,并抑制其所在区域与靶基因的启动子的染色质交互作用,进而降低PREX1、CSE1L及STAU1的表达水平,且抑制AKT信号通路激活,从而降低结直肠癌发病风险。这些发现揭示了结直肠癌遗传易感性的新机制,为结直肠癌的个体化防治提供了一定的参考依据。