论文部分内容阅读
结直肠癌作为其中一种严重威胁人类健康的常见恶性肿瘤,在中国,到了2015年估计会有376300例的新发病例,分别是男性第五大和女性第四大的恶性肿瘤,并且近年来结直肠癌发病率一直呈现上升趋势。结直肠癌是一种环境和遗传因素长期共同作用的复杂性疾病,除了已揭示的膳食、营养、体力运动缺乏、肥胖、吸烟、饮酒等环境危险因素之外,遗传易感因素也在结直肠癌发生发展中发挥了重要作用。目前大规模的全基因组关联分析及精细定位研究已鉴定了超过30个的结直肠癌易感区域和位点,然而这些风险变异大多数都位于缺乏明确生物功能的非蛋白编码区域,其中的生物学机制更可能是它们发挥了调控基因转录表达的功能,从而与疾病产生了关联。挖掘和鉴定出GWAS (Genome-Wide Association Study,全基因组关联研究)易感区域中的功能性甚至致病性遗传变异,填补结直肠癌遗传机制上的空白,是如今post-GWAS (后全基因组关联研究)分析面对的主要挑战。第一部分结直肠癌易感区域5q31.1中功能性遗传变异的挖掘和鉴定目的:挖掘和鉴定结直肠癌易感区域5q31.1中的功能性遗传变异,提示5q31.1在结直肠癌发生发展中的生物学作用。方法:首先通过生物信息学分析挖掘位于5q31.1连锁不平衡区域里潜在调控功能区的常见单核酸多态,然后采用两阶段病例-对照研究分析候选SNP与结直肠癌风险的关联,再运用两个结直肠癌细胞系中的双荧光素酶报告基因实验验证阳性位点的生物学功能,最后利用TCGA (The Cancer Genome Atlas,癌症基因组图谱)数据进行顺式eQTL (Expression Quantitative Trait Loci,表达数量性状位点)分析和基因表达水平比较,以提示这个阳性位点的靶基因。结果:1.生物信息学分析一共筛选出三个位于潜在调控区域的候选功能变异rs2193941、rs17716310.rs7703385,在包含了691个病例和709个对照的第一阶段中国人群关联分析中,鉴定出一个可能位于活性增强子的阳性和边际性位点rs17716310(杂合模型:OR=1.27,95%CI=1.02-1.60,P=0.036:显性模型:OR=1.24,95%CI=1.00.1.53,P=0.050).再利用第二阶段包括1075例病例和1999例对照的独立中国人群对rs17716310进行验证,发现rs17716310仍与结直肠癌风险显著相关,个体每增加一个rs17716310-C,疾病风险上升15%(加性模型:OR=1.15,95%CI=1.03.1.29,P=0.016).2.双荧光素酶报告基因实验显示在两个结直肠癌细胞系HCT116和LoV0中,无论片段是正向还是反向,含有rs17716310-C的片段均比含有rs17716310-A的片段有更强的增强子活性。3.TCGA数据的分析,提示rs17716310是在结直肠癌组织高表达的SMAD5基因的顺式eQTL。结论:结直肠癌GWAS易感区域5q31.1中,一个具有调控功能的遗传变异rs17716310,其低频等位基因C显著增加了结直肠癌风险,并能明显提高报告基因的转录活性,而且与SMAD5基因的高表达有关第二部分结直肠癌易感区域中功能性超级增强子遗传变异的挖掘和鉴定目的:挖掘和鉴定结直肠癌GWAS易感区域中与超级增强子有关的功能性遗传变异,在post-GWAS时代进一步探索中国人群的结直肠癌遗传易感性。方法:首先通过生物信息学分析逐步筛选出东亚人群GWAS易感区域中的超级增强子遗传变异,接着利用三阶段的病例-对照试验分析候选功能性SNP与结直肠癌易感性的关联,再运用三个结直肠癌细胞系的双荧光素酶报告基因实验验证显著关联位点的生物学功能。结果:1.经过生物信息学分析和质控,我们筛选出了10个具有潜在功能的候选超级增强子遗传变异,并在第一阶段的757个病例及755个对照的关联分析中,得到三个阳性位点,分别是12p13.31上的rs11064124(显性模型:OR=0.81, 95% CI=0.66-1.00, P=4.88E-02)、19q13.11上的rs9783948(显性模型:OR=1.24,95%CI=1.01-1.53,P=3.98E-02)、20q13.33上的rs659822(显性模型:OR=0.52, 95%CI=0.39-30.70,P=1.01E-05)。在包括749例病例与756例对照的第二阶段的独立中国人群中对以上三个位点进行关联分析,发现只有12p13.31上的rs11064124与结直肠癌风险的显著关联能够得到重复(隐性模型:OR=0.53,95% CI=0.32-0.88,P=1.52E-02)。进一步在来自另外一个独立人群的1013个病例及1873个对照的第三阶段进行验证,成功重复了rs11064124的阳性关联(加性模型:OR=0.79,95%CI=0.69-0.91,P=7.05E-04)。2.三个结直肠癌细胞系HCT116、SW480、LoVo进行的双荧光素酶报告基因实验的结果都显示,与rs11064124-G相比,低频等位基因rs11064124-A能显著提高基因的转录活性。结论:本研究结合利用生物信息学分析、三阶段病例-对照关联研究、生物学功能实验三种不同的研究方法,发现了易感区域12p13.31中位于潜在超级增强子区域的功能性遗传变异rs11064124,与结直肠癌发生发展风险相关,其低频等位基因A可以显著提高基因转录活性。rs11064124可能是通过影响转录因子结合及所在超级增强子的活性来调控抑癌靶基因的表达,从而影响了结直肠癌易感性。