论文部分内容阅读
结直肠癌(colorectal cancer,CRC)是消化系统常见的恶性肿瘤之一,其发病率在全球发达地区高于发展中国家。近年来,然而随着饮食结构和生活方式的改变,我国结直肠癌发病率逐年上升,成为严重影响居民身体健康和生活质量的疾病之一。随着医疗技术的发展,通过结直肠镜检、粪便潜血实验等检测手段,结直肠癌的检出率明显增加,干预和治疗手段使结直肠癌的死亡率得到有效的下降。然而,由于结直肠癌早期症状隐匿,60%以上的患者发现时已处于结直肠癌的中晚期,治疗效果不佳,预后差,其中发生远处转移的患者生存率仅为12.5%。与其他恶性肿瘤一样,结直肠癌发病机制复杂,是一个多因素、多阶段的过程,由环境因素和遗传因素共同作用导致的疾病。流行病学调查表明饮食结构、吸烟、饮酒、肥胖以及体力活动等环境因素可能影响结直肠癌的发病。然而暴露于相同的环境危险因素,仅部分个体罹患结直肠癌,这表明环境因素仅为始动因素,而遗传因素决定了不同个体的结直肠癌易感性。1990年启动的人类基因组计划(Human genome project,HGP)旨在识别人类染色体的碱基对排列顺序,绘制人类基因图谱,为遗传学的研究提供强有力的支持。HGP提示,人类不同个体仅在碱基顺序上存在0.1%的遗传差异,称为遗传多态,其中最主要的形式为单核苷酸多态(Single nucleotide polymorphism,SNP)。此外,高通量测序技术的发展和成熟使得测定全基因组范围内的遗传变异成为可能,全基因组关联研究(Genome-wide association studies,GWAS)成为近年来研究复杂疾病易感性的重要工具。从2007年,许多结直肠癌GWAS开始陆续被报道,几项在欧洲人群中开展的GWAS发现了超过20多个结直肠癌易感位点如染色体8q24、18q21区域等。然而,由于种族不同,在欧美人群中发现的遗传变异在亚洲人群中有时无法验证,如染色体6q26区域在欧美人群中是结直肠癌的遗传易感位点,但是在中国人群中显示与结直肠癌发病并无显著相关。最近,在东亚人群中进行的结直肠癌GWAS发现了 11个新的结直肠癌易感位点,然而,这些位点只能解释很少部分的结直肠癌发生。因此,进一步挖掘中国人群结直肠癌易感位点,识别新的结直肠癌易感基因,对于研究结直肠癌的发病机制具有重要的意义。本研究采用三阶段的病例对照研究,针对中国人群进行全基因组关联研究,以期发现新的结直肠癌易感位点,并在此基础上利用欧美人群进行验证,结合环境危险因素进行分析;此外,基于以上关联性研究,对GWAS识别出的易感位点,采用一系列分子生物学方法对其功能进行研究,阐明易感位点的遗传变异参与结直肠癌发生发展的分子机制,为探索结直肠癌的发病提供线索和思路。第一部分结直肠癌易感基因ETV6的发现与鉴定GWAS是研究恶性肿瘤等复杂疾病遗传易感性的有力工具,多个结直肠癌GWAS报道了一批易感位点,但是仅能解释部分的结直肠癌遗传度。本研究包括三个阶段,分别为GWAS阶段、第一验证阶段和第二验证阶段。在GWAS阶段,利用Illumina Human Omni ZhongHua芯片,在1,023例结直肠癌病例和1,306例对照中进行全基因组扫描,选择在GWAS阶段P<1.0×10-3的位点进行验证;在第一验证阶段,利用Sequenom Mass ARRAY芯片,对855例病例和1,258例对照进行验证;对有显著关联的位点,采用TaqMan基因分型技术,在4,462例结直肠癌病例和5,629例对照中进行第二阶段验证。通过Logistic回归模型分析各个遗传多态性位点基因分型与结直肠癌发病风险的关联性。研究结果显示,位于染色体12p13.2区域的ETV6基因的rs2238126与结直肠癌易感性相关(P=2.67×10-10)。合并GWAS阶段和两阶段验证后发现,ETV6基因的rs2238126 G等位基因显著增加结直肠癌的发病风险(相加模型P=2.67×10-10,OR=1.17,95% CI=1.11-1.23);对染色体 12p13.2 区域进行填补后,发现共有37个SNPs与结直肠癌发病风险有关(P<0.05),对rs2238126进行校正后,其他填补SNPs与结直肠癌的关联性消失,提示rs2238126是12P13.2区域内与结直肠癌易感性独立的遗传变异。对结直肠癌患者的发病年龄进行分析发现,携带rs2238126 GG基因型的患者比AA型患者的发病年龄提前2.2年,回归分析结果显示,rs2238126 G等位基因与结直肠癌的早发有关。进一步在1046例结直肠癌病例和1076例对照的分析中发现,rs2238126与欧美人群的结直肠癌发病风险也相关(相加模型P=0.034,OR=1.19)。因此,本研究结果提示染色体12q13.2区域的ETV6可能是结直肠癌的遗传易感基因。第二部分ETV6基因遗传变异的生物学功能研究在全基因关联研究中,我们发现了位于染色体12p13.2区域的ETV6基因的rs2238126与结直肠癌的发病风险显著关联。大量研究结果表明,遗传变异可能会改变宿主基因的转录活性和表达水平。我们推测,ETV6的遗传变异可能通过影响ETV6的表达,进而参与结直肠癌的发生发展。本研究通过生物信息学预测rs2238126对ETV6基因的调控作用,通过双荧光素酶报告基因实验、凝胶迁移实验(Electrophoretic mobility shift assay,EMSA)、染色质免疫共沉淀技术(Chromatin Immunoprecipitation,ChIP)和实时定量 PCR (Real-time polymerase chain reaction,RT-PCR)等实验进行验证。我们检测了 ETV6在结直肠癌细胞株、结直肠癌组织及癌旁正常组织中的表达水平,并通过构建ETV6过表达质粒及干扰RNA进行细胞表型实验,探讨ETV6参与结直肠癌发病的机制。研究结果显示,rs2238126位于基因ETV6的内含子区,ETV6的mRNA表达具有组织特异性,结肠组织中ETV6的mRNA表达量居于中等水平。生物信息学、双荧光素酶报告基因实验、凝胶迁移实验表明和免疫沉淀反应实验结果证实,rs2238126的不同等位基因与转录因子MAX的结合能力不同,显著影响ETV6的转录活性和表达水平。在结直肠癌癌组织中,rs2238126对ETV6发挥表达数量性状基因座(Expression Quantitative Trait Loci,eQTL)作用。TCGA数据库和67对结直肠癌组织的免疫组化实验结果都表明,ETV6在癌中的表达显著低于正常组织。细胞表型实验中发现,ETV6能够显著影响结直肠癌细胞的增殖,但并不影响周期和凋亡。结直肠癌发病风险显著相关SNP位点的累积效应分析结果表明,个体携带风险等位基因越多,罹患结直肠癌的风险越大(OR=1.41-5.09,Ptrend=2.34× 10-24),表明结直肠癌发病相关的遗传变异具有累计效应。GRAIL分析证实,位于ETV6上的rs2238126与其他已报道GWAS基因无明显相关,提示rs2238126可能为结直肠癌易感性的独立作用位点。ETV6基因的rs2238126不同等位基因与转录因子MAX的结合能力不同,显著影响ETV6的表达水平及功能的发挥,进而参与结直肠癌的发生发展。