论文部分内容阅读
研究背景:在世界范围内,肝细胞肝癌(hepatocellular carcinoma,HCC,以下简称肝癌)是最常见的恶性肿瘤之一,其位居恶性肿瘤致死原因的第2位。肝癌发病率的显著特征中包括有性别差异和地域差异两种特征,在男性肿瘤患者中,肝癌排名常见肿瘤的第5位,而在女性肿瘤患者中,肝癌只排名常见肿瘤的第9位。从世界各个地区肝癌发病率的分布来看,东亚和东南亚是男性肝癌发生率最高的地区,女性肝癌发2病率最高的地区是东亚和非洲西部。中国是东亚地区面积最大的国家,同时也是肝癌发病率较高的国家,其每年新发肝癌病例数约为50多万,约占全球肝癌新发病例数的一半以上,而且超过50%的与肝癌相关的死亡病例也发生在中国。肝炎病毒(如HBV、HCV)感染是肝癌发生发展的风险因素之一,而在我国则是以乙型肝炎病毒(HBV)感染为主。近年来兴起的以病例-对照研究人群为基础的全基因组关联研究(Genome-wide association study,GWAS)累计鉴定了多个与HBV相关肝癌发生风险显著关联的单核甘酸多态性(Single nucleotide polymorphism,SNP)位点。但是,肝癌是多个微效基因共同参与的复杂疾病,现阶段研究所鉴定的多个微效易感基因并不能完全解释HBV相关肝癌的遗传学机制。而且为了检测到这些微效的易感位点,必须要有巨大的样本量才能提供充足的检验效能,这需要多个研究团队的合作才能实现,而每个研究团队所采用的基因分型的技术平台不是统一的,不同的平台之间所参考的人类基因组数据集之间也存在差异性,导致了不同平台之间的基因分型数据只具有有限的重复率,从而影响后续的合并分析。随着以唯一的基因组数据集为参考集,根据遗传变异位点之间连锁不平衡(linkage disequilibrium,LD)关系对分型平台中未分型的变异位点进行填补的基因填补技术的出现和完善,有效的弥补了不同基因分型平台数据之间的差异性,从而实现了多个不同分型平台基因型数据的关联分析和荟萃分析。此外,既往的全基因组关联分析在初始发掘阶段都是在基于无关个体的病例-对照研究人群中进行,其研究人群存在影响关联分析结果的混淆因素,从而导致假阳性结果的发生。虽然既往研究都在多个独立人群中对初始阶段鉴定的关联位点进行了重复验证,尽最大可能的避免了关联位点假阳性的可能,但是还是不能完全排除这一现象。家系是指某一家族各世代成员数目及成员之间的亲属关系,由于他们来源于共同的祖先,其某一家族成员的基因组变异位点可能会传递给下一代子女,其不受人群分层现象的影响,充分弥补了基于无关个体研究策略的不足。因此,近年来研究人员在全基因组关联研究中逐渐开展了联合家系和病例-对照的两种不同人群的研究,并鉴定了一批与不同疾病表型相关联的易感位点。但是,在HBV相关肝癌的全基因组关联研究中,罕见有这类研究成果发表。目的:由于现有研究成果尚不能完全解释HBV相关肝癌的遗传机制,所以我们开展这项研究希望鉴定新的HBV相关肝癌的遗传易感基因。方法:本研究使用自身团队2010年已发表的HBV相关肝癌的中国汉族人群(355例HBV相关肝癌病例和360例慢性HBV感染者对照)的全基因组基因分型数据,以及不同基因型分型芯片检测的HBV相关肝癌核心家系(205个核心家系)的全基因组基因分型数据。然后以千人基因组计划第三版本的基因组数据为参考集,使用2.3.1版本的IMPUTE2软件对两个不同的研究人群的基因分型数据进行填补。使用PLINK软件对填补后的病例-对照数据使用基于加性模型的Logistic回归的分析方法进行关联研究,对填补后的核心家系人群采用传递不平衡检验(Transmission/Disequilibrium Test,TDT)进行分析。之后对两个研究人群的分析结果进行合并分析,以P值小于或等于5×10-5为阈值在合并分析结果中筛选SNP进行进一步的质量控制以及在5个独立研究人群中进行验证研究。然后在88例验证人群的癌组织和癌旁组织进行基因表达定量,通过表达数量性状基因座(expression Quantitative Trait Loci,eQTL)分析来定位易感基因,并在82例癌症基因组图谱计划中肝癌患者的癌旁组织的基因型数据和mRNA表达数据中进行验证。同时在192例验证人群的病例中分析携带有新鉴定的HBV相关肝癌易感位点的不同基因型患者的生存时间时间是否具有差异性。最后,使用HaploReg、染色质构象俘获技术(chromosome conformation capture,3C)和STRING数据库探索新鉴定HBV相关肝癌的易感位点的基因调控机制。结果:本研究在初始发掘阶段鉴定了14个(P≤5×10-5)与HBV相关肝癌发生风险显著关联且未见报道的SNPs,其后在总计3796例病例和2544例对照的5个独立人群中进行了验证,最终位于7q21.13区域内的rs10273859被鉴定存在显著关联的信号(合并OR=1.28,合并P=9.46×10-10)。表达数量性状基因座分析结果显示,在rs10273859所在的连锁不平衡区域内,rs10273859的风险等位G等位与CDK14基因的表达量升高显著关联,而且进一步研究结果显示位于易感区域内携带有与易感位点存在强连锁不平衡的增强子区域内SNP位点(r2>0.7)的DNA片段与CDK14基因的启动子区域存在物理相互作用。同时携带rs10273859不同基因型的HBV相关肝癌患者的总生存时间具有显著的差异性。且新鉴定的HBV相关肝癌易感基因与既往研究所报道的HBV相关肝癌易感基因之间不存在相互作用。结论:本研究中,我们成功地应用了基于基因型推算填补的核心家系和病例-对照的全基因组关联研究策略,新鉴定了1个位于7q21.13区域内CDK14基因上的HBV相关肝癌易感位点(rs10273859)及其可能调控的易感基因CDK14基因。本研究成果增加了中国汉族人群HBV相关肝癌易感位点的数量,进一步补充了HBV相关肝癌的遗传学与分子生物学的理论知识,并在未来HBV相关肝癌高危个体的筛选中发挥作用。