基于全基因组关联研究的肺癌遗传度估计及易感区域的功能注释

来源 :南京医科大学 | 被引量 : 1次 | 上传用户:wangwangge
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
肺癌是全球范围内最常见的恶性肿瘤之一,目前其发病率和死亡率均位于全世界所有恶性肿瘤的首位。过去数十年中,不断增加的烟草消费和持续加重的环境污染,导致我国多数地区的肺癌发病率和死亡率呈现不断上升趋势,已经成为威胁我国人民健康的重要公共卫生问题。流行病学证据表明,环境暴露是导致肺癌发生的重要原因之一。其中,烟草暴露是肺癌发生最主要的环境危险因素。尽管90%左右的肺癌可以归咎于烟草暴露,但只有15%左右的吸烟者最终发展成肺癌,说明在同等环境暴露下,具有不同遗传背景的个体对肺癌的易感性不同,且很可能归咎于一类更常见、低外显性的遗传改变形式。肺癌的“一级预防”理念倡导有效地发现肺癌的高危人群,除了明确有害的环境暴露因素之外,鉴别影响肺癌发生的遗传标志物,也是提高肺癌高危人群筛选效率的重要研究方向之一。近十年来,全基因组关联研究(Genome-wide association studies,GWAS)的快速发展为全面整合基因组中常见变异探究肺癌遗传易感性提供了可能。自2008年肺癌的第一个全基因组关联研究开始,这些研究至今一共报道了肺癌的45个易感性区域,大大增加了研究者对肺癌易感性的理解。尽管GWAS研究取得了丰硕的成果,但仍存在未能解决的关键科学问题。一方面,研究者发现GWAS报道区域仅能解释一小部分的肺癌遗传度,提出“遗传度缺失”的概念,即GWAS报道区域所解释的遗传度与传统双生子研究估计的总遗传度之间的差值。遗传度是衡量遗传因素在疾病发生中作用大小的指标,为遗传变异的方差与总表型变异方差的比值,即遗传效应对疾病易患性变异的贡献大小。遗传度有狭义和广义之分,狭义的遗传度(narrow-sense heritability,h2)是指加性遗传效应方差占表型方差的比例。广义的遗传度(broad-sense heritability,H2)是指总遗传方差占表型方差的比值,总遗传方差包括加性遗传方差、显性方差和上位方差。遗传度H2的估计主要基于家系和双生子研究设计,既往欧洲人群的研究估计肺癌的H2约为26%38%。近几年,研究者已经能够基于无亲缘关系人群的全基因组分型数据对性状或疾病表型的狭义遗传度h2进行估计。Lu等人对12种肿瘤进行了GWAS芯片遗传度的估计,发现肺癌(欧洲人群)、乳腺癌(欧洲人群)及胃癌(亚洲人群)的遗传度不显著。Joshua等人基于欧洲人群和亚洲非吸烟女性人群所估计的肺癌遗传度分别为20.6%和12.1%,差异较大,但均具有显著的统计学意义。而该研究同样发现,GWAS报道区域所解释的遗传度仅分别约为1.4%和2.4%,由此可见,针对肺癌GWAS研究而言,大多数遗传度并未真正缺失,而是被隐藏在芯片中未满足GWAS阈值标准的遗传变异中。同时,该研究也提示,不同种族人群中肺癌的遗传效应大小具有较强的异质性。基于中国人群肺癌GWAS数据进行遗传度分析,将有助于阐明中国人群肺癌缺失遗传度的分值,以及其中隐藏于GWAS芯片的遗传度大小,以提示进一步基于GWAS进行易感性位点挖掘的意义。另一方面,近年来研究表明,GWAS报道的SNPs超过80%位于非编码区域,因此在GWAS后期,对这些SNPs的功能进行预测是很大的挑战。近年来,生物学技术的飞速发展和国际大型项目的建立为解析重要的调控元件和注释GWAS中常见变异的生物学功能提供了有力的工具。国际大型项目如DNA元件百科全书(Encyclopedia of DNA elements,ENCODE),基因型-组织表达(Genotype-Tissue Expression,GTEx),癌症和肿瘤基因图谱(The Cancer Genome Atlas,TCGA)等分别提供了遗传变异与基因的注释,变异与基因表达之间的组织特异性关联,以及相关基因在癌症中的表达情况等重要信息,对鉴别变异和基因在肿瘤中的重要性有很大帮助。因此,为了阐明中国人群有待挖掘的常见变异的肺癌遗传度,及整合生物学功能特征筛选出具有潜在功能的重要遗传变异,本课题组基于前期已发表的肺癌GWAS数据,采用全基因组复杂性状分析(Genome-wide Complex Trait Analysis,GCTA)的方法,评估中国人群肺癌的加性遗传度及已知易感区域的遗传度;同时,对亚洲人群GWAS芯片上的SNPs进行扩大P值筛选,结合公共数据库的功能特征进行功能注释,以期发现潜在重要的功能性位点。研究发现对于指导肺癌高危人群的筛查和实施肺癌的“精准预防”具有重要的科学意义。第一部分基于全基因组关联研究的中国人群肺癌遗传度估计本研究采用病例-对照研究设计,基于课题组前期已发表的中国人群肺癌全基因组关联研究设计,进行系统严格的质量控制,剔除质量不合格的样本和位点,最终2,231例病例和2,774例对照的424,288个SNPs纳入遗传度的估计。我们采用GCTA的方法,利用所有SNPs计算亲缘关系矩阵,并纳入中国人群肺癌的患病率以转换为易患性模型,估计原始芯片及填补后的SNPs所能解释的肺癌遗传度,并估计了既往GWAS报道区域的遗传度大小;比较了不同性别、吸烟状况亚组的遗传度差异;同时,我们还研究了各染色体上位点的遗传度与染色体长度之间的关联。研究结果显示,中国人群肺癌GWAS芯片中常见SNPs所解释的遗传度为15.2%,全基因组填补后所解释的遗传度为31.2%。迄今GWAS报道的易感SNPs或区域(报道SNPs的上下游各250kb或500kb)能解释极小的中国人群肺癌遗传度(0.7%1.1%)。GWAS芯片上所有SNPs对男性和女性肺癌患者解释的遗传度分别为15.3%和24.3%,非吸烟者和吸烟者分别为22.5%和14.4%,但未见显著的组间异质性。各染色体上的所有SNPs所解释的遗传度与染色体长度呈现较强的线性关联(P=0.001)。调整染色体长度后,6号染色体可解释最多的遗传度,提示6号染色体可能存在较多潜在重要或较强效应的遗传变异,而1号染色体则解释了相对较小的遗传度。上述结果表明,除显著性位点之外,GWAS芯片上其他SNPs可以部分填补中国人群肺癌遗传度的缺失,提示除了满足严格GWAS P阈值标准的位点之外,GWAS芯片上可能存有更多潜在重要的位点。第二部分基于全基因组关联研究的亚洲人群肺癌易感性区域的功能注释本研究基于可获取原始数据的亚洲人群肺癌GWAS数据库,包括本课题组前期的中国人群肺癌GWAS和公共数据库申请的亚洲人群(包括中国大陆、韩国、日本、新加坡、台湾和香港等)非吸烟女性肺癌GWAS。经过质量控制、全基因组填补、关联分析后,对两个数据库结果进行Meta分析,鉴别新的易感位点。然后根据以下标准:(1)Meta分析中P<1×10-4,两个子研究关联方向一致且P均小于0.05,异质性P值>0.05;(2)亚洲人群已报道的SNPs及其高LD的SNPs,共纳入4,195个SNPs进行后续的功能注释。采用ANNOVAR对外显子和调控区域的位点分别进行功能注释,外显子区域的非同义位点综合运用多种生物信息学预测方法(包括SIFT,Polyphen-2,PROVEAN,LRT,MutationTaster,GERP++,FATHMM和DANN等),评价其对蛋白质功能改变的影响。分别使用ENCODE数据库中肺癌细胞系A549组蛋白修饰H3K4me3和H3K9ac代表潜在的启动子区域,H3K4me1和H3K27ac代表活化的增强子区域。为了鉴别重要SNPs或重要调控区域的靶基因,我们基于GTEx正常肺组织和TCGA肺癌组织的基因表达和各自的多态性分型数据,分别进行了基因型-表型关联分析,以获取基因表达相关的数量性状位点。同时,还基于TCGA中肺癌及癌旁组织的表达数据进行基因的差异表达分析以鉴别重要基因。Meta分析发现6p22.1的三个新位点(rs9259876,A>G,OR(95%CI)=1.29(1.18-1.41),P=1.44×10-8;rs9259050,G>A,OR(95%CI)=1.19(1.27-1.12),P=2.73×10-8;rs28465400,T>C,OR(95%CI)=0.85(0.80-0.90),P=4.40×10-8)与亚洲人群肺癌易感性有显著关联,并且验证了亚洲人群27个已报道位点。随后,我们将肺癌GWAS提示的统计关联位点与相关功能特征进行整合,发现122个肺癌易感性相关的潜在功能性位点(20个位于外显子区域;102个位于调控区域,其中85个位于启动子,56个位于增强子区域),并将其与亚洲人群已报道区域结合,发现这些功能位点分别位于11个已知区域和13个新区域。综上所述,本研究基于亚洲人群肺癌GWAS数据进行了系统的生物信息学分析,对肺癌易感性相关的遗传变异进行功能注释,发现了多个有潜在功能(改变编码蛋白功能或调控基因转录)的位点和区域。该注释方式有助于高效地鉴别潜在的功能性位点,为后续的功能研究提供方向,有助于更好地理解亚洲人群肺癌发病的遗传易感机制。
其他文献
新闻语言是传播者通过传播媒介向受众传播新近发生的事实、传递有新闻价值的信息的载体。它作为媒体传递信息的工具,是一种社会公共语言行为。是社会语言的一部分,同时又对社
不久前,中科院发布的《中国科学发展报告2009》,首次对中国内地31个省区市的科学发展水平进行评估与排序。其中,我省科学发展总体水平仅次于北京、上海、天津3个直辖市,列第4
机械通气是治疗各种呼吸衰竭的重要方法之一,此类患者经常需要留置胃管进行负压引流或鼻饲,有效地插入胃管对帮助患者恢复作用关键。但对于机械通气患者会出现不能一次成功置
“迈向顶尖大学计划”旨在提升大学国际竞争力。文章介绍了该计划出台的背景、内容和实施的情况。台湾和大陆两个地区有着同根生的历史与文化传承,故关于台湾高等教育的研究对
我国的母语教育历来十分重视文体研究,文体论是文章学研究的一个重要分支。小学语文教材中的课文体裁丰富多样,不同体裁的课文必须采用不同的教法,教师自然也就必须要了解相
国际投资法体系自上世纪九十年代以来发展迅猛,但也面临多重合法性危机,其中最棘手的问题是片面保护投资者和忽视东道国公共利益导致的不平衡。因此,有必要引入规制权以平衡
学生的核心素养是一种综合素质,是在信息化时代中能够独立处理信息、筛选信息、运用信息解决生活中实际问题的一种能力,以及在解决问题过程中表现出来的品格、方法、思想与观
初中文言文课堂教学方式的研究十分必要。初中文言文课堂教学方式需尊重文言习性与促进学生发展,学习策略应符合文言特征及学生心理。
随着高中语文新课程标准的出版,关于语文核心素养的研究日渐增多,研究者们都在探索如何将语文核心素养的培养落实到实际的教学之中,这也是未来很长一段时间的研究重点。在高
飞机起航,帆船出海,都有一个起点,语文教学也有一个起点,那这个起点在哪里呢?沈大安先生说:"要上好课,文本细读是基础。"语文教学的起点在文本解读,因此,教师首先要静下心来,潜心