论文部分内容阅读
非编码保守元件(conserved non-coding elements,CNEs)是指在基因组中不编码蛋白质、也不编码rRNA或tRNA,但是在进化过程中极为保守的非编码序列。CNEs普遍存在于基因组中,多聚集在发育相关基因附近,在基因组中扮演着多种调控元件角色,直接或间接参与基因表达调控,影响物种的发育、表型和适应性进化。牦牛作为青藏高原特有畜种,对青藏高原的极端环境具有极强的适应能力。近来多组学研究已经从不同层面对牦牛的高原适应机制进行了研究,鉴定到一批与高原适应性相关的基因,但是相关的调控元件及其调控机制仍然缺乏系统研究。本论文通过比较基因组学鉴定牦牛基因组CNEs,并对牦牛心脏组织进行ATAC测序揭示全基因组中具有调控活性的序列,最后综合鉴定在牦牛基因组中与高原适应性相关的保守调控元件,为理解牦牛高原适应机制提供新的候选元件和新视角。首先,基于比较基因组学的方法对牛科的黄牛、欧洲野牛、北美野牛、瘤牛、大额牛、水牛、牦牛七个物种基因组序列进行多重比对,基于PhastCons软件,鉴定了3,653个具有调控功能的候选非编码保守元件,对这些CNEs附近的基因进行GO富集分析,发现有富集在出芽式血管生成、胚胎心血管发育以及血管内皮生长因子等与高原适应相关的通路上;进一步对这些CNEs相关基因进行功能注释,发现有33个与高原适应性相关,包括已被报道的与缺氧诱导途径相关基因ARNT、与血管内皮生成相关基因ANGPTL4、VAV3以及与心脏调节相关基因CAMK2D。这些CNEs可能参与调控以上基因的表达调控,从而在牦牛适应高原极端环境中发挥重要作用。其次,使用ATAC-seq技术对三个牦牛心脏组织进行了全基因组染色质开放区测序,共产生28G的原始数据,平均产出216,178,322条原始reads。进行质控和比对之后,在三个样本中共获得具有调控活性的332,265个peak,其中超过60%的peak落在基因间区,超过20%的peak落在内含子区域,表明数据质量较高且鉴定出的染色质开放区域具有功能性。最后,通过整合比较基因组鉴定的非编码保守元件和ATAC-seq的分析结果,共获得具有调控功能的252个CNEs。这些CNEs不仅是牦牛基因组中最保守的序列,而且有心脏ATAC数据的支持,因而可能具有重要的功能。对这些CNE附近的基因进行富集分析,发现主要与氧活性反应、单加氧酶活性调节、一氧化氮合酶活性调节、心脏收缩调节、以及血管紧张素受体活性等功能相关,表明这部分CNEs极有可能作为重要功能元件在牦牛适应高原环境中参与靶基因的调控表达。本研究通过比较基因组学手段系统地鉴定了牦牛基因组CNEs,借助ATAC测序技术构建了牦牛心脏全基因组染色质开放图谱,并鉴定出牦牛在适应高原极端环境中具有调控功能的CNEs。本研究从调控元件角度探究高原适应性调控机制,不仅为高原适应性调控元件的研究提供了新的遗传数据,并为理解牦牛高原适应机制提供了新的见解。