论文部分内容阅读
除南极洲外的所有大陆上都分布有地下洞穴。地下洞穴环境的最大特点是没有阳光,表明很难进行光合作用,因此也没有生产者。尽管某些地下洞穴会栖息大型蝙蝠,其中的洞穴生物可能会以蝙蝠粪便为食,但多数洞穴生物只能依赖从地表洪水等偶然带入的食物。因此食物因素可能是洞穴生物代谢、行为和感官适应发展的重要选择压力。洞穴鱼是地下洞穴中生存得最成功的一个脊椎动物类群,受限于地下黑暗的洞穴环境,它们面临着相似且严峻的生存挑战,如有机物匮乏且来源具偶然性、视觉失去作用需要依靠其它感官进行活动等。尽管洞穴鱼有多次起源,但所有的典型洞穴鱼都面临着相似的环境,并且产生了相似的演化特征,如眼睛退化、色素消失等。一直以来洞穴鱼类的演化都备受关注,也取得了诸多进展,但仍有以下问题尚待解决,如自然选择在洞穴鱼类适应性演化过程中扮演着怎样的角色?洞穴鱼类趋同表型产生的基因组学基础是怎样的?目前已有两种洞穴鱼类基因组公开发表,但是由于这两个基因组倍性的不同,比较分析存在困难,因此需要另选一种有代表性的洞穴鱼进行基因组测序用于比较基因组学分析。高原鳅属洞穴鱼类物种丰富,且存在亲缘关系较近的地表种,是基因组研究的极佳选择。因此本研究以高原鳅属洞穴鱼玫瑰高原鳅(Triplophysa rosa)为主要研究对象,通过其转录组和全基因组测序,结合已有洞穴鱼类基因组数据,试图从比较转录组学和比较基因组学角度来回答上述问题。主要研究内容如下:1、基于玫瑰高原鳅和贝氏高原鳅比较转录组学研究揭示玫瑰高原鳅眼睛退化的潜在机制。对这两个物种的转录组进行测序以鉴定差异表达基因(DEGs)和正选择基因,分析共鉴定出4,802个差异表达基因(DEG)和50个正选择基因(dN/dS>1,FDR<0.1)。对差异表达基因进行GO富集分析,发现一个与晶状体相关的GO类别(GO:0005212)在下调表达基因中被显著富集。玫瑰高原鳅眼睛发育相关基因(pitx3,lim2,crx,gnat2,rx1,rho,prph2和β|γ-crystallin)表达下调,这些基因与晶状体/视网膜的发育和维持有关,这一结果表明玫瑰高原鳅眼睛的退化很可能与多基因的下调表达有关,并且这些基因的表达异常带来的表型变化与形态学的研究结果一致。将玫瑰高原鳅的差异表达基因与其它洞穴鱼类的差异表达基因进行比较发现,多数差异表达基因在各个洞穴鱼类中的表达趋势基本是一致的。基于转录本编码序列的进化分析结果表明,与‘地表鱼’贝氏高原鳅相比,玫瑰高原鳅蛋白质编码序列的同义替换率(dS值)较低,但非同义替换率(dN值)较高,这表明玫瑰高原鳅基因组可能具有较低的进化速率,蛋白质序列却具有相对较高的进化速率。另外,与光感知和光刺激相关的视觉基因具有相对较高的进化速率(一些基因dN/dS>1但FDR>0.1)。然而,这些与视觉直接相关的基因与其他所有基因相比并不具有更快的进化速率。并且本研究鉴定出的50个正选择基因并不包含与视觉直接相关的基因,表明玫瑰高原鳅眼睛的退化可能与放松选择有关。总之,基于比较转录组学的研究表明,玫瑰高原鳅的基因组可能具有特殊的演化模式。但转录组数据无法包含全部基因,且仅基于玫瑰高原鳅和贝氏高原鳅的比较转录组学分析具有一定的局限性,无法全面阐释不同起源洞穴鱼类的基因组演化模式。因此,对玫瑰高原鳅进行全基因组测序组装,结合已有洞穴鱼类基因组数据,从比较基因组学的角度全面阐释洞穴鱼类洞穴适应的基因组学特征显得十分必要。2、玫瑰高原鳅染色体水平的基因组测序和组装。基于Illumina,PacBio测序和Hi-C技术组装玫瑰高原鳅基因组,共获得了141 Gb的Illumina clean reads、11.6 Gb的PacBio clean reads和111.29 Gb Hi-C测序数据。以二代测序数据为基础,以三代测序数据和Hi-C测序数据为辅助进行了组装并构建了染色体级的基因组:玫瑰高原鳅共25条染色体,25条染色体长度为638.47 Mb,全基因组总长度为675.5Mb。与西藏高原鳅的共线性分析表明,玫瑰高原鳅染色体组装准确。基于从头、同源和转录本的三种基因集预测方式在玫瑰高原鳅基因组中共预测了26,027个蛋白质编码基因,其中约95%的基因获得了公共数据库中的功能注释。基因集完整性评估表明,玫瑰高原鳅基因集的完整性高达95.3%,表明了高质量的基因组组装和基因集预测。结合洞穴鱼墨西哥丽脂鲤和安水金线鲃(四倍体)基因组数据,进行了初步的比较基因组学分析,结果表明,安水金线鲃基因组加倍导致其许多的基因拥有冗余的拷贝,从而使得直系同源单拷贝基因数量大大减少,因此常规分析在安水金线鲃中难以获得足够多的基因用于比较基因组学分析。总体而言,高质量的基因组组装不仅为玫瑰高原鳅的种群多样性研究和保护提供了宝贵资源,并且为进一步研究整个洞穴鱼类的洞穴适应机制打下了基础。3、基于三种洞穴鱼类全基因组数据的比较基因组学分析。根据鲤鱼基因组的研究结果,将金线鲃基因组基因集区分到亚基因组基因集,通过比较三对洞穴鱼类及其近缘地表鱼的全基因组基因集序列,探讨了洞穴鱼类表型趋同的全基因组演化特征。研究结果揭示了洞穴鱼基因组进化的几个共有特征:(1)洞穴鱼类基因组的进化速率比其近缘地表鱼低;(2)洞穴鱼类基因组的非同义替换率与同义替换率的比值(即dN/dS)高于其近缘地表鱼,这与放松净化选择作用于全基因组的结果一致。并且,由于蛋白质疏水性的改变可能导致有害突变的增加,因此,洞穴鱼类基因组承受着增加的突变负荷;(3)脂质代谢相关基因在所有洞穴鱼类基因组中都处于放松净化选择之下,这可能与洞穴鱼类食物资源的匮乏有关。在食物资源缺乏的情况下,通过降低代谢速率并增加脂肪积累是一个很好的解决方案,而低的代谢速率很可能导致基因组进化速率的降低。尽管3种洞穴鱼均有这些相似的全基因组演化模式,但不同种洞穴鱼基因组中正选择与放松选择的基因之间并无重叠,表明洞穴鱼类的表型趋同可能并非由同一组基因的趋同演化引起。因此,本研究揭示了以前尚未揭示的洞穴鱼类基因组演化模式。综上所述,本研究基于比较转录组学分析从分子水平上揭示了玫瑰高原鳅眼睛退化的潜在机制。基于二代、三代测序技术对玫瑰高原鳅基因组进行了染色体水平的组装,获得了高质量的基因组和基因集。结合已有洞穴鱼类基因组数据,基于比较基因组学分析揭示了洞穴鱼类基因组的特殊演化模式。本研究为洞穴鱼类的基因组演化模式提出了新的见解,为洞穴生物趋同演化机制的深入研究提供了新的启示。