论文部分内容阅读
骨鳔下区类群(Otocephala)包含了骨鳔总目和鲱形总目,代表了整个鱼类四分之一的物种多样性,约包含了1000个属和超过7000个种。关于该类群内部的系统发育关系一直存在争议,例如有研究认为鼠鱚目与鲱形总目的关系较耳鳔系为近,尤其是近年来脂鲤目的单系性问题不断被质疑,对于脂鲤亚目、琴脂鲤亚目和电鳗目、鲇形目之间的关系有诸多假设。对于骨鳔下区类群的起源时间也没有定论,较为统一的观点是该类群起源于泛古陆时期,但是各个研究对于该类群起源的时间分歧较大。而化石记录推断的时间普遍要晚于基于化石和分子序列联合推断的分化时间,所以分子序列的包含的信息量度非常关键。第二代测序技术应用以来,尚未有研究使用高通量数据针对骨鳔下区类群进行系统发育重建,对于骨鳔下区类群的起源以及生物地理格局迫切需要借助系统发育基因组学的手段进行进一步的研究。 本研究选取骨鳔下区类群14个代表性物种,利用RNA-seq技术测序了13个物种的转录组并从NCBI上下载一个物种的基因组,结合Ensembl平台上提供的8个物种的全基因组数据构建的直系同源数据库进行直系同源基因的定位,并首次将偏倚排查的方法运用到鱼类系统发育研究中,通过最大似然法和贝叶斯法的分析重建骨鳔下区类群的系统发育关系,并选取权威的化石标定时间估算该类群的起源时间。主要的结果归纳如下: (1)我们以肝组织RNA(主要为mRNA)为信息来源利用RNA-seq技术平台获取13个物种遮目鱼、双孔鱼、胭脂鱼、贵州爬岩鳅、泥鳅、真鳍岐须鮠、断线脂鲤、六带复齿脂鲤、线翎电鳗、双须骨舌鱼、鲇、黄颡鱼、大孔鮡的双端测序的转录组数据以及从NCBI上下载的欧洲鲲的基因组数据,获得了20659183-75051720个原始reads数据,对位到的reads为15310524-66260774个,在对每一个原始数据进行低质量如模糊的“N”碱基、接头等序列的过滤后丢弃包含超过10%的Q值小于20的碱基的序列,最后排除掉短于60bp的序列和通过与silva数据库比对出的rRNA,最后分别用Trinity进行从头组装,即通过组装转录本构建Unigene库,并对Unigene库进行注释。14个物种的Unigene包含40041-1163967条长度>200bp的序列。 (2)我们从Ensembl上下载8个模式物种斑马鱼、红鳍东方鲀、日本青鳉、罗非鱼、剑尾鱼、三刺鱼、绿点河豚、大西洋鳕的基因组以及其一对一的蛋白直系同源关系,生成了由25572个pHMM文件和188251个直系同源序列(每个直系同源关系至少含5个模式物种的序列)组成的直系同源基因搜索库,用于直系同源基因的搜索。 (3)本研究选择HaMStR软件作为搜寻单拷贝直系同源基因的工具,将组装的Unigene库投入直系同源基因搜索库,获取了9619-19709个直系同源基因clusters,对这些直系同源基因clusters运用生物信息学手段进行同位点序列的合并,最后获取了22个物种共有的1452个直系同源基因。在分别比对后我们用Gblocks进行了剪切,按>60bp的长度标准进行过滤,最后获取了1110个直系同源基因(联合后每条序列理论上含13654221个碱基对,4551407个氨基酸,平均缺失率为8.6%)。 (4)通过系统发育分析,我们获得了骨鳔下区类群目之间的拓扑结构:((((((脂鲤亚目+电鳗目)+琴脂鲤亚目)+鲇形目)+鲤形目)+鼠鱚目)+鲱形目)。本研究不支持脂鲤目的单系性,认为电鳗目很可能是脂鲤目一个特化的类群,在极短的时间内分化而成。推断骨鳔下区类群约在173.1Mya开始分化(95%的置信度为191.0-155.8Mya),处于侏罗纪中期的阿连阶,略早于泛大陆开始分化的年代,可以解释为泛大陆的分化时期频繁发生的地壳运动事件使得骨鳔下区类群得以从海水适应性进化到大陆板块中的淡水区域中。骨鳔总目的分歧时间为151.3Mya,耳鳔系的分歧时间为128.4Mya,鲤形目为63.1Mya,鲇形目为59.2Mya。 (5)我们推测的琴脂鲤亚目和(脂鲤亚目+电鳗目)的分化在89.0Mya,处于晚白垩纪的土仑阶,这与脂鲤目的目前分布状况和古地理学事件的地质推断时一致的,而脂鲤亚目和电鳗目的分歧在12.0Mya发生,处于第三纪中新世时期。我们推断在早白垩纪的大规模海侵事件影响下,一部分电鳗目和非洲脂鲤亚目的祖先进入非洲进化为非洲脂鲤亚目的类群,而有一小部分因为地壳构造事件被隔离在某流域(极可能为奥里诺科河)中,成为电鳗目的祖先,其他的则进化为南美脂鲤亚目。