基于转录组数据的异翅亚目系统发育研究

来源 :南开大学 | 被引量 : 0次 | 上传用户:mini8912
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着新一代测序技术的普及和推广,高通量测序获得的大规模数据为现代生物学研究提供了传统测序技术难以企及的海量数据基础。高通量测序的快速发展和测序价格的不断降低使得基于成百上千个基因进行系统发育重建的研究和非模式生物基因组数据的获得成为可能。目前,绝大多数基因组或者转录组数据仍然集中在少数的模式生物或者是在疾病传播过程中发挥重要作用以及具有重要经济价值的生物中。但是在进化生物学中具有重要节点意义的生物中,虽然已有一些转录组水平的数据,但是相比于高级阶元类群的多样性来说仍然十分匮乏。异翅亚目昆虫是物种多样性最为丰富的非完全变态昆虫中辐射进化最成功的类群,以往异翅亚目高级阶元的系统发育研究大多是基于形态学性状或者是少数几个基因片段、线粒体基因组给出的结果,并且没有达成相对统一的认知。本文以异翅亚目七个次目的代表性类群和蝽次目五个总科的代表类群作为研究对象,进行了基于IlluminaHiseq2000测序平台的转录组测序分析,完成了蝽类昆虫高级阶元的比较转录组学分析,主要包括三个部分。  第一部分,异翅亚目昆虫高级阶元的转录组数据分析。利用IlluminaHiseq2000测序平台体系获得了异翅亚目7个次目的20个物种的转录组数据。每个转录组经过读段清理后的数据量均在4G左右,经过fastqclean质量控制对原始数据的读段清理、Trinity序列拼接、BLAST2GO序列注释、KEGG代谢通路分析、简单重复序列SSR分子标记开发等数据处理流程,发现得到注释的基因比例从31.6%到69.6%不等,绝大多数被注释的基因都在生物体维持正常生命活动的过程中(新陈代谢通路、RNA运输和肌动蛋白细胞骨架调控等)发挥着重要的作用,不同物种的GO注释分布几乎不存在偏差。此外,在20种异翅亚目昆虫的转录组数据中均发现了一系列和杀虫剂抗药性以及外源毒素代谢相关的P450超家族基因,为研究重要经济类害虫的抗药性机制和有效的防治提供了丰富而重要的序列数据。利用转录组数据在每个物种中都找到了数千个简单重复序列SSR,利用Primer3软件开发的SSR分子标记,可以在今后的种群生态学、景观遗传学、谱系地理学等相关研究中发挥重要作用。根据蛋白质矩阵的分组和比对,发现了559个类群特异性位点,分属于339个直同源基因,这些类群特异性位点的获得为进一步解析不同栖息环境对生物的选择压力和推断分歧时间奠定了重要的数据基础。  第二部分,基于转录组数据的异翅亚目分子系统学研究。迄今为止的异翅亚目各次目系统发育研究结果仍存在较大争议。本研究选取21个异翅亚目类群和3个连续外群为代表,利用HaMStR数据处理流程和1886个直同源基因参考数据集,获得了由1016个直同源基因组成的拥有318060个氨基酸位点的超级矩阵,采用最大似然法和贝叶斯分析等方法进行系统发育分析,分析结果支持((奇蝽次目+黾蝽次目)+(蝎蝽次目+(细蝽次目+(臭虫次目+(鞭蝽次目+蝽次目)))))。各次目的单系性得到了很好的支持,各次目的关系得到了高支持率的解析,其中鞭蝽次目的位置与原有的认知发生了偏差,除此之外,此结论与Wheeler等人所得结论相似,而不同于以往基于形态学数据、18SrDNA或线粒体基因组序列所提的结论。通过分析,矩阵中有97.2%的直系同源基因给出了一致的系统发育信号,并不存在大量的系统发育信号杂音,我们考虑可能是不平衡分布的缺失数据被作为共有衍征而将原本远缘的分支错误地聚在一起。  第三部分,基于转录组数据的蝽次目分子系统学研究。截至目前为止,蝽次目内部各总科之间的关系还存在一定争议。本研究选取蝽次目5个总科的9个物种作为研究内群,3个臭虫次目的转录组数据作为研究外群,通过HaMStR数据处理流程和1886个直同源基因核心参考数据集进行直同源预测,利用与异翅亚目系统发育分析相同的超级矩阵,采用最大似然法和贝叶斯分析等方法进行系统发育分析,分析结果支持毛点类昆虫的单系性,蝽次目内部呈现(扁蝽总科+(蝽总科+(长蝽总科+(红蝽总科+缘蝽总科))))的关系,与基于形态数据和Hox基因的分析结果一致,而不同于以往基于其他分子标记或者线粒体基因组数据的分析结果。与很多基于大规模转录组数据的系统发育研究相似,本实验结果与基于形态矩阵或者传统的系统发育关系保持一致。
其他文献
研究背景:生物活性多肽是机体内部一类重要的细胞间信号传递分子.几乎所有的生物活性多肽前体原序列的N端都存在一段信号肽序列,这段序列能帮助活性多肽分泌到细胞周质中或者
按照国家电网公司建设坚强智能电网的总体要求,业界正在大力进行用电信息采集系统建设。在用电信息采集系统中,专变采集终端是采集使用专用变压器的用户用电信息的设备,大多
多氯联苯(Polychlorinated Biphenyls,PCBs)是一种人工合成的有机物,由于其性质稳定不易燃烧,绝缘性能优良,在工业上得到了广泛的应用。现在已造成了严重的环境污染。由于PCBs广
许多疾病可直接或间接引起机体低氧,在中国死亡率前四位的心血管病、脑中风、肿瘤和呼吸系统疾病中,造成机体损伤及最后导致机体死亡的首要原因就是低氧或缺氧.因而如何提高
电力系统综合负荷建模是电力系统仿真的重要基础,仿真采用传统综合负荷模型典型参数与实际情况愈加不符,开发基于总体测辨法和统计综合法的电力系统负荷建模平台是负荷建模工程实现的重要途径,其丰富负荷特性数据的高效管理是负荷建模平台有效运行的重要保证。本文基于大量的负荷建模数据进行初步挖掘,并在此基础上构建了负荷平台数据库。本文统计综合法建模中采用SOM神经网络对山东220kV变电站进行聚类分析,得出变电站
输电线路是电力系统的重要组成部分。目前在电网停电事故中,大部分是由于各种输电线路发生故障引起。高压输电线路一旦发生故障,将引发大规模输电环节中断,保障高压输电线路正常
胚胎干细胞是(ES)一类来源于人或动物胚胎发育早期阶段中囊胚时期内细胞团的多能干细胞,它既可以不断的自我更新又可以进行多向分化。在体外,经诱导培养基培养,胚胎干细胞几乎可
近年来,随着世界范围能源压力以及超大规模电力系统的各种弊端的日益显现。以太阳能光伏发电系统、风力发电等为代表的分布式发电技术获得了越来越多的重视与应用。然而,分布式
电弧风洞在航空航天领域主要用于模拟飞行器再入大气层时的高温高压环境,评估飞行器的防热材料、气体动力布局等系统性能。作为电弧风洞的主要组成部分,电弧加热器对电弧风洞的试验性能起着决定性的影响。随着我国航空航天事业的蓬勃发展,对电弧风洞的试验能力要求进一步提高,提升电弧加热器电源系统的功率等级也被提上了日程。论文首先研究等离子电弧的负载特性,其负阻抗伏安特性决定了电源必须具有“下垂”的恒流输出外特性从
在规模越来越大、区域间联网越来越紧密的电网发展背景下,电力系统发生各类故障时所造成的危害越来越严重,这就对电网故障诊断系统的实时性、准确性和可靠性提出了更为严格的要求。为规避掉传统的基于SCADA和故障信息系统的电网故障诊断系统中存在的开关、保护的拒动、误动问题,以及信道干扰等影响因素,本文研发了一个基于广域监测系统(WAMS)中的同步相量测量单元(PMU)的实测数据的电网故障诊断系统。本文完成了