三种鸟类转录组测序与NADH家族的进化研究

来源 :安徽师范大学 | 被引量 : 0次 | 上传用户:lingyuehqu2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
线粒体在氧化磷酸化复合物(OXPHOS)产生能量的过程中起着至关重要的作用。复合物I(NADH:泛醌氧化还原酶)是OXPHOS系统中最大的且是第一个酶,包括核基因和线粒体基因编码的蛋白质。迄今为止,在脊椎动物,如鱼类,两爬类和哺乳类中,已报道了许多关于OXPHOS适应性进化的研究。然而,关于鸟类NADH家族的自然选择模式和系统发育意义仍然不清楚。在本研究中,我们对三种燕雀小目鸟类进行转录组测序,并结合已释放的数据,探讨以下科学问题:(1)红嘴相思鸟、麻雀和画眉转录本的特征;(2)NADH家族线粒体编码的基因进化速率与核编码的基因的进化速率比较;(3)鸟类与哺乳类、两爬类进化速率分析;(4)燕雀小目的系统发育关系。主要研究结果如下:1.高通量测序及序列组装本研究采用Trizol法提取红嘴相思鸟、麻雀和画眉总RNA,构建c DNA文库,使用Illumina Hi Seq TM 2500测序平台进行转录组的双端测序。经过原始数据的组装和质控分析后,发现画眉的原始序列数最少,有9,115,852,062条,且原始序列碱基数为60,530,122bp;而去除低质量片段后序列数有58,616,456条,占原始序列数96.84%;麻雀的原始序列数最多,有10,534,487,628条,且其原始序列碱基数为69,904,416bp;去除低质量片段后序列碱基数有9,465,945,091bp,占原始序列碱基数89.86%;麻雀组装后的unigenes最多,共有237,822条,为145,747kb,N50长度为751bp,unigenes平均长度为612bp;而红嘴相思鸟组装后的unigenes最少,共有198,193条,为142,511kb,N50长度为739bp,unigenes平均长度为604bp。2.转录本的功能注释本研究将三种鸟类转录组数据与七个常用功能注释数据库比对。结果显示在数据库中均有注释信息的unigenes最多的为麻雀,共4487条;最少的为红嘴相思鸟,共2282条。在KOG的24个注释类别中,一般功能预测基因(R)和信号传导机制(T)中注释的unigenes最多。在KEGG通路数据库注释中,发现麻雀(Passer montanus),红嘴相思鸟(Leiothrix lutea)和画眉(Garrulax canorus)转录组中的分别有6,600、6,405和6,488 unigenes成功注释并映射到不同的代谢途径;三种鸟类转录组数据中unigenes,新陈代谢过程注释占多数。在unigenes蛋白序列归类为GO数据库过程中,三种燕雀小目鸟类的unigenes的GO分析分布高度相似。基于SSR初步分析结果发现麻雀的转录组数据中含有的数目最少(48,460),包含42,736条SSR序列数;而在画眉的转录组数据中含有的SSR数目最多(57,198),包含44,460条SSR。此外,在三种鸟类转录组SSR串联重复序列分析中,单碱基串联重复型占的比例最多。3.进化速率分析(1)鸟类进化速率分析本研究序列以斑胸草雀的编码NADH家族的基因为模板,使用本地blast软件鸟类NADH家族编码基因进行搜索和提取。通过进一步的筛选,有65种鸟类的48个基因供后续分析。分别采用Datamonkey软件的SLAC,FEL,REL模型以及PAML软件的位点模型来筛选正选择位点;同时使用枝-位点模型来判断特定枝系的位点之间信息。其次,我们比较了线粒体编码基因与核编码基因的进化速率,并通过IBM SPSS Statistics v.23软件的配对样本T检验,来评估组间显著性差异。此外,使用Tree SAAP软件来检测上述至少两种方法筛选的正选择位点,其氨基酸在蛋白质水平上的物理化学性质。研究表明,基于SLAC,REL,FEL和位点模型的结果,在鸟类NADH家族编码核心成员的基因中,有三个线粒体编码的基因(MT-ND2,MT-ND4,MT-ND5)与三个核编码的基因(NDUFS1,NDUFS7,NDUFV2)分别发生了潜在的正选择作用。通过物理化学性质变化的分析,我们发现有72.92%的氨基酸位点发生了强烈的变化。在我们的研究中,编码NADH家族非核心成员的核基因的进化速率最快,而编码核心成员核基因的进化速率最慢。通过平均d N/d S(ω)的分析,我们发现编码核心成员的线粒体基因与编码核心成员核基因之间存在着显著差异;编码非核心成员的核基因与编码核心成员的线粒体基因之间存在着极显著差异。通过与加速基因和参考基因进化速率的比较,非核心成员的核编码基因的平均ω值大于加速基因,参考基因的平均ω最小。此外,NDUFV3基因的ω值最大(0.68),而RPS7基因的ω值最小(5e-09)。(2)鸟类与哺乳类、两爬类进化速率的比较分析本研究中,通过比较核心成员的线粒体编码基因的平均ω,我们发现鸟类与哺乳类、两爬类之间分别存在着极显著差异。值得注意的是,基于SLAC,REL,FEL和位点模型的分析,发现在NADH家族核心成员的编码基因中,鸟类与哺乳类、两爬类的MT-ND5发生了可能的正选择作用;而在非核心成员的编码基因中,鸟类与哺乳类、两爬类的NDUFA9,NDUFA10,NDUFB9和NDUFS5可能经历了正选择作用。在两爬类中NDUFV3基因的ω值最大(0.56)。4.系统发育分析本研究基于编码复合物I核心成员的七个线粒体基因和七个核基因构建MP,ML和BI系统发育树,发现它们具有相似的拓扑结构。两类数据构建的系统发育树的主要差异在于褐背拟地鸦的系统发育地位。本课题采用高通量测序方法以及结合已释放的数据,进行鸟类NADH家族进化研究。同时,我们比较了鸟类、哺乳类和两爬类的NADH家族编码基因,加速基因和参考基因的进化速率。此外,通过NADH家族核心成员编码基因构建系统发育树,探讨燕雀小目的系统发育目前存在的问题。本研究结果为进一步深入探讨鸟类NADH家族分子进化的机制奠定了基础。
其他文献
教师专业发展在取得可喜进展的同时,在整体素养、发展动力、专业理解和价值取向等方面还存在一些值得反思与检讨之处。教师专业发展应当有大视野,形成大格局。教师应当是真正
介绍某砖混房屋墙体裂缝的分析过程和处理方案,墙体加固采用了砖砌体粘钢筋加固法,处理效果良好。
光催化裂解水制氢是解决能源问题的一个新途径,很多研究者投入此课题的研究。文中考察了国内外光解水制氢的研究现状,综述了半导体多相光解水制氢设备的构成,对有代表性的新
上级与下级并不是简单地领导与被领导关系,两者之间错综复杂,恰似舞步,如果两者相处和谐,齐心协力,则整个团队显得优美流畅,进退自如,反之,则处处磕磕绊绊,进退两难。
放弃7做高级打工仔安稳生活的孙友峰认为.创业是一种宿命.一旦这个想法产生.这辈子不会再去想别的事情
<正>现在各类名人讲坛在媒体播放都是非常的"火",因为讲坛的内容往往都是这些专家精心准备的,包含着专家们多年的积累。在讲坛中,我们可以听到百家之言,可以在较短的时间内获
北京十一学校李希贵校长,20多年前,是一名乡村语文教师,其后历任山东高密四中校长、高密一中校长、高密市教委主任、潍坊市教育局局长,连续进行诸多教育管理改革与创新,使山
学校体育是培养体育人才,普及体育运动的基础所在,而社区体育则是丰富公众业余生活,推广全面健身的有效途径,二者的融合则是现代体育的基本发展路向。但学校体育与社区体育尽
越来越多的外行梦想学习金六福,用制造外包品牌自创的方式,赚取那看似门槛很低的白酒暴利,但是事情并不那么简单