进化中新基因的鉴别和重注释

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:lishibo13514244774
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自从1993年发现第一个新基因精卫(jingwei)以来,关于物种特异性或系特异性基因在进化中如何起源的问题获得越来越多的关注。多种新基因起源的机制被发现,包括DNA水平复制,RNA水平复制,从头起源,水平基因转移等。新基因机制的研究依赖于准确的新基因鉴定。新基因是进化历史上近期出现的,在系统发生上分布有局限性。因此,注释新基因产生时间的方法,目前的策略是依据系统发生树上直系同源基因的分布进行推断。我们根据这种策略,采用两种方法对基因年龄进行注释。第一种是传统上对于单基因的系统发生方法,本文使用这种方法对涉及植物从水生环境适应陆生环境的两个重要基因进行研究;第二种方法是在传统方法的基础上,利用全基因组共线性比对结果,进行全基因组基因年龄注释。我们利用Ensembl的基因注释信息,对包括人,小鼠和鸡等六个物种的所有已注释基因进行年龄注释,同时也对来自Refseq, Ensembl和UCSC数据库的人和小鼠的长非编码RNA进行年龄注释。完成基因的年龄注释时我们注意到,物种特异性基因在不同Ensembl版本中的数目有相当的波动。这种版本间的不一致使我们意识到,Ensembl的基因注释对于年轻的基因是不稳定的,甚或是不可靠的。Ensembl基因注释面临的难关之一是无法正确区分那些通常由DNA水平或RNA水平复制产生的新蛋白编码基因和假基因。为解决人类基因注释中的这个问题,我们使用来自peptideAtla, ProteomicsDB口Human Proteome Map多个质谱数据库中的肽段序列,验证Ensembl的假基因是否真正无法翻译。我们检测到116个假基因至少有一个质谱产生的多肽唯一匹配覆盖。其中有超过60个是灵长类特异性基因。说明有相当部分的新编码基因在主流的基因注释(如:Ensembl)中被错误注释成假基因。除新基因起源机制的研究外,新基因多样性的功能使其在表型进化中的重要性也日益得到认可。我们正努力地开发一款在线数据库(http://gentree.ioz.ac.cn/),可以展示我们在新基因的鉴定和重注释方面的数据。以后,相信这款数据库会成为进化研究和功能学研究方面的服务型资源,并且能帮助新基因的研究领域取得更多的成果。
其他文献
<正>"有人问,‘概论’是什么课程?我觉得,‘概论’课是灯,老师就是掌灯的人。每次听完都感觉动力满满、信心十足。"这是郑州电力高等专科学校电力工程系发电1806班高永江4月2
研究质量分数为1%的高胆碱膳食对健康小鼠肠道菌群组成及代谢的影响。选取20只C57BL/6J小鼠,随机分成正常饮食组(CK)和1%高胆碱膳食组(CHO)。处理60 d后,采用宏基因组测序技
非酒精性脂肪性肝病(NAFLD)是指除酒精和其他明确因素如病毒性肝炎、药物性脂肪肝等所致,与胰岛素抵抗以及代谢综合征密切相关的疾病,包括单纯性脂肪肝(NAFL)及由其演变的非
本研究在前期获得两株α-苯乙胺降解菌的基础上,研究了两株菌株P1、P2生长状况、不同接种量对其生长和降解效果的影响、两株菌在不同基质环境下的耐受能力,最终从两株菌中择
孝道是中华民族伦理道德的基石,也是中华传统文化的重要组成部分,并从一定程度上保证了封建社会的持续稳定发展。现如今,孝道伦理不断式微,严重的影响着我国养老事业的发展及
高速公路交通事故发生后,交通管理部门需要对交通事故现场进行临时交通管制和应急处置,前提条件则是需要工作人员根据事故路段类型及事故形态对事故现场隔离区域进行科学、合
文中对储能飞轮转子支撑系统的转子动力学问题进行了研究,推导出各部件的动能、势能和耗散函数,基于拉格朗日方法建立飞轮转子支撑系统的动力学数学模型,并进行求解。采用ANS
目的合成没食子酸氧钒配合物(GAOV),并对其进行表征,优化合成工艺,考察GAOV的急性毒性,探究其体外抗氧化活性、体内和体外降糖活性。方法以没食子酸为配体,硫酸氧钒为钒源制备GAOV,分别考察反应时间、pH、反应温度、投料比对GAOV合成产率的影响,采用正交试验设计法,优化GAOV的合成工艺。采用UV-vis、DSC、IR、XRD、TGA等方法对GAOV进行表征。参照国家急性毒性试验标准对GAO
目的对比分析两种狂犬病疫苗的预防效果,为控制及预防狂犬病的发生提供方法与指导。方法选择2008年6月~2010年6月来笔者所在中心接种狂犬病疫苗的146人,根据接种疫苗的不同分
为了解蘑菇湖水库浮游植物及水体富营养化状况,在2016年分别在丰水期(4月)、平水期(7月)、枯水期(11月)对蘑菇湖水库的浮游植物群落结构,包括浮游植物的种类构成、密度、生物