基于功能基因网络的杨树基因功能注释平台PoplarGene及其应用

来源 :中国林业科学研究院 | 被引量 : 0次 | 上传用户:cj258399542
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
林木为人们提供大量的生物质材料和能源,然而,林木的生长周期通常很长,且携带的基因组相对较大,使得在这些植物上直接进行分子生物学实验变得相对困难,杨树具有速生、容易扩繁、基因组相对较小、相对容易进行转基因研究等特征,成为木本植物研究的优良模式植物。此外,杨树在我国大部分国土均能种植,是现有人工林中适生范围最广和用途最广的林木,已成为我国人造板工业材和纸浆材的主要原料。深入了解杨树生物学过程能有效促进杨树育种与遗传改良。杨树(毛果杨)是林木中第一个被测序全基因组的物种,但是仍有大部分杨树基因缺乏功能注释,本研究构建杨树功能基因网络,并开发基于功能基因网络的杨树基因功能注释生物信息学平台,为杨树未知功能基因的功能注释提供重要信息,进一步基于杨树功能基因网络,使用开发的平台开展木材形成发育基因的生物信息学分析,为从系统层面了解木材形成提供参考。论文主要研究结果如下:1.通过机器学习方法构建杨树功能基因网络。基于毛果杨基因组及已有的不同类型数据,通过多种算法挖掘杨树功能基因关联,共获得23种不同数据来源的杨树功能基因关联集合。基于构建的训练标准集,通过机器学习算法中贝叶斯框架对功能关联进行打分,并最终整合成一个综合的基因组范围的杨树功能基因网络PoplarNet。该网络包含1967631个功能关联,节点覆盖70%的毛果杨参考基因。准确率-召回率分析表明PoplarNet比任意通过单个数据集获得的功能基因网络具有更高覆盖度和准确度,且比通过同源映射法基于拟南芥和水稻功能基因网络的杨树功能基因网络具有更高准确性和覆盖度。功能基因网络的其中一个重要功能是被用来对未知表型相关基因进行预测,通过测试发现PoplarNet在反映已知通路与预测未知通路基因方面都表现较高水平。网络基本性质分析也表明PoplarNet服从生物学网络的特征,包括无标尺网络属性和明显的模块化构成,在包含的最大的子网络中,通过聚类分析检测到24个核心模块,这些模块在杨树生命活动可能参与了重要功能。2.结合杨树功能基因网络PoplarNet和基因多角度的功能信息注释,构建杨树基因功能检索与分析的生物信息学平台PoplarGene。该平台提供直观且友好的界面,不仅提供基因功能注释信息的检索,还在其中开发多种基因分析功能,包括基于临近基因的基因排序、基于上下文的基因排序、木本植物功能基因网络同源映射、启动子顺式作用元件分析和基因集合功能富集分析功能,同时,PoplarGene平台还整合多种便利的生物信息学工具。PoplarGene可基于功能基因网络的功能关联来注释杨树未知功能的基因,显著提高注释基因的覆盖度,而且其基于网络的分析功能可用于鉴定性状相关的新候选基因。使用PoplarGene平台进行多种应用案例分析,包括(1)使用PoplarGene检索未知功能基因的功能信息,获得其多方面的功能信息注释;(2)基于临近基因的基因排序进行木质部细胞发育相关基因的相关性排序及新候选基因挖掘,使用基于上下文的基因排序分别对杨树胁迫耐受以及抗性基因进行基因排序和候选Hub基因挖掘;(3)通过PoplarGene的网络映射功能构建桉树功能基因网络,比较分析表明杨树功能基因网络更适合进行其他木本植物的功能基因网络映射;(4)使用PoplarGene对杨树木质部细胞发育基因进行顺式作用元件分析,获得26个富集的顺式作用元件。3.基于公共数据库中获得木材形成发育基因,使用PoplarGene平台进行杨树木材形成发育基因的生物信息学系统分析:(1)基于PoplarNet获得毛果杨木材形成发育功能基因子网络,对子网络进行聚类分析发现该子网络主要由16个紧密关联的模块构成,模块的功能富集分析发现这些模块主要参与糖结合、序列特异的DNA结合、转录调控、水解酶活性、细胞壁修复等功能;(2)通过木材形成发育基因的适应性进化分析发现,大部分木材形成发育基因都经历了负选择作用,仅178个基因经历了正选择,在木材形成发育功能基因子网络中,受正选择的木材形成发育基因大都位于非Hub节点,且其连接度分布显著低于子网络中的随机节点,负选择的木材形成发育基因更倾向于连接度高的节点,排名前10位的基因有9个都受到了负选择;(3)通过构建木材形成发育基因的miRNA调控网络,获得151个毛果杨microRNA与142个毛果杨基因的调控网络,整个网络包含31个子网络,最大的子网络Subnet1含有42个节点,151个microRNA来源于19个microRNA家族,对调控网络中的基因的功能富集分析发现靶基因主要参与激素响应与转录因子DNA结合相关功能。总之,杨树功能基因网络的构建以及PoplarGene平台的开发将为杨树基因的功能研究提供重要参考信息及生物信息学平台,同时,随着杨树分子生物学研究数据的不断增加,PoplarNet以及PoparGene将不断更新和完善。综合木材形成发育基因功能基因子网络与microRNA调控网络挖掘新的杨树木材发育相关的关键基因和因子,可为进一步木材改良研究提供更多的信息,在木材形成发育基因功能子网络中居于重要节点的负选择基因,可作为木材遗传改良的候选靶基因,鉴定到的19个家族的microRNA可进一步通过相关分子生物学实验研究其在木材形成发育中的功能。
其他文献
随着我国社会经济的高速发展,人们对于珍贵木材的需求急剧增加,培育大径级无节良材正是当下人工林发展的重要目标。人工修枝是大径材培育过程中一项关键技术措施,而针对我国
Ti(C,N)基金属陶瓷作为一种新型的工具材料,具有密度低、室温硬度和高温硬度都优于WC基硬质合金、化学稳定性和抗氧化性好、耐磨性好等优点。介绍了Ti(C,N)基金属陶瓷的基本
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
当前企业处于一个激烈的竞争时代,要想在激烈的市场环境当中,增强企业自身的竞争力,就要加强对企业的财务管理工作方法的改革。新时期只有强化企业会计预算管理的方法措施,才
目的:探讨舒适护理模式在经皮肾镜取石术中的效果评价。方法:选择80例行经皮肾镜取石术的患者,采用随机数字的方法分为观察组和对照组各40例,对照组给予常规的护理方法,观察组
2019年的中国电影经历着跌宕起伏不断的困境,也承受着怀疑和担忧夹杂的寒冬的说辞,更显示了其厚实的基础与坚强的韧性。2019年中国电影再一次超越此前的电影票房,在国内票房
目的探讨综合性护理对代谢综合征患者服药依从性、睡眠质量及生活质量的改善作用。方法选取医院2017年10月至2018年10月收治的代谢综合征患者120例,随机分为观察组与对照组,
互动式作文教学,就是学生写作文,教师写"下水作文"让学生评阅,教师也启发点评。
目的分析中药在肛周脓肿围手术期的应用效果。方法选择2013年10月—2014年11月治疗肛周脓肿的患者98例,随机将98例患者分成治疗组49例,对照组49例。对照组患者术前采用外科常
杜仲(Eucommia ulmoides Oliv.)具有重要的经济价值。作为第三纪孑遗植物,广泛分布于中国,适应性极强,杜仲也是唯一的生长于亚热带和温带的硬性橡胶植物。目前,关于杜仲基因