microRNA和基因功能网络构建与分析方法

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:Ling_Hun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物网络作为一种复杂网络是近几年信息科学和系统生物学的研究热点之一。由多种生物分子及其相互作用构成的生命系统从本质上可被简化为一个基因网络。基因网络是由一组基因(或其产物)及它们间的相互作用所构成的一种复杂生物网络,同一组基因可通过不同类型的互作构成不同的网络模型,如蛋白质互作网络、基因调控网络、遗传网络等。然而单一特定的生物网络并不能完整反映基因间可能存在的多种互作类型。功能网络作为一种基于功能关联的网络模型,可以整合不同互作类型而实现多种基因网络的融合。功能互作不仅存在于基因之间,也广泛存在于调控基因表达的microRNA(miRNA)之间。有关miRNA通过协同作用共同调控靶基因的大量实验证据已促使miRNA功能及其相互作用的研究上升到了系统水平。为此,本文以大豆(Glycine max L.Merr.)为研究对象,以功能互作为基本概念,基于功能基因网络和miRNA功能网络的构建与分析,重点研究miRNA-基因双层网络构建及其模块识别与分析方法,拟深入挖掘miRNA-基因双层功能网络中蕴藏的生物学知识,旨在系统水平上进一步揭示miRNA参与调控基因网络的机制与特征。本文首先受细胞分化和细胞全能性的启发,提出了GO术语的语义分化与语义全能性的概念,并进而提出最短语义分化距离方法(SSDD)来计算GO术语间的语义相似性。基于专家打分和第三方标准数据集的评价结果都表明SSDD方法的多种度量性能均优于其它同类方法;借助于更加深入的分析,揭示了SSDD方法不仅不依赖其它数据,还能解决相同注释和浅注释等共性问题,且有效降低了计算结果对注释丰富度的偏好性。其次,由于系统层次的有关非模式生物(如大豆)全基因组的功能数据极少,因此广泛用于模式生物的整合多种基因组、转录组和比较基因组等数据来推测基因功能网络的方法无法在大豆等非模式生物上重现。为此,本文基于GO功能注释实现了大豆基因间功能关联的推测,并得到了四个不同注释类型下的大豆功能基因网络(SoyFGN),覆盖了超过70%的目前数据库收录的大豆基因。拓扑结构分析表明,SoyFGN呈现出无标度生物网络的典型特征和模块性。基于KEGG通路和共表达数据的评价表明全新构建一个大豆基因网络而非简单从其它网络同源推导而来的重要性。基于SoyFGN的抗病基因预测与分析表明,利用GO功能注释来构建功能基因网络同模式生物基于多种组学数据整合来构建基因网络一样,能够在系统水平上反映基因间的功能互作并具有良好的功能预测能力。第三,有限的miRNA已被部分实验研究证实可以通过相互作用协同调控远比自己数目更多的基因,这为利用信息学和计算手段在系统水平研究miRNA的功能互作提供了事实依据。为此,本文在充分考虑miRNA靶基因互作信息及调控强度基础上提出了一种新的miRNA功能相似性度量方法,提高了度量的准确性和敏感性。借助于大豆全部miRNA间的功能相似性及基于聚类系数的阈值选择方法,构建了第一个大豆miRNA组水平的功能互作网络(SoymiRFN),覆盖了已发现大豆总数目超过90%的miRNA。拓扑分析表明了SoymiRFN典型的生物网络特征和模块性。将构建的miRNA功能网络与功能基因网络和miRNA-基因间的靶向调控关系相结合,便构成了miRNA-基因双层网络,这是首个以双层网络模型来描述miRNA与基因互作关系的研究。第四,模块识别是一种有效挖掘全局网络中更具生物学意义的局部结构的网络分割手段。针对miRNA-基因双层网络有别于传统的单层生物网络或其它复杂网络的特点,本文提出了伪3D聚类算法,实现了具有层级性、交叠性和高内聚性的双层网络模块的识别,且可以根据当前网络的潜在分布自动确定最优的模块划分而无需提前输入欲划分的模块数目。将伪3D聚类算法用于大豆miRNA-基因双层网络的功能模块识别,得到了其具有层级结构和交叠性的模块划分结果,通过对最优划分模块的拓扑结构和功能富集分析,证实了伪3D聚类算法的理论有效性。此外,借助数据库检索和文献搜集的实验数据,深入分析了大豆脂肪生物合成过程相关的双层子网,为伪3D算法的有效性提供了实验证据,并揭示了大豆脂肪生物合成相关基因和miRNA的作用特点。最后,基于以上研究内容和结果,为弥补当前有关大豆功能基因组方面数据库的不足,本文建立了一个专门针对大豆功能网络的数据库—SoyFN。该数据库提供了丰富而友好的界面用于检索、可视化、分析和下载大豆基因-基因、miRNA-miRNA和miRNA-基因在组学水平上的功能互作信息及其它组学信息。此外,SoyFN数据库还整合了来自KEGG、UniprotKB、SoyBase、EnsemblPlants等知名公共数据库提供的有关大豆功能组学的数据。同时,还提供了诸如SoySearch、Genome Browser和ID mapping等数种实用分析工具。通过使用范例介绍表明,SoyFN能为大豆功能基因网络的分析提供了一套完整的分析流程,对于大豆实验科学和生物信息学的相关研究均有促进作用。该数据库的访问地址为http://nclab.hit.edu.cn/SoyFN/,可以使用支持HTTP传输协议的任何浏览器开放访问。综上所述,本文以生物网络作为研究主体,用更一般、更广义的功能互作来描述基因-基因、miRNA-miRNA间的相互作用,并首次使用双层网络模型将基因和miRNA同时纳入功能网络构建;此外,还首次提出了针对双层网络模块识别的伪3D聚类算法,并成功用于大豆miRNA-基因双层网络的模块识别与分析。本文的研究成果一方面能够促进信息科学中生物复杂网络的研究方法,同时也有助于实验生物学在系统层面上进一步研究生物分子间的相互作用。
其他文献
8月12日,“2020 Leader闪耀系列新品上市时尚综艺秀”以一场别开生面的场景交互体验,将年轻生活搬到了会议现场。无处不在的“闪耀”元素、颇具时尚感的跑道式设计⋯⋯Leader
随着社会的发展,国家对于教育教学工作的关注力度逐渐提升,再加上新课改的不断推行,对于小学语文的教学工作提出了新的要求。而阅读教学作为小学语文教学过程当中重要的组成
<正>长期共存、互相监督、肝胆相照、荣辱与共,简称"16字方针"。——摘自《统一战线知识手册》
<正>为发展数字经济,美、日、英、澳等发达国家在依靠经济实力和人力资源的基础之上,还建立了数字经济的战略规划,并对涉及的重点方向进行扶持。在中国,2016年数字经济创造的
2020年4月1日,受新冠肺炎疫情影响,国家标准化管理委员会宣布将延迟实施13项国家标准,其中包括由中国标准化研究院牵头制定了GB 37480-2019《低环境温度空气源热泵(冷水)机组
利用梧州市近30a的常规气象资料,从影响人体舒适度基本3个要素(温度、相对湿度、风速)入手,利用模糊评价方法对梧州市全年的气候舒适度进行了评判分析,得到各旬的气候舒适度
维护与促进男性生殖健康,不仅将使男性受益、妇女及家庭受益,而且有利于社会乃至整个民族的利益。
7月30日,由中国家用电器研究院指导、全国家用电器工业信息中心主办的《2020年中国家电行业半年度报告》在线上发布。报告显示,2020年上半年,中国家电国内市场零售额为3365.2
近年来,郑州市委、市政府认真贯彻落实河南省委、省政府关于打好转型发展攻坚战、推进供给侧结构性改革、大力实施乡村振兴战略的决策部署,依托河南粮食大省农产品资源丰富的优
摘袋是苹果套袋技术中最后一个关键环节,决定套袋能否达到预期效果。下面介绍关于套袋苹果摘袋时期的技术要点,供参考。