基于基因本体(GO)的基因语义相似性度量方法的研究及应用

来源 :上海师范大学 | 被引量 : 0次 | 上传用户:ice_city_82
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在当今的基因组时代,我们面临的主要挑战之一则是基因之间功能关系的挖掘,高通量的微阵列技术的出现填补了这一缺陷。DNA微阵列提供了大量的基因表达数据,这为基因功能和基因调控关系研究提供了独特的机会。通常认为具有相似表达谱的基因具有类似的功能,可以通过已知功能基因的表达谱模式预测未知基因的功能。但是现在的研究发现,功能相似的基因并不总是具有相似的表达谱模式。因此,研究基因功能的研究人员希望通过其他途径提高他们预测基因功能的准确性,基因本体(Gene Ontology, GO)的出现使这种想法变成了可能。现在,应用GO注释定义基因的“语义相似性”(semantic similarity)进而定义基因功能相关性已成为越来越普遍的做法。本文探讨了国内外基因语义相似性的研究现状,对目前常用的四种基因语义相似性度量方法(集合法、向量法、图形法和术语法)的典型模型及优缺点进行详细介绍,其中术语法是本文的重点,因此对术语法模型Resnik、Jiang和Conrath、Lin、Combine和Wang进行了重点介绍。本文针对已有语义相似性度量方法的不足,充分考虑GO的拓扑结构和术语间的语义关系,引入了术语级的概念,对语义类型边的语义贡献因子进行重新定义,并引入了根术语到具体术语全路径的概念,提出了一种基于GO语义全路径的基因语义相似性度量方法(Full pathway similarity, FPS)。通过将本文提出的基于语义全路径的方法应用于实际,并与经典的Wang方法进行分析比较。结果表明,比起Wang的方法,我们的方法得到的结果更符合实际情况,精度更高。基因调控网络是功能基因组学研究的一个热点,它从基因之间互相调控或影响的角度揭示复杂的生命现象。本文尝试用基因的GO注解信息来代替表达谱数据,利用FPS度量基因的功能关系,并给合图论中经典的最大团问题,从GO层面出发构建基因的调控网络,结果表明我们的预测结果具有一定的可靠性,因此,我们的FPS算法可以为基因调控关系研究及调控网络构建提供有用的参考信息。基因语义相似性度量是一个复杂且重要的问题。然而,随着基因注释信息(GO)的不断完善和计算机技术的不断提高,基因语义相似性度量方法研究将不断地取得突破。而从GO出发研究基因的功能相似性,探索基因的调控关系,预测未知基因的功能,不仅可以避免收集大量的基因表达数据的困难,而且准确的基因产物语义相似性度量可以大大提高基因研究工作的效率,对生物学家研究基因功能及相关研究具有一定的参考价值及指导意义。
其他文献
20世纪90年代,随着生物学的进步,人们对生物系统的认识不断深入,越来越多的计算机学家和工程师们认识到生物系统完全可以作为解决更多复杂问题的重要手段,因此人们对研究生物
制造网格是制造业信息化的新的发展阶段,是网格技术在工业制造领域的应用,它利用网格技术将各种制造资源进行服务化封装,使得用户使用统一接口实现对资源的透明访问。数据资源是
在移动通信技术发展的过程中,不断的与无线网络技术的融合,满足了人们能够随时随地接入Internet,并且能够实现移动主机不断的移动而与Internet连接不中断,在这个过程中不需要
大型的工业园区在进行规划阶段通常使用沙盘、计算机三维动画等形式来模拟评估规划结果。但是表现形式都存在交互性、灵活性差的缺点。随着计算机技术的不断发展,通过使用三维
学位
增强现实是虚拟现实技术的拓展,通过把计算机生成的虚拟对象与真实环境融为一体的方式来增强用户对真实环境的理解和体验。增强现实的研究目标是实现虚拟对象与真实场景的虚
地理信息系统GIS(Geographic Information System)是一种基于计算机的工具,它可以对在地球上存在的东西和发生的事件进行成图和分析。GIS组件作为一种适应社会发展需求的GIS软件
学位
随着科学技术的进步和人民生活水平的日益提高,人均寿命日益延长,老年人的医疗保健问题成了社会广泛关注的焦点。家庭医疗保健系统在这种社会大环境下应运而生,它结合了信息
为了满足用户不断增加的需求,软件产品需进行不断的维护与演化。而在软件维护与演化的过程中,开发人员面临的主要问题之一就是如何能够快速而又准确的理解整个软件系统。随着
模式识别是指对表征事物或现象的各种形式的信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。人脸识别属于模式识别
学位
从获取的二维图像出发,进行物体的三维重建是计算机视觉领域的一个重要课题,在虚拟现实、三维测量、机器人自动导航、工业检测等方面具有广泛的应用前景。重建过程涉及图像预