基于GO的棉花生物信息分析系统的研究与构建

来源 :南京农业大学 | 被引量 : 0次 | 上传用户:kzyzf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类基因组计划和各种模式生物基因组计划的相继完成,生物信息学的研究重点已经从生物数据的积累转变为对生物数据的整合处理,以异构生物数据整合为核心的生物信息分析系统的构建,逐渐成为生物信息学研究的热点。   近年来,棉花基因组研究产生了海量的生物数据。国际上陆续建立了CMD、CottonDB、Tropgene DB等关于棉花的专业数据库系统,用于对这些数据进行存储和分析。但是这些数据库提供的分析服务比较单一,比如仅限于BLAST和CMap等服务,且不能扩展功能,因此不能满足个性化研究的需求。更重要的是,这些数据库通常只包含与棉花相关的生物数据,没有采用有效的手段,将其它异构的生物数据库,比如GenBank、SWISS-PROT等,进行生物学语义层面的有机集成,因此不能进行物种之间的比较分析。在国内,以南京农业大学棉花所为代表的棉花研究机构,其研究的遗传图谱及其它数据被一些国外的数据库所收录,自己至今没有一个比较完整的棉花生物信息数据库及其应用分析系统。因此,在国内率先构建一个语义统一的,分析功能强大的棉花生物信息分析系统,用于指导棉花分子设计育种,具有重要的意义。   本论文进行以下几个方面的研究工作:   第一,对生物信息分析系统的内涵,国内外棉花生物信息数据库等进行综述性研究,指出现有研究的不足之处,并引入GO(Gene Ontology)的概念和方法,提出以GO为核心构建棉花生物信息分析系统的设想。   第二,从本体的基本概念出发,重点研究GO的内部结构及其在生物信息学中的应用。通过研究GO术语间语义相似性度量方法,指出GO术语间语义相似性的度量是解决生物数据语义异构问题的重要方法。   第三,通过分析序列分析软件开发的必要性,并参考已有生物信息软件包的组织结构,采用perl语言,根据棉花生物信息分析工作的实际需要,进行序列分析软件包的设计与开发。软件包涵盖序列获取和筛选程序,EST-SSR分子标记开发程序,同源性分析程序,功能注释程序等,本论文只进行部分软件的开发。   第四,基于B/S模式,设计并实现一个基于GO语义模型的棉花生物信息分析系统。该系统通过GO术语与被GO注释的条目之间的对应关系,在生物学语义上统一了外部数据库,并在此基础上提供基于GO的功能注释,相似性搜索、文献检索等功能完善的分析服务。   本论文利用GO和关系数据库对影响棉花生长发育、产量、质量、抗性等方面的基因进行跨物种比较分析的方法,是一种比较新颖的思路。基于GO的棉花生物信息分析系统的设计与实现,在国内棉花生物信息数据库建设领域,具有首创性,对棉花分子设计育种具有积极的指导意义。
其他文献
在并行计算领域,互连网络的拓扑结构一直是国际上研究的热点。当前,人们已提出了多种互连网络拓扑结构,其中超立方体(hypercube)是最流行的互连网络拓扑结构之一。它已被应用
语音信号处理主要包括三个部分:语音识别、语音编码、语音合成。在语音编码这个领域,现在的研究集中在低速率语音编码器方面,本文的目的就是进行低速率语音编码器算法的研究。 
Web数据的爆炸性增长不仅为用户提供了丰富的知识来源,同时也给检索系统造成了巨大的负担。传统的集中式搜索引擎因其覆盖度低、索引更新频率有限等问题,无法为快速增长的网
网络模拟器(Network Emulator)为在实验室环境下测试、分析和评价Internet的各种应用系统和技术提供了一个方便、高效的方法,具有费用较低、规模较小、使用方便、实时性等特
传统的国防生信息管理多采用人工管理为主、计算机管理为辅的方式,对国防生的招生选拔、在校培养、毕业分配整个培养环节的工作缺乏全方位、全过程的信息化管理。随着贵州大学
3D面部识别是当前图像处理研究中的一个比较新的研究方向。在对人的计算机自动身份鉴别系统中,指纹、基因、虹膜等方法都为接触式鉴别手段,需要人为的采样,属于侵犯式的识别
随着嵌入式系统与网络技术的结合可以极大地增强嵌入式终端设备的智能化与灵活性,并且推动嵌入式浏览器及其应用技术的发展。可以预测在不久的将来,只要有网络存在的地方,任何一
无线传感器网络是近年来最有发展前景的技术之一,它集中了微机电技术、嵌入式计算技术、分布式信息处理技术和无线通信技术,是一种全新的信息获取和处理模式。节点定位、拓扑
空间数据查询方法是在空间数据库、空间数据挖掘、空间拓扑关系分析、智能交通和地理信息系统等领域扮演着非常重要的角色。最近邻查询方法作为空间数据查询中的一个分支,在
随着航空运输的快速发展和飞行流量不断增加,空中交通变得越来越繁忙和复杂。由于我国空域改革相对滞后,空域结构不尽科学,管制人员需要对大量的飞行活动不断进行调整。同时,全天