微生物辅助鉴定系统研究与实现

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:miszha
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自上世纪70年代美国微生物学家伍斯(Carl Woese)率先使用核糖核酸(RNA)序列研究原核生物进化关系并发现古细菌开始,基于16S rRNA基因序列的分析便成为研究原核生物多样性以及分类鉴定的核心方法,至今仍被广泛应用。  目前基于16S rRNA基因序列的分类鉴定系统有EzTaxon和RDP Classifier。EzTaxon和RDP Classifier在鉴定方法和应用场景上存在差异。EzTaxon提供在线的分类鉴定服务,其鉴定方法的核心是序列比对;RDP Classifier提供在线和本地的分类鉴定服务,其鉴定方法是基于朴素贝叶斯的分类器。EzTaxon和RDPClassifier存在如下缺点:其一,EzTaxon不适用于想把私有16S rRNA基因序列也考虑在内的实验室。其二,EzTaxon在鉴定方法上没有创新;RDP Classifier虽然尝试使用机器学习方法鉴定微生物,但其鉴定效果有限,没法鉴定物种到种。其三,RDP Classifier没有考虑基因位置信息。  基于上述问题并结合实际需求,本论文搭建了一个微生物辅助鉴定系统,对鉴定方法进行了深入探索。本论文的主要工作和贡献如下所述:  1.本论文构建了公共16S rRNA基因序列数据库。参照现有基于16S rRNA基因的项目,本论文从GenBank中解析和提取所有原核生物16S rRNA基因序列。针对GenBank中16S rRNA基因序列可能存在的问题制定了质量控制策略,然后开发Pipline工具组合质量控制策略来完成对提取的16S rRNA基因序列的质量控制。  2.本论文从现有辅助鉴定方法出发给出了三个辅助鉴定模型:借助局部比对工具的辅助鉴定模型,借助聚类-分类的辅助鉴定模型以及借助文档相似度的辅助鉴定模型。这三个辅助模型是对EzTaxon鉴定方法的归纳和升华,将机器学习和信息检索技术与序列比对相结合。与EzTaxon相比,鉴定模型不再仅仅依靠传统微生物鉴定方法技术,而是将实用的计算机技术应用于微生物鉴定领域;与RDP Classifier相比,传统微生物鉴定方法可以反过来弥补使用机器学习和信息检索技术的不足,修正物种鉴定的结果。  3.本论文设计了在线微生物辅助鉴定系统的总体框架,根据总体框架实现和组装各个功能组件。
其他文献
我国高校信息化进程通过长时间的发展,逐渐从系统集成阶段进入到应用集成和信息集成阶段。在高校信息化进程中不断产生了“信息孤岛”难题,“信息孤岛”难题的解决有许多传统方
森林资源调查和监测是研究地表植被覆盖状况乃至全球生态变化的重要内容,而森林区域面积的调查和统计又是森林资源调查和监测的研究重点。利用遥感卫星或航空飞机拍摄的高空间分辨率遥感图像,研究解决森林面积的估测问题,即对高分辨率遥感图像进行分类,进而提取出森林区域的部分,是本文的研究重点和主要内容。当前高分辨率遥感图像的分类主要是以计算机为主要工具的对遥感图像像素进行数值处理,从而达到分类识别地貌特征的目的
近年来,随着分布式数据处理技术和云计算的不断发展,数据中心从简单的服务器托管和维护的场所变成了具备海量数据计算和存储能力的网络集群,为大型信息系统提供海量数据处理和存
常识获取是人工智能领域的一个核心难题,其目标是构建面向应用的大规模常识知识库,以实现真正的智能系统。为了突破知识获取“瓶颈”,常识获取的方式经历了由人工编辑到自动
随着网络技术的不断发展,各式各样的网络中间设备不断涌现,发挥着越来越重要的作用。传统的基于专有硬件的网络中间设备具有价格昂贵、难于编程、难于管理等缺陷,网络功能虚拟化
民主是人类政治生活的主题,它关涉民主实践和民主价值。选举是实现民主的重要手段,也是民主政治的核心问题。时代的发展和科技的进步推动了选举制度的改革,而选举技术也随之不断
近些年来随着信息技术的飞速发展,网络技术深入到生活的方方面面,特别是在网络用户密集的大中城市,为了获取到便利的网络连接,各个城市都在努力建设高效、便捷的信息网络,无
作为面向内存的分布式并行计算框架,Spark非常适合于迭代式计算,但是飞速增长的数据量和日益苛刻的实时性要求使得Spark平台的性能优化已迫在眉睫。为了解决Spark平台CPU计算能
EAST数据系统是EAST聚变实验的重要组成部分之一,EAST数据系统主要包含四个部分:数据采集子系统、数据储存子系统、数据发布和分析子系统、数据可视化子系统。   现有EAST
知识工程使人工智能的研究从理论转向应用。知识工程以知识为基础,知识获取、知识表示和知识利用都是知识工程研究的基础课题。知识获取和知识表示的研究对人工智能理论和应