基于字典的DNA序列数据压缩及应用研究

来源 :华南农业大学 | 被引量 : 0次 | 上传用户:chasel
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  在研究现有的DNA序列数据压缩算法的基础上,本文以DNA序列数据的存储效率与直接检索速度综合考虑,设计并实现了称为DNACS(DNACompressionandSearch)的算法。它包括了DNA数据压缩(含解压缩)算法和非解压直接检索算法,分别用于解决存储效率和提高检索速度的问题。DNACS算法的核心是四个方面:重复子串字典建立、字典项筛选、字串压缩编码及非解压检索压缩数据。 本文所涉及的主要内容包括:(1)认识生物信息学及关注DNA数据压缩。(2)研究DNA序列数据已有的压缩算法。(3)描述DNACS算法的总体结构。(4)设计并实现DNACS压缩算法。(5)设计并实现DNACS非解压检索算法。(6)对DNACS算法进行实验及评价。   总之,本文引入“非解压检索压缩数据”的思想,结合传统字典压缩算法技术,搭建DNACS算法框架并进行程序实现。实验数据表明,DNACS算法数据压缩算法压缩效果达到常用DNA序列压缩算法水平,非解压检索算法搜索速度也优于普通模式匹配算法。
其他文献
安防监控已经渐渐融入人们生活,并成为安全保障必不可少的组成部分.然而很多人对安防摄像机的结构组成和使用方法并不是十分了解,本文主要就从这两方面进行阐述,帮助读者了解
企业信息资源集成有助于消除信息孤岛、实现信息资源共享,信息资源集成的成效很大程度上决定着企业信息化的成败。ERP为企业内部的信息资源集成管理提供了良好的解决方案。但
现代企业已经越来越多地通过客户生命周期价值来看待客户,客户生命周期价值是一种强大并且直接的综合衡量客户的获利性和流失危机的方法,在企业的客户关系管理(CRM)中发挥着重
传统营林技术在林地准备和幼林抚育等方面出现盲目追求高标准的倾向,严重影响林场的生产与经营.因此,探索有效的营林技术措施是国有林场实现可持续经营面临的重要课题.本文分
2006年以来全国范围内的有线电视整体转换工作进入了蓬勃发展的时期。2006年12月25日青海省西宁市政府下发了《关于加快西宁市有线电视数字化整体转换工作的通知》, Since 2
危险货物运输是铁路运输的重要组成部分.由于危险货物所固有的危险特性,在铁路运输工作中如果违背科学规律,违规操作和疏于管理,就会造成事故.这不仅给托运人和承运人造成直
针对当前科研项目评价中,特别是不确定因素较多的科研项目的前评价中遇到的困难,本文研究了价值中心思维的基本理论,提出并论证了运用价值中心思维方法进行科研项目评价的解决方
学位
当前,信息技术(IT)应用遍布企业运作的各个流程,并逐渐成为企业核心竞争力的核心部分,关乎企业发展全局。随着信息技术的广泛应用,企业对信息技术依赖程度越来越高。信息技术应用
随着计算机科学技术的突飞猛进,语言教学中必用的语音室的发展也紧跟时代步伐,由模拟语音室转变成数字化网络语音室,并且被广泛的应用。数字化语音室信息系统中的所有设备都是由
  本文针对在城市规划管理上由于政府部门随意改变规划,给公众利益造成损害的现象,从公众参与城市规划的基本概念和特点入手,在介绍了公众参与城市规划的理论、历史及西方各国