基于码书索引变换的高通量DNA序列数据压缩算法

来源 :电子学报 | 被引量 : 0次 | 上传用户:hanshuang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种高通量DNA序列数据的压缩算法.该算法先采用码书索引变换模型,将传统码书索引值的表示方法变换成由四个标准碱基字符替代的四进制数值方式,并采用一种界定替换串与非替换串的简明编码方法,接着通过信息熵的大小来决定是否进行块排序压缩变换(BWT),最后进行前移编码变换和Huffman熵编码.在多种测序数据集上的实验结果表明,CITD在大多数情况下可以获得比本文所对比的高通量DNA专用压缩方法更优的压缩性能.
其他文献
介绍了GPS RTK技术的基本原理和工作流程,结合连云港市临港产业区的工程实例,验证了其测量精度的可靠性。
简要介绍了GPS-RTK与数字测深集成技术的测量原理,探讨了测量作业方法与影响测量精度的因素,并结合工程实例对测量精度与效率进行了验证。
无功优化是降低网损,提高电压质量的重要措施。文章分析了分散调压和无功优化的差异,构建了一种智能化的农村配电网无功优化系统,将潮流计算与灵敏度分析相结合,形成无功优化
本文运用层次分析法(AHP),通过建立评价指标体系对资阳市上轮土地利用总体规划实施效果进行了客观、全面、科学的评价,指出影响规划实施评价的因素包括社会意识度、经济效益、生
介绍了 2 0 0 0年陕京输气管道断裂带形变监测GPS网的数据处理过程 ,并对 1 999年和 2 0 0 0年两期成果进行了形变分析 ,其结果将为跨越断裂带的输气管道的形变监测提供借鉴。
民族地区文化是民族区域旅游业的基础,没有文化因素,民族区域旅游业将失去其发展的依托。随着我国经济的发展,民族文化和区域旅游业相融合,为民族区域经济的发展注入了新的活
从地质灾害防治工作的"时点"、"难点"以及"盲点"三个方面对防控工作提出了建议,以期能为地灾的防控工作提供一定的参考。
科技信息服务机构,是专门收集、贮存、提供、处理科技信息情报的服务机构,而科技信息服务在推动社会经济的发展中发挥着非常重要的作用。文章主要分析了中小企业科技信息服务
我国心脑血管及血栓性疾病年发病人数约为2000万人,年死亡人数近200万人。现有的主要溶栓剂t—PA、SK、UK、APSAC等,均是注射用药,其剂型不适用于血栓病的预防,研究适合于预防血
根据多年的实践经验,总结一些常见的有关屋面渗漏的现象,并提出相应的防治措施。