论文部分内容阅读
针对软件实验中常涉及到的DNA碱基序列k-mer问题,提出一种基于四字链表字典树的快速检索算法。根据不同的A值建立深度为A的四字字典树,最大程度地避免字符串中重复公共前缀而造成的空间浪费,压缩内存消耗,降低空间复杂度;以叶子节点作为k-mer结束标志建立索引查询链表,并输出k-mer的所有序列号与位置号,最终完成DNA序列k-mer问题的建立索引与快速查找任务。实验表明,该算法具有很高的查找效率,且可以减少查询时间,能够高效解决DNA序列的k-merindex问题。