论文部分内容阅读
研究了基因序列分析中的DNA序列相似性重复片段的查找问题.在对重复片段的相似性衡量进行分析之后,基于海明距离提出了新的相似度衡量标准——模式相似度和片段相似度,并在此基础上提出了一个新的相似性重复片段的定义SATR(segmem—similarity based approximate tandem repeats).在进行SATR的查找时,采用了一个轻量级的索引——后继数组,并设计出在后继数组上进行SATR查找的算法.实验评估和性能分析表明,基于后继数组的SATR查找算法在查找结果和查找时间上都要优于其