论文部分内容阅读
随着积累在数据库中的生物序列信息数量的增长,对某个序列进行近似查询在生物数据库中成了一个基本操作.提出了一种类K-means的方法,其思想是为其他的序列选择k个序列作为参考,类似于度量空间中的k个中心.在进行查询时首先用这些参考过滤序列,然后再处理候选序列.新的策略在被处理查询时提出.另外,通过样本优化对方法进行了改进.实验证明了这种类K-means算法的高效性.