一种类K-means算法的高效近似查询方法研究

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:juezhan2010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着积累在数据库中的生物序列信息数量的增长,对某个序列进行近似查询在生物数据库中成了一个基本操作.提出了一种类K-means的方法,其思想是为其他的序列选择k个序列作为参考,类似于度量空间中的k个中心.在进行查询时首先用这些参考过滤序列,然后再处理候选序列.新的策略在被处理查询时提出.另外,通过样本优化对方法进行了改进.实验证明了这种类K-means算法的高效性.
其他文献
针对当前自动文摘方法的不足,提出了基于文本聚类的自动文摘实现方法.可以克服常规自动文摘方法的不足,使文摘的质量和效果得到大大的提高.将文本聚类引入自动文摘中,不但使
吃过晚饭,李宏一反常态,主动包揽了所有家务,洗碗拖地,好不勤快,刚放下地拖,就抱着一堆衣服进了洗澡间.半个小时之后"出落"得光光鲜鲜,香气袭人,穿着睡袍的李宏,表情古怪地拿
期刊
一位女友终于决定请我们吃喜糖了.我们大家都非常惊诧,不是因为她唐突,而是因为她终于下决心与她热恋了两年多的男朋友结婚.
期刊
花生种植密度的大小直接影响植株分株数、单株结果数及单、双果之间的比重和秕果数的多少,从而决定着花生产量的高低。文章通过试验分析花生密度与产量的关系。
文章针对生产经营活动的单位(以下简称生产经营单位)安全生产监管档案工作存在的问题,从5个方面论述了生产经营单位如何抓好安全生产档案工作,充分发挥档案在安全生产监督管理工
提出了基于联合熵的多属性匿名度量模型,该模型基于识别性、连接性、跟踪性等匿名属性.鉴于匿名的随机性和模糊性特点,提出了基于联合熵和最小加权广义距离的模糊模式识别方法,实