相似索引相关论文
大容量多媒体数据库的基于内容相似性的检索本质上是高维特征空间中一定距离函数的K近邻问题.对适合人类视觉的二次型距离函数,即......
期刊
由于EB(extreme binning)使用文件的最小块签名作为文件的特征,它不适合处理主要包括小文件的数据负载,会导致较差的重复数据删除......
为了在海量、高维、动态的半结构化数据集上进行有效的相似搜索,该文提出一种采用聚类技术进行索引构建与更新的多路平衡树--CSS-树以......