论文部分内容阅读
"自适应集群距离边界"高维索引方法虽可得到查询点与聚类之间更紧致的距离边界,但该方法需要大量的边界距离计算,当集群个数增加时无法兼顾过滤能力和CPU性能,且没有在候选集群内部提供高效的剪除机制。本文提出一种新的以超平面聚类为基础的索引结构Tree HB来提升最近邻查询性能。首先,用层次化聚类方法聚类,将聚类结果用树形结构进行管理,在保证过滤能力的前提下,可降低距离下界计算量,减少CPU开销。其次,在候选集群内部设计一种新的剪除机制,进一步过滤无关数据元,降低I/O开销。结果证明,这种新方法性能优于原