论文部分内容阅读
多维数据的近邻查询是多媒体数据处理领域最常用的基本操作之一,并长期都是研究的热点。然而已提出的索引大多面临高维、海量等问题的困扰。由于矢量量化技术具有较好的数据量缩减特性,在针对高维索引研究方面,基于矢量量化的高维索引已成为一个新的研究热点。本文首先介绍了多维近邻查询的基本概念和基本思路,以及几种现代索引方法的基本思想。其次,结合近邻查询的需要,介绍了矢量量化相关原理和技术。对与矢量量化相关的近邻查询方法进行了分析对比。然后论文分析了乘积量化和残差量化在查询中的作用,并介绍和分析了两种针对近似查询的使用残差量化方法的索引结构。论文总结了以往两种基于矢量量化的过滤方法,胞腔近似方法和超平面方法,并且引入了基于胞腔距离的过滤方法。经过实验验证,针对精确查询,基于胞腔距离的新过滤方法有较好的查询特性。最后,本文总结了矢量量化类索引的规律,并且给出了这类索引可能的研究方向。