论文部分内容阅读
随着电子数码设备的广泛使用和互联网的长足发展,海量的多媒体数据被制造和传播,图像数据成指数级地增长。如何从浩瀚的信息海洋中快速获取准确的图像,成为图像检索技术中的热点研究方向。其中,基于文本的图像检索技术已经发展的非常成熟。然而,随着大量的新的图像数据快速的产生以及劳动力成本不断提高,传统的文本标记方式已不再满足图像技术发展的需求,因此基于内容的图像检索技术有着很大的发展空间和实用价值。半监督学习算法充分利用了标记数据和未标记数据的信息,这一特点正好符合基于内容的图像检索技术的发展要求。在半监督方法被提出以后受到越来越多的研究者的关注,从而发展出来各种各样的基于半监督学习思想的新算法,基于图的半监督学习算法就是其中之一。流形排序作为基于图的半监督学习算法的典型代表其性能紧紧地依赖于构造的底层图结构。因此构造一个能反应出高维数据空间自身结构的图至关重要,自然邻居图能够自适应嵌入在高维数据空间的内在的低维流形结构的这种能力正好满足这样的要求,并且在构造自然邻居图的过程中也不需要指定自由参数k。由于自然邻居在处理含有离群数据点的数据集时仍然存在不足,所以本文针对这一问题对自然邻居进行优化,最后本文将优化过后的自然邻居图应用到基于流形排序的图像检索框架下,并最终通过实验证明了基于自然邻居图的图像检索算法的效果优于基于k-NN的图像检索算法。本人在攻读硕士学位期间所从事的研究工作组成了本论文的主要内容,具体工作如下:第一、了解图像检索和半监督学习算法的国内外研究现状。通过大量阅读文献了解到了图像检索算法和半监督学习算法的国内外研究现状。第二、研究讨论自然邻居基本思想。通过阅读相关文献理解了自然邻居的基本思想,并经常和实验室成员一起讨论自然邻居思想及其可能应用到的领域。第三、优化原始自然邻居图的构造。针对原始的自然邻居图在含有自然离群点的数据集上的表现不足,本文对原始的自然邻居图进行优化并取得较好的效果。第四、将自然邻居图应用于图像检索。受基于k最近邻居图的图像检索算法的启示,本文提出了基于自然邻居图的图像检索算法。第五、通过实验验证基于自然邻居图的图像检索算法的有效性。实验在USPS手写体数字图像数据库和科尔数据集上进行。