论文部分内容阅读
近年来,随着计算机技术、通信技术、多媒体技术以及网络技术的迅速发展,全世界的数字图像资源正以惊人的速度增长。这些图像信息来源于卫星系统、监测系统、科学实验和生物医学等领域,包含了大量有用的信息。然而,由于这些图像是无序地发布在世界各地,图像中包含的有效信息很有可能无法被有效地访问和利用。因此,如何有效地组织、管理和利用这些海量的图像资源,以及如何快速、高效地从大规模图像数据库中检索出满足用户需求的图像,是许多应用领域所面临的重要问题。
传统的基于文本的图像检索技术,因存在人工标注工作量过大以及关键字标注带来的主观性与不精确性等问题,已不能满足当前海量图像资源的检索需求。为克服传统图像检索技术的缺陷,需要一种一般性地、全面地和客观地提取图像内容的技术。在这样的背景下,基于内容的图像检索(Content-Based Image Retrieval, CBIR)技术应运而生。其主要思想是在融合图像理解、模式识别、计算机视觉、机器学习等诸多相关技术的基础上,根据图像内容所包含的色彩、纹理、形状等信息,提取出描述图像信息的特征向量,建立图像的特征库;然后计算查询图像与图像特征库中特征向量间的相似度,返回查询结果。在当前研究成果的基础上,如何更加有效地描述查询图像与特征库中图像特征向量间的相似度、提高图像检索的准确率等都是值得进一步研究的问题。
本文在回顾了基于内容的图像检索研究现状、发展趋势以及关键技术的基础上,提出了一种基于半监督学习(Semi-Supervised Learning)的图像检索模型。为了解决检索大型图像数据库时所面临的高计算代价问题,本文提出的半监督检索模型首先引入一种基于各向异性相似性估计(Anisotropic Similarity Measurement)的预处理机制。该预处理机制在实现滤除与输入查询图像不相关图像的同时保留一定比例的数据库相关图像。然后,半监督检索模型运用双曲线正切函数(Double Hyperbolic Tangent Function)表示数据库相关图像与查询图像之间的模糊隶属度。该隶属度数值同时也可视为图像检索的初步结果。最后,该模型运用基于随机行程与重新开始(random walk and restart)的半监督学习方法细化检索的初始结果,以得到高精度的检索结果。
在通用图像数据库Corel5000平台上对本文提出的半监督学习检索算法进行了测试,并与基于支持向量机(Support Vector Machine)及基于流行排序(Manifold Ranking)的算法进行了比较。实验结果表明,本文提出的半监督学习检索算法在各项性能指标(加权查准率的平均值,排名的平均值,各类查准率的平均值,及各类查全率的平均值)方面均体现出较好的性能。