论文部分内容阅读
随着互联网技术的迅猛发展,图片获取和传播途径的日益宽广以及图片存储能力的不断提高,使得海量图像数据库成为人们获取和检索图像的主要对象。如何从这些海量图像数据中获取具有特定语义的图像成为人们的研究热点之一。
图像检索也是计算机视觉和模式识别领域中一个重要的研究方向。早期,图像检索主要是基于文本的,需要手工对图片进行标注,然而海量图像数据库的出现,使得手工标注图像存在工作量庞大、标注的主观二义性等问题。于是,基于内容的图像检索方式被提出,并得到了广泛关注,这种检索方式主要是通过提取图像的低层特征来计算图像之间的特征相似性,最终找到相似的图像。这种方式简单直接,但是存在“语义鸿沟”问题,即相同或相似的低层特征所表达的高层语义内容往往是完全不同的。为了解决这个问题,人们提出了基于语义的自动图像标注,用于支持图像检索。基于语义的图像标注首先要建立图像低层特征和语义概念之间的对应关系模型,标注时可以利用该关系模型来计算最适合待标注图像的语义概念。
本文对图像语义自动标注相关技术进行了深入的研究,主要工作和创新点如下:
(1)为了减小“语义鸿沟”对图像检索的影响,提出基于潜在语义概率分析和高斯混合模型的图像自动标注方法,并结合了训练集中语义概念之间的语义相关性,对测试集中的图像进行自动的语义标注。首先用潜在语义概率分析技术在训练集的文本空间中拟合出主题集合,然后根据图像的低层视觉特征建立每个主题对应的高斯混合模型,准确描述每个主题的语义内容,进而减小了“语义鸿沟”。该方法有效的结合了连续的、去除背景噪声的低层视觉特征和语义概念的语义相关性,建立较少的高斯混合模型,提高了标注的性能。
(2)针对图像语义自动标注中语义概念之间的关联性,提出语义相关的自动图像标注方法。对于每个由图像区域特征组成的正包,用高斯混合模型拟合其对应的概率密度。由于高斯混合模型的标注过程忽略了语义关联性,所以结合语义概念的语义关联性,用视觉特征和文本特征来优化高斯混合模型预测的后验概率,减小了“语义鸿沟”的影响,提高自动标注准确率。
(3)结合形状上下文及尺度不变特征变换技术,提出一种有效的轮廓描述方法用于轮廓图像的标注和识别。首先用轮廓边缘上的所有采样特征点的位置关系表征边缘上的一个采样点的特征,然后用聚类和向量化技术将轮廓图像的形状表示为词袋模型,形成轮廓图像的特征向量。最后基于这个特征,开发一个简单的轮廓图像识别系统,验证了这种特征的有效性。