论文部分内容阅读
传统上基于内容图像检索(content-based image retrieval, CBIR)系统因存在着使用者查询与图像特征间的语义鸿沟,所以通常无法满足使用者的需求。语义鸿沟为CBIR系统主要的缺点,在本文中探讨一个方法去连结这样的语义鸿沟。我们将根据萃取网页中图像周围文字的语义来克服CBIR系统语义鸿沟的缺陷。本论文研究一新的、Vordnet语义学习方法,利用一群已标记的图像产生可能的语义讯息来侦讯图片中的主要语义物件,并据以应用到内容导向图像检索的应用上。在本方法中,将资料库的图像分为两类--已标示(labeled)语义群与未标示(unlabeled)群图像,对每一个已标记的图像我们设计—基于低阶特征语义学习模型。资料库里的所有图像都会先经过图像切割方法切割成多个区块,进而抽取代表这些区块的三种不同形态的低阶视觉特征(颜色、形状、纹理),根据这些低阶视觉特征的统计资料建造出语义侦测模型来预测分析隐藏在资料库里的语义信息。由于人类对于图像中所包含的语义特征是很主观的,所以使用具人工标记的图像的低阶特征所建立的统计模型来进行图像做注解常有模糊不清的问题。为解决这个问题,本论文运用一个区域权重估测演算法,选取具最大的语义信息重要区域,抽取其特征后,进行隐含语义内涵区域式内容导向图像检索。在检索的过程中,只有重要区域的特征才用来当作计算图像间语义距离的特征向量,此语义学习架构对内容导向图像检索系统提供了一个连结高阶语义概念与低阶图像特征的桥梁。实验结果显示我们所使用的方法与其他相似的语义学习方法,在效能上有更好的表现。本文运用Wordnet作为语义分析的核心,来处理图像周围的文字以便获取图像的语义信息。某些图像中所隐含的语义能在语义分析后被挖掘出来,并可据此语义进行图像检索。同时在本文中也定义了一套评估标准来评估语义图像检索的成效。