论文部分内容阅读
随着数字图像以及图像数据库数量的快速增长,图像检索已成为信息检索领域中的一个重要研究方向,它的目的是从图像数据库中快速提取出与查询相关的图像或者图像序列,使用户能迅速获取需要的特定图像。基于内容的图像检索建立在对图像底层特征的提取和分析、匹配的基础之上,无法解决图像底层特征与高层的语义概念表达之间存在着巨大的差异的问题,即“语义鸿沟”的问题。因而图像语义检索成为了图像检索技术研究的热点。基于语义的图像标注是基于语义的图像检索的关键组成部分。本论文详细阐述了图像标注的发展历程,并提出了几种基于区域特征的有监督图像语义标注算法。本文的主要贡献在以下几点:首先,提出一种改进的基于高斯混合模型的有监督图像语义标注方法。该方法主要包括图像分割(J-value segmentation, JSEG)、底层颜色和纹理特征的提取、利用期望最大化(Expectation Maximization, EM)算法训练基于高斯混合模型的概念分类器、去除噪声区域更新概念分类器和对测试图像进行语义概念标注等步骤。对于每一个概念均获得两个基于高斯混合模型的分类器,即颜色分类器和纹理分类器,并结合去除与概念无关的噪声区域的方法更新概念分类器,在标注阶段采取决策级融合技术。在Trecvid2005视频图像库上的实验证明,利用本文算法获得的标注结果较传统的对每一个概念都建立一个概念分类器的方法所得的图像标注性能有较大的提高。其次,提出一种基于区域间关系的有监督图像语义标注方法。图像的某一语义概念往往与图像的许多区域特征有关系,这些区域间也存在着语义相关性,因而本方法在对测试图像进行语义标注时,提出了考虑测试图像区域间相关性的算法,且通过在Trecvid2005视频库和Corel5K库上的实验证明了该算法的可靠性和有效性。另外也分析比较了图像均匀分割和JSEG分割算法,使用均匀分割代替JSEG分割,并结合考虑图像区域之间相关性的方法,进一步提高了图像的语义标注性能。