论文部分内容阅读
随着图像识别技术和基于内容图像检索技术的深入发展,自动图像标注技术受到了空前的关注,并渐渐成为了图像处理和模式识别领域里的一项重要的研究课题。自动图像标注方法的提出在一定程度上解决了传统的基于文本和内容的图像检索系统存在的人工标注工作量巨大以及“语义鸿沟”等问题。自动图像标注首先根据全部己标注图像集来构造一个图像底层视觉特征空间和图像高层语义概念空间与之间的关系模型,然后让计算机根据己有的信息自动地去学习该模型,并最终达到给未标注的图像加上能表现图像内容的语义标注词的目的。那么,如何有效地提取图像的底层视觉特征对图像语义进行准确描述,如何有效地构建一条快速的、优良的连接图像底层特征和图像高层语义之间的信息通道,如何对基本图像标注结果进行优化,这些都将是实现自动图像标注的关键,也是众多研究者面临的极具挑战性的工作。针对这些问题,本文将以基于图的自动图像标注方法为重要立足点,围绕该方法的理论基础和实现过程展开进一步研究,并给出了改进方案。提取图像的底层视觉特征是自动图像标注过程面临的首要也是非常关键的基础性任务。本文着重阐述了基于颜色直方图和基于Gabor小波变换两种颜色和纹理特征描述方法。针对传统固定权值特征融合方法没有考虑到特征向量的内部关系以及需要大量的实验才能确定权值的问题,提出了一种基于权值矩阵加权的特征融合方法。并通过实验对比证明了该方法可以达到更好检索性能。在基于传统的构图模型的半监督学习方法中,针对在构建以图像为节点的相似图时没有充分考虑到数据集中数据子集的结构分布信息的问题,提出了基于Voronoi图的k阶邻近的半监督学习方法。以基于Voronoi图的k阶邻近的半监督学习方法为基于图的标签传播的原理与机制,提出一种利用基于Voronoi图的半监督学习自动图像标注方法(VGSSL)。该方法充分考虑到Voronoi图在表达空间目标影响区域的天然优越性,以及其k阶邻近在表示点对间的相似性时很好地融合了图像数据点在特征空间内的分布信息。在构造图像间的相似图时引入了Voronoi图来对其进行影响,充分利用未标注图像与已标注图像底层特征的内在相关性,以图为载体,半监督学习为指导思想,标签传播算法为驱动,再结合多标记学习,实现了已标注图像的标注词向未标注图像的传递,并最终完成了对未标注图像的标注任务。通过方法对比实验,VGSSL相比于其他方法能够获得较高的性能,且标注结果有了显著改善。