论文部分内容阅读
互联网中图像资源的爆炸式增长催生了高效的图像检索技术。自动图像标注是图像检索领域的关键问题,它根据图像的视觉特征和语义标签之间的映射关系来给图像添加标签。其中,给图像标注符合其语义内容的标签是图像标注的难点。本文研究基于最近邻模型的图像标注方法,着重针对最近邻图像的标签传播和标签修正两方面的问题展开研究。主要工作包括:1、针对图像的视觉特征和标签的潜在关系在传统的基于最近邻模型的图像标注方法中未能得到充分挖掘的问题,提出了一种基于多视角非负矩阵分解(Multi-view Non-negative Matrix Factorization,MultiNMF)的标签逆向重构方法,利用MultiNMF分解的聚类特性可以将图像的视觉特征和标签特征联系起来。首先,基于Multi NMF分解在图像视觉特征和标签特征上的一致聚类特性,利用基于MultiNMF分解的标签传播方法实现标签传播过程;其次,基于TF-IDF(Term Frequency–Inverse Document Frequency)能够衡量标签在图像库中重要性的特点,运用TF-IDF对测试样本的标注词概率进行修正;最后,基于最近邻图像间相似关系的可逆性,采用基于正反向筛选的方法选择测试样本的最近邻图像。在Corel 5K数据库中的实验结果表明:和未经测度学习的2PKNN算法相比,基于Multi NMF分解的图像标注方法的平均查准率降低了1.3%,标签召回数减少了19个,但其平均查全率和平均数分别提升了3.2%和0.8%。2、针对图像库中低频标签标注准确率偏低的问题,提出了一种改善低频标签标注结果的图像标注方法,利用图像标签之间语义共生的非对称性关系可以提升低频标签的标注结果。首先,基于标签语义共生的不对称性能有效衡量标签间的相互关系,利用基于语义共生不对称性的随机游走模型的标签修正方法对由基于最近邻模型的图像标注方法得到的标签概率进行修正;其次,基于图像视觉特征和标签的约束性关系可以指导标签的完善过程,采用基于多约束的标签完善算法对图像库中图像的原始语义标签进行丰富。在Corel 5K数据库中的实验结果表明:本文方法得到的低频标签的各项标注指标均优于传统的标注方法,和未经测度学习的2PKNN算法相比,本文方法的平均查准率、平均查全率以及平均数分别提高了1.2%、2.7%和1.9%,标签召回数提高了5个;同时,本文方法在全部标签中的平均查准率、平均查全率以及平均数分别提高了1.5%、3.3%和2.3%,标签召回数提高了8个。