论文部分内容阅读
随着互联网、云计算,人工智能和大数据等技术的多元化发展,互联网中图像数量急剧增加。由此产生了一个备受用户关注的问题:如何在这些海量的图像中高效地检索到满足需求的图像。而图像检索的效果很大程度上依赖于图像语义标注,但是由于图像底层特征与高层语义之间的“语义鸿沟”的存在,对于图像语义标注工作仍然具有很大的挑战性。针对此问题,本文围绕图像自动标注展开深入的研究,主要做了以下工作:(1)本文基于支持向量机的图像分类模型和融合语义主题的图像标注模型,提出了一种融合图像分类信息的概率语义分析模型的图像标注方法。两者融合后优势互补,首先,基于支持向量机的图像分类弥补了在概率语义分析模型中的图像特征数据在量化过程中仍会丢失重要信息的问题;其次,基于支持向量机的分类模型专一地提取图像的颜色特征,而概率语义分析模型只是笼统的提取图像的底层特征,融合后可以有效地避免因特征提取方式不当对图像标注结果造成不利影响。两者融合后,得到图像的候选标注词概率集,实验表明,其图像标注的性能有了显著的提高。(2)为了进一步优化提高图像标注的质量,本文又提出了融合相似度模型的图像标注方法,该方法的思想是:利用图像相似度算法计算出待标注图像和已标注图像集之间的相似度,统计出相似图像的文本标签及数量,生成一个图像间相似度权重,融入到候选标注词概率集中,对标注结果进行优化,实验表明其标注性能在原有的基础上有了明显的提高。(3)基于本文的提出的标注模型开发了一个图像标注与检索的微型系统,主要包括图像模型训练、图像标注和图像检索三个模块。首先利用图像数据集的训练集对图像标注模型进行训练,然后对待标注图像进行标注,最后可以通过文本关键字或图像实例对图像进行检索。本文采用Corel5k,Espgame和Iaprtc12图像集进行仿真实验,利用查准率、查全率和综合评价指标对标注结果进行评价。并且与翻译模型TM、跨媒体相关模型-CMRM、连续空间相关模型-CRM、PLSA-WORDS、PLSA-FUSION、RNN、ANNOR-G和FFSS等相关的经典标注模型作了对比。实验表明本文提出的方法获得了较好的效果。