论文部分内容阅读
随着“大数据”技术的飞速发展,数据成为当今社会生产生活中非常重要的资源,通过对大数据的快速处理,可以为社会带来巨大的经济效益。图像作为网络中传输最频繁的数据,如何对其进行快速有效的检索,成为了目前学术界亟待解决的问题。目前,基于语义的图像检索技术已经比较成熟,但是这要求对所有的图像都进行关键字的标注。因此,自动化的图像标注技术是该检索技术大规模应用的前提。 本文综合考虑了图像的区域语义相关性,并通过构造区域语义相关性模型,实现有效的图像自动标注和复杂语义检索,主要研究内容包括: 第一,提出了基于区域语义相关性分析的图像自动标注方法。该方法通过对图像进行分割,利用扩展的“词袋模型”表示图像的内容,并采用了多标签分类器MFOM(Maximal Figure-of-Merit)对图像区域语义进行分析。针对图像区域语义位置关联,创新地提出了基于区域语义的绝对位置关系模型和相对位置关系模型,并对其进行有效结合,实现图像区域标签的预测和校正。实验结果表明,语义位置相关性分析有效的提升了图像区域标注的准确性。 第二,提出了基于语义位置关系的多模态融合图像检索方法。该方法通过对图像区域语义位置关系的研究,构建了包含区域标签及标签之间区域语义位置关联的区域语义关系本体。基于该本体,提出一种多模态融合的图像检索方法,该方法包括两部分:1)基于语义位置关系的图像检索。本部分针对不同的检索条件(包括描述信息和示例图像),提取出图像的标签和标签位置相关信息,然后构造相应的检索模式,在图像库中得到符合相关检索模式的图像集。2)基于相关反馈的图像检索扩展。本部分以上一步中得到的结果集中符合用户预期的图像为种子集,采用基于内容的图像检索,在海量图像数据集中搜索相似图片,从而得到更加丰富多样且满足用户需求的检索结果。实验结果表明,基于语义位置关系的多模态融合图像检索,能够满足用户对于语义位置有特殊要求的复杂检索需求,得到更为有效和准确的图像检索结果。