论文部分内容阅读
随着计算机与互联网技术的飞速发展,图像等多媒体数据每日都以惊人的速度增长。如何有效而快速地从大规模图像数据库中检索到所需的图像是目前急需解决的一个问题。近年来,基于语义的图像检索技术受到极大关注,人们试图从图像中提取知识来增强检索系统的性能。语义检索模型的提出,有助于图像的半自动标注以及多语义(视觉特征与文本信息)检索。本文提出一种基于领域本体的语义图像检索模型,利用一种转化机制,实现了非结构化向量空间模型到层次化本体模型的转化。由于本体的层次化结构具有支持数据共享、概念多义等功能。因此,本文的检索系统利用概念关联而非简单的低层特征匹配来检索图像,来提高系统的检索性能(较高的查准率和查全率)。本文的主要研究工作包括以下几方面:(1)领域本体的构建。本文从国际奥委会官方网站上获取有关田径比赛项目的专家知识,提取相关概念,概念间关系及关系属性。(2)视觉词语袋(Bag of visual word)的生成。我们使用SIFT算法检测关键点并对其向量量化,然后利用一种新的聚类算法——语义局部自适应聚类(Semantic local adaptive clustering)对检测到的关键点进行聚类。由于SLAC算法既考虑了关键点的空间位置,又考虑了视觉词语权重,因此能明显改善视觉词语的质量(对视觉内容的表达)。(3)冗余视觉词语识别与剔除。对于那些对图像分类与检索无益的视觉词语,我们要设法识别并剔除,以减少系统的计算开销,提高系统的检索效率。(4)研究了非结构化视觉词语袋模型与层次化本体模型的最佳转化方式,实现了低层视觉特征到高层语义的映射,解决了视觉词语的同义、多义问题。(5)由各种原因引起的视觉内容理解的不确定性问题,本文也设法予以处理,以增强检索系统的分类与检索性能。综合以上研究工作,我们构建图像检索模型。最终的实验结果表明我们的方法不仅能有效表示图像的视觉内容,而且能显著提高系统的检索性能。