论文部分内容阅读
随着网络技术、多媒体技术、数据库技术的发展和互联网的不断普及,人们对越来越广泛应用的图像等多媒体数据的需求也越来越强烈。传统的基于文本的图像检索已不能完全满足人们的要求,基于内容的检索虽然解决了人们对图像视觉特征所代表的特征语义,但图像的底层视觉特征与图像的语义表达之间存在“语义鸿沟”,不能满足人们按语义检索图像的需求。所以建立图像的语义表示和检索机制势在必行,而对图像进行语义标注是基于语义的图像检索中的核心模块,也是图像理解要解决的关键问题。因此本文选择“图像语义标注方法研究及其系统实现”为研究课题。图像检索系统CSIR是为了能同时向用户提供基于内容的图像检索和基于语义的检索而设计的系统。在此系统的基础上,本文分析和研究了一种实时图像语义标注方法,并设计和实现了基于语义检索的核心部分—图像语义标注系统。本文的主要贡献在以下几点:(1)深入分析和研究了实时图像语义标注方法RALIP(Real-time Automatic Linguistic Indexing of Pictures)。其主要内容有:非欧式空间的图像相似性度量、机器学习算法D2聚类(Discrete Distribution[D2-] Clustering)、基于概率的MM混合模型(Mixture Model)以及基于模型的实时标注方法。(2)提出了基于不确定性推理融合标注结果的方法。本文对RALIP进行了部分改进,采用基于单个特征训练模型并标注图片,最后用不确定性推理融合基于不同特征的标注结果。实验表明,该方法通常情况下能较好地标注图片。(3)设计并实现了实时图像语义标注系统。该系统是对改进的RALIP方法的实现,由两部分组成:模型训练子系统和图像标注子系统。两个子系统是相对独立的,模型训练子系统可以离线执行,对图像训练集进行训练获得模型;图像标注子系统可在线执行,对未标注的图片进行实时标注。