论文部分内容阅读
计算机技术的飞速发展,开启了人类社会的信息化时代,互联网在人们的工作、学习以及生活中逐渐占据了重要地位。目前,互联网中已经积累了庞大的信息,并一直保持着快速增长的趋势。与此同时,随着多媒体技术的发展,数据的描述及传播形式日益丰富,趋于多样化,除了原先单一的文字信息,其他形式的数据,如图像、视频等逐渐成为互联网中信息传播的主流。图像具有生动形象、易于理解的特点,能够直观、快速地将表达的信息传递给用户,既可以作为独立的数据形式存在,又能够与其他类型的数据相互补充,这些特点,使图像成为了互联网数据的主要形式。Web图像,即在Web页面中的图像,处于互联网环境中,由发布者嵌入Web页面中展示给用户。研究发现,除了Web图像本身具有的视觉特征外,图像所处的Web页面中还伴有丰富的外部信息,即Web图像上下文信息。这些上下文信息在一定程度上揭示了Web图像的主题,对Web图像自动标注具有重要意义。本文主要研究Web图像自动标注的方法,充分利用Web图像视觉特征及所在Web页面中丰富的上下文信息,自动为Web图像添加标注信息。本文对Web图像特征提取、融合,以及标注方案的研究,有助于提升标注性能,构建良好的Web图像描述机制,为用户在海量的互联网数据中更准确地检索到目标图像奠定基础,对多媒体领域图像检索的研究具有较大的意义。主要研究工作和创新如下:(1)采用了基于AHP的上下文信息权重分析方法。本文首先对存在于Web页面中的Web图像上下文信息的类型进行研究,并针对不同的类型语义贡献度的差异性问题,提出了基于AHP的上下文信息权重分析方法,计算出不同类型的Web图像上下文信息的权重。(2)给出了基于权重的文本特征提取方案。不同于常规的文本特征提取过程,本文在(1)中工作的基础上,采用了基于权重的文本特征提取方案,此方案中主要使用了基于权重的TF-IDF算法,对中文分词后的关键词权重进行计算,最终选取权重较高的关键词作为Web图像的文本特征。(3)采用基于LDA的主题语义生成方法获取Web图像的主题和语义特征。本文中Web图像语义特征来自于其所属主题的语义特征,通过对图像视觉特征类型的研究,选取SIFT特征作为训练集图像底层特征,并通过聚类,生成图像视觉词袋模型;随后,使用LDA模型对图像视觉词语集进行训练,最终生成图像主题及其语义特征。(4)提出了基于PageRank的多特征融合方案。Web图像相关信息主要包含文本信息和视觉信息,都可以作为Web图像标注信息的来源。本文考虑到Web图像两种相关信息之间存在的异构性,提出了基于PageRank的多特征融合方案对Web图像文本特征和语义特征进行融合,其中,Web图像文本特征取自文本信息,语义特征取自视觉信息。(5)给出了Web图像自动标注方案。本文研究了图像自动标注的基本框架,并结合Web图像自动标注自身的独特性,给出了Web图像自动标注方案,并基于此方案实现了Web图像自动标注原型系统。本文基于实验数据集,对上述工作中提出的算法进行了实验对比,实验结果验证了本文提出的Web图像自动标注方案的有效性。