论文部分内容阅读
随着多媒体技术和计算机网络的飞速发展,全世界的数字图像的容量正以惊人的速度增长。设计一个能够快速准确地检索用户需要的图像的方法有着巨大的现实意义。目前主要有两种图像检索方式。一种是基于图像关键字的检索(TBIR),另一种是基于内容的图像检索(CBIR),它们之间的差别在于图像内容的标注方式不同。 基于关键字进行图像标注目前主要有两种方法:一个或多个人手工选择的关键字标注、图像关键字标注自动生成装置自动生成。第一种方法,有很大的缺点,费时费力,标注的准确性和完整性不够,且往往带有主观偏差。第二种方法主要应用于目前常见的互联网图像检索系统中,根据图像所处的上下文环境来判断图像的主题内容,这种标注方式符合人们的检索习惯,实现简单。但由于互联网的复杂性,使用这种标注方式的标注信息不够准确全面。 基于内容的图像检索,是直接从图像信息源中获得视觉内容特征,如颜色、纹理、形状作为图像内容的标注,图像检索的时候查找出和被检索图像视觉特征近似的一个或多个图像当作检索结果返回。这种方式需要进行大规模的计算,并且最终将这种低层的视觉特征映射到高层的语义后,由于图像的复杂性、标注字语义的不确定性,依然存在标注结果与用户理解之间的偏差。 为了克服以上方法的不足,提高互联网上检索图像的质量,本文提出一种新的图像标注方法,综合运用自然语言,文本分类及自适应的网页正文提取等技术,基于网页上图像的多种关联特征,包括:图像的URL,图像的上下文,图像所在的网页主题等,对图像进行关键字标注。 本文的重点设计并实现了一个基于网页关联特征的互联网图像自动标注的原型系统,主要内容包括:对网页中图像关联特征的提取和基于这些特征对图像的标注两部分。在对图像关联特征进行提取时,利用本文提出的两种算法:基于DOM树图像上下文提取算法和基于视觉与规则的正文提取算法,能够准确地抽取出网页中与图像相关的语义信息。在对图像进行标注部分,利用所提取的关联特征和文本分类技术,实现对图像的语义标注。