论文部分内容阅读
自从上世纪70年代以来,图像发现就获得了广泛的研究,并经历了基于文本的图像数据库和基于图像视觉内容的检索两个研究阶段。但由于基于文本的图像数据库,采用图像信息手工标注,效率低下,主观随意;而基于图像视觉内容的检索技术,又难于跨越视觉特征到图像含义的语义鸿沟,因而实际应用的效果都不是非常理想。在这种情况下,基于语义的图像发现成为了最新的研究趋势。
相应的,文本标注作为一种最简单,有效的图像语义表达方式成为了基于语义的图像发现一个重要的研究分支。目前的图像标注技术主要有手工标注,半自动标注和自动标注。手工标注效率低,难以满足Internet这样大规模图像集的标注需求;半自动标注过于依赖于用户的反馈信息,同样也不适应Internet图像发现这样一个多用户的环境;对Internet图像发现而言,Web页面的提供者在提供图像的同时,也使用超文本(HTML)为Web图像提供了一个网络中的异常丰富的文本语义的外部环境,从Internet外部环境中自动抽取出Web图像的文本标注信息,这样一种自动标注技术高效,稳定,非常适用于Internet图像发现。
但当前的Web图像自动标注技术,对Internet环境下图像的文本语义信息缺乏一个系统的模型表示。而且目前的标注技术一般使用VSM方法,这种方法只能提供词条级的信息发现,不能提供更高层的语义级的发现,因而标注精度并不理想,而Internet环境下,图像标注信息少,用户查询平均长度短,这些都对图像标注技术的精度提出了更高的要求。
正是在以上研究的基础上,本文通过引入潜在语义分析(LatentSemanticAnalyzes)这一新的信息发现工具,进行Web图像的自动文本标注。一方面,通过对Web图像上下文文本语义的自动抽取,标注,大大提高了图像标注的效率和准确率。另一方面,相比传统的VSM(向量空间模型)而言,LSA可以将高维的特征空间映射到低维的潜在语义空间上,从而提供更高的标注和检索精度,支持用户在概念层次上的查询,并且能提供更好的相关反馈的支持。
本文的研究成果如下:分析了图像发现的两条不同的研究路线。讨论了图像检索技术的发展情况,指出了图像发现系统当前所面临的难题,及发展的趋势:基于语义的图像发现。研究了面向Internet的图像语义发现中的一个重要的研究课题——图像语义标注的当前研究状况,并提出了一种新的研究思路:Web图像潜在语义标注。
研究了潜在语义分析技术的线性代数理论基础,分析了潜在语义索引的5项关键技术:SVD(singularvaluedecomposition),查询表示,匹配算法,特征加入,索引重构。介绍了该模型在信息发现方面的成功应用,讨论了将潜在语义分析应用于Web图像发现的可行性及优点。
给出基于染色图的Web图像的理论模型,并在此基础上研究了图像在Web中的上下文语义信息表示模型WICI,给出了相应了自动抽取算法。研究了基于潜在语义分析的Web图像标注方案,并给出了相应的图像发现模型(WILSA),进一步研究了基于潜在语义模型的相关反馈技术。
设计了一个基于潜在语义分析的Web图像发现实验系统ImageHunter。给出了ImageHunter的体系结构及各个部分的定义及实现。探讨了ImageHunter实现中的若干核心技术,并在此系统上进行了实验,验证潜在语义分析模型应用于Web图像标注/发现的效果。