论文部分内容阅读
随着数字图像的迅速增加,图像检索等应用受到了广泛的关注。这些应用必须面对的一个主要难题是图像固有的歧义性。同样一幅图像所表达的内容含义会因用户和情境的不同而存在差异,从而导致在这些应用中难以准确地解释以及有效地处理图像。
本文致力于基于内容的图像检索(CBIR)和Web搜索中涉及的图像歧义性的处理机制的研究。本文认为,图像的歧义性主要是由用户对图像丰富内容理解的主观差异造成的。因此,选择合适的图像表示、充分使用用户信息以及借助于与图像相关的其它信息可望有助于缓解图像歧义性对相关任务的不利影响。具体来说,本文主要取得了以下一些创新成果:
1.提出一种新的多示例图像包生成方法,通过引入聚类分割技术,使得图像可以表示为语义对象相对完整的多示例包,从而可以方便地利用多示例学习技术处理图像检索问题,缓解图像歧义性造成的不良影响,提高检索性能。在此基础上,本文设计实现了原型系统MilIR,可以方便地对多种图像检索技术进行比较,并可作为开发实际图像检索系统的内核。
2.提出一种新的图像相似度度量方法,通过考虑用户的主观视角,基于查询自适应地确定图像间的相似度,从而突出用户关注的内容,有助于缓解歧义性对相似度度量的不利影响。研究结果表明,考虑了用户主观视角的相似度度量显著优于常规的相似度度量,有助干提高图像检索的性能。
3.提出一种图文协同Web搜索策略,通过利用不同模态信息的关联性和差异性来缓解歧义性造成的不良影响。该策略同时使用网页中与图像相关的文本
描述以及图像本身的视觉内容信息,确定用户信息需求在图像特征空间的表示,再通过结合图像的内容信息,获得更有效的网页序列。实验表明,该策略有效利用了多种模态的信息,有助于改善Web搜索的效果。