论文部分内容阅读
随着数码设备的普及和互联网的快速发展,网络资源环境下的图像资源越来越丰富。如何从海量的web图像资源中检索用户感兴趣的图像成为信息检索领域的热点问题。近年来,基于概念的图像语义标注和检索逐渐成为图像检索领域的主流方向。概念是图像语义表达的基本元素,本文将概念看成是图像的类别语义,进而将图像的概念标注转化为图像的分类问题。
本文研究的主要内容和成果包括:
(1)根据web图像的特点,提出了一种基于概念的web图像标注框架。此框架包括基于视觉特征的语义概念标注和基于概念的文本信息抽取两个部分。论文首先基于图像的视觉特征利用SVM分类器对图像进行概念标注,继而利用得到的概念在相应文本信息中进行启发式的语义信息抽取,完成图像标注。
(2)针对概念的普遍性带来的大类别集下的图像分类问题,提出一种基于最小距离分类器和SVM的级联式图像分类方法。实验结果表明随着类别集数目的增大,级联分类方法的识别精度好于单纯利用SVM进行分类。
(3)针对概念具有层次性的特点,本文利用ImageNet的概念知识与图像集,针对现实世界中的“人”和“车”两个类别构造了相应的概念层次树及其图像集,并在这个训练集上设计了自顶向下与自底向上两种层次分类策略。实验结果表明自底向上方法在识别精度上好于自顶向下方法,实现上也更为简单。
(4)本文设计了一种基于概念语义的文本信息抽取方法,首先以图像的类别概念为中心对文本信息进行领域内的命名实体识别,并结合命名实体的属性抽取出相关标注。实验结果表明这种方法得到的标注结果的语义更加丰富,可理解性更强。
(5)设计与实现了一个基于概念的图像标注原型系统.原型系统的实验表明,该方法具有较好的实用性,并为进一步的实验和研究提供了一个方便、直观、灵活的测试和展示平台。