基于概念的web图像标注方法的研究与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:helpothers
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数码设备的普及和互联网的快速发展,网络资源环境下的图像资源越来越丰富。如何从海量的web图像资源中检索用户感兴趣的图像成为信息检索领域的热点问题。近年来,基于概念的图像语义标注和检索逐渐成为图像检索领域的主流方向。概念是图像语义表达的基本元素,本文将概念看成是图像的类别语义,进而将图像的概念标注转化为图像的分类问题。   本文研究的主要内容和成果包括:   (1)根据web图像的特点,提出了一种基于概念的web图像标注框架。此框架包括基于视觉特征的语义概念标注和基于概念的文本信息抽取两个部分。论文首先基于图像的视觉特征利用SVM分类器对图像进行概念标注,继而利用得到的概念在相应文本信息中进行启发式的语义信息抽取,完成图像标注。   (2)针对概念的普遍性带来的大类别集下的图像分类问题,提出一种基于最小距离分类器和SVM的级联式图像分类方法。实验结果表明随着类别集数目的增大,级联分类方法的识别精度好于单纯利用SVM进行分类。   (3)针对概念具有层次性的特点,本文利用ImageNet的概念知识与图像集,针对现实世界中的“人”和“车”两个类别构造了相应的概念层次树及其图像集,并在这个训练集上设计了自顶向下与自底向上两种层次分类策略。实验结果表明自底向上方法在识别精度上好于自顶向下方法,实现上也更为简单。   (4)本文设计了一种基于概念语义的文本信息抽取方法,首先以图像的类别概念为中心对文本信息进行领域内的命名实体识别,并结合命名实体的属性抽取出相关标注。实验结果表明这种方法得到的标注结果的语义更加丰富,可理解性更强。   (5)设计与实现了一个基于概念的图像标注原型系统.原型系统的实验表明,该方法具有较好的实用性,并为进一步的实验和研究提供了一个方便、直观、灵活的测试和展示平台。
其他文献
目前,Peer-to-Peer技术广泛应用在主流网络领域中并深受大众欢迎,在当代互联网中占据重要的一席。然而,随着P2P技术的发展和应用类型的增加,传统的P2P应用已经不能满足网络用
虚拟环境中采用自然光影可以有力地增强真实感,但是大多数算法难以实时运行。本文针对大规模虚拟现实系统平台的需求,研究其中自然光影的快速绘制方法,关键点在于满足实时性的前
神经活动是最复杂、最神秘的生命活动,揭示其奥秘是自然科学的最大挑战。而生物学研究表明生物神经系统的功能很大程度上受到其结构的影响,对生物神经系统拓扑结构的研究显然是
在物理仿真与动画领域,多种运动物体之间的碰撞检测以及多体多点非光滑接触仿真计算模型,由于多体自身特有的非光滑非连续数值特征,依旧存在非常大的困境和挑战。本文将围绕高效
随着社会经济的发展,机动车辆与日俱增,随之而来的驾驶安全问题受到越来越多的关注与重视。统计表明,在所有的交通事故中,10%-20%是由于疲劳驾驶造成的。因此驾驶员疲劳检测成为了
印刷行业面临着日趋激烈的竞争,客户对印刷品质量的要求也越来越高,而印前数据处理的优劣在很大程度上决定着印刷品的质量。在如今的印刷品中,图像占据了越来越重要的地位,由
粒计算是一门快速发展的新兴学科,它主要思想:把复杂信息按照特征和用户需要划分为若干较为简单的块,每个块称为一个信息粒,划分粒的过程称为信息粒化。它以模糊逻辑、粗糙集和商
数字印刷是印刷技术发展的重要方向,数字印刷的一个重要特征是每张印品上的图文数据是可变的,因此数字印刷要求极高的数据传输速率,当前主流硬盘带宽无法满足数字印刷对传输
基于视频的人体运动姿态跟踪是计算机视觉领域一个重要的研究课题,其广阔的应用前景对推动虚拟现实、人机交互、智能监控、医疗以及其他领域的发展有重要的研究意义。人体运
基于J2EE平台的轻量级开发框架消除了一些传统开发中多余的复杂性和技术方面的约束,业界应用十分广泛,但仍然采取效率低下的手工方式的模型转换,所以需要建立一套可行的系统