基于弱监督的图像区域自动标注算法研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:ryanme
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在本文中,我们关注一个挑战性的问题—基于弱监督的图像区域标注,即在数据集中只有图像层标签这种弱监督信息可以使用。图像区域标注在计算机视觉以及图像信息检索领域中有广阔的应用场景,并且能够在一定程度上打破高层语义和在计算机中图像的低层像素表示之间的语义鸿沟。传统的图像区域标注问题需要大量的带有区域标签的数据,但是标注这些数据是非常耗时耗力的。图像层的标签,对于图像区域标注这较为细粒度任务具有非常的不确定性,但是图像层标签非常容易获得。各种互联网数据的爆炸式产生也为弱监督问题提供了大量的初始数据。弱监督图像区域标注目前仅有较少的研究工作,本文主要有以下贡献:一、对弱监督学习的解决方法进行了完整的综合性介绍。在弱监督学习过程中,由于数据具有不确定性,通常情况下,需要借助上下文的信息来降低样本标签的不确定性,我们称为协同标注。我们首先介绍了KNN和稀疏编码两种方式来寻找目标的上下文信息,同时我们介绍了如何使用这种上下文信息构建语义图以及如何在图上进行标签的传播,本文中我们介绍了两种标签传播的方法,马尔科夫随机游走以及谱聚类。二、提出了基于判别语义的构建上下文的方法。我们注意到,弱监督的图像区域的标注传播主要问题在于如何找到有效的上下文信息进行协同标注,而传统的完全基于相似性的上下文获取方式容易导致过同质化问题,即上下文超像素中的视觉信息以及图像层标签都非常相似,各种语义标签共现现象导致目标超像素的标签具有不确定性。所以我们提出了基于判别语义的上下文查询方式,我们对判别语义进行了定义,在上下文查询中,不仅仅考虑视觉相似性和语义相关性,还考虑判别语义(Discriminative Semantics)的信息。我们提出了如何根据判别语义信息构建判别语义图(Discriminatively Semantic Graph,DSG)。三、我们提出了如何在构建的判别语义图上面进行标签的传播。我们通过构建两种语义图将标签传播分为两个部分,在inter-image图(DSG)上我们考虑不同图像间的上下文信息来得到超像素的标签分布概率。在每个intra-image图上我们考虑每张图像的相邻超像素节点的视觉信息和语义标签来建立能量函数,通过Graph Cuts方法求解能力函数得到最终超像素的标签分配。我们的实验是在两个数据集MSRC-21以及PASCAL VOC 2007上进行的,使用平均类别准确率以及单一类别准确率作为评测的指标。我们的方法在两个数据集的多个单一类别以及平均类别准确率都取得了较高的准确率,进而证明了我们方法的有效性。
其他文献
生物监测技术与化学分析法相比具有先知性、预见性和警示性。利用生物监测技术建立水环境安全预警系统是目前国内外环境科学研究的热点,以鱼类作为水质监测生物载体的水质在
网络的普及推动了视频会议的发展。本文首先介绍了视频会议的起源、发展及意义;然后阐述了流媒体技术的相关知识;接着介绍了Macromedia Flash Media Server(FMS)技术的特性,
随着智能移动设备和定位技术的快速发展,LBS已经被广泛应用于移动应用软件之中,通过使用地理位置信息,这些应用在为用户带来更加个性化和有针对性服务的同时,也给用户地理位
无线传感器网络集成了传感器、计算机和网络三大技术,是一种全新的信息获取和处理技术。在无线传感器网络中,节点首先采集各种信息,然后对采集的数据进行内部处理,最后利用各
人脸检测最初是人脸识别问题中的一个子问题。关于人脸识别的研究最初开始于上个世纪六、七十年代,一直到现在仍然是一个研究的热点问题。最初的人脸识别在定义问题的时候主
近年来,随着数据库技术在世界上的不断普及和推广,数据库在各行各业中得到了广泛的应用,将数据库技术和图像处理技术结合在一起使用也已经成为数据库应用的一个重要领域。利
随着中国经济的快速发展,人们的生活水平不断提高,网络在中国得到迅速普及。截止到2015年底,中国的网民数量已达到了6.88亿。再加上网络设备和传输介质等硬件的更新换代,网速
随着移动通讯网络的高速发展,特别是目前GPRS和3G技术的推出,手机上网已成为一种趋势与潮流。手机已成为我们获取信息的重要工具。然而,当我们需要利用手机查询一些如电话号
随着Internet技术的快速发展,互联网已经成为人们日常生活中从外界获取信息不可缺少的手段。从政府机关和各企业公司到个人生活,都离不开互联网。但是随着网络技术的发展,Web网