弱监督学习下的多标签图像分类

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:skyforce2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然图像往往是包含着多种物体类型的多标签图像。对多标签图像进行准确地分类,既是计算机进行高级视觉理解的基础之一,也在实际生活中有着广泛的应用。由于多标签图像中包含了多种类型的物体,且往往具有复杂的背景信息,实现其准确分类具有较大的挑战,强监督学习是一种较好的解决方案。然而,强监督学习模型需要代价昂贵的目标级或者像素级标签作为监督信息。为了降低强监督学习的成本,本文对弱监督学习条件下的多标签图像分类算法进行了研究。一方面,本文改进了当前主流的图像分类网络框架。在当前主流的图像分类网络框架下,不同类型的物体之间存在着严重的特征竞争现象。这种特征竞争使得各类别在分类过程中所能获得的特征信息量严重受到其样本数量的影响。为此,本文提出了多路网络框架,以降低这种类型间的特征竞争带来的负面影响。本文的实验证明该框架能够很好地缓解特征竞争现象,提升多标签图像分类算法的性能。此外,该网络框架还具有很好的灵活性,可以依据不同的任务,设计相应的网络结构。另一方面,受到人类视觉注意机制的启发,本文设计了基于注意机制的多标签图像分类模型。首先,本文在多标签图像分类网络中引入空间注意机制,促使网络能够更好地学习物体在图像平面上的空间位置信息,使其可以更好地理解应该“看哪儿”;其次,本文提出了基于通道注意的多标签图像分类方法,考虑了卷积网络中通道特征的全局信息,以突出有效特征,抑制噪声特征,增加特征间的关联性,进而让网络更好地理解应该“看什么”。本文通过实验证明,在卷积神经网络中引入这两种注意机制在一定程度上提升了多标签图像分类模型的性能。引入注意机制的模型能够准确地定位目标位置。同时,本文提出的注意模型相较于主干网络,只添加了少量的参数,具备轻量高效的优点。本文的研究工作表明,多路网络框架能够有效处理特征竞争问题,而引入注意机制,能够更好地提取图像中的物体特征,二者均有效地提升多标签图像分类算法的性能。此外,本文的研究工作为探索可端到端并行运算的,轻量高效的多标签图像分类算法提供了解决方案。
其他文献
近年来,随着量子计算的快速发展,量子安全多方求和作为量子计算的研究分支受到广泛的关注。量子安全多方求和源于经典安全多方求和思想,都是研究多个参与者协同完成求和任务
莱州崖角藤Rhaphidophora laichouensis Gagn.属于天南星科龟背芋亚科崖角藤属。相比天南星亚科植物的花序(肉穗花序由单性小花构成,具明显空间结构分化,通常有附属器),龟背芋亚科植物的肉穗花序由两性小花构成,无明显空间结构,缺附属器。过去对天南星亚科植物及其访花昆虫(特别是芋果蝇)的研究发现,这些植物的花序具有特殊的佛焰苞结构,开花过程中花序有生热作用,而生热对促进花序合成
苏格兰向来以其优质的教育闻名于世,本文结合笔者在苏格兰北伯威克中学进行的历史课堂教学观摩情况,从苏格兰公立中学历史课程设置、历史教学评价、课堂教学等角度,对苏格兰
本文研究的主题是以股权转让形式转让土地使用权的商事交易行为的法律效力及其治理,研究视角是从法律规避视角对其加以学理分析,认为该商事交易是一种典型的法律规避行为。不
刑事缺席审判程序是经2018年《刑事诉讼法修正案》确立的一项新的特别审判程序,该程序的设立不仅对于完善我国刑事诉讼法体制具有重要意义,也对解决我国于境外追逃、追赃腐败
近年来,随着云存储的推广普及与飞速发展,越来越多的企业和个人将数据外包到云端进行存储,并通过网络访问、处理和分享存储在云端的数据。然而,云存储服务在给用户带来按需存
本研究的研究对象为初中数学教师,以心理学、人力资源管理学、组织行为学等学科范围内的经典理论为基础,结合工作分析法、行为事件访谈法(BEI)和调查问卷法等不同的研究方法,
机器学习作为人工智能领域内的一个重要方向已经在今天发挥出了越来越重要的作用,随着机器学习相关算法解决了越来越多的问题的同时,人们也面临着一些新的因为数据量大、模型
目的了解安徽省HIV/AIDS患者婚育意愿基本情况,探索HIV/AIDS患者婚育意愿的可能影响因素,为制定相关性健康和生殖健康服务政策提供依据。方法采用整群抽样方法,根据安徽省地
随着经济的发展和法治建设的不断推进,个人提高了对法律的重视以及自身权利的维护,公民自身的主体意识与法治观念不断增强,以往厌诉、避诉的行为逐渐向积极参诉转变,但是伴随