基于深度学习的图像多标签分类算法研究

来源 :北京交通大学 | 被引量 : 2次 | 上传用户:whlyxyx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像分类是计算机视觉领域的研究热点之一,图像多标签分类更是在智慧相册、图像智能管理等领域有着广泛的应用。在这个信息科技飞速发展的时代,网络上的图片、视频资源数不胜数,并且样式各异。如何对这些类别、内容都不相同的图片进行合理有效的管理成为很多学者研究的重点课题。得益于深度学习的快速发展,卷积神经网络已经在图像多标签分类上应用并取得了良好的效果。然而由于多标签图像的复杂性,往往同一图像上具有多个目标,并且目标的形状位置都具有随机性,所以图像多标签分类的研究具有一定的挑战性。目前存在的基于深度学习的多标签分类方法既没有充分体现网络结构的高效性,也没有充分考虑不同目标之间类别上的关联性,这使得多标签分类无法达到很高的准确性。基于此,本文对基于学习的图像多标签分类算法展开研究,主要工作如下:(1)基于高效Refinedet算法的网络结构,提出了一个用于图像多标签分类的密集连接的细化网络(Densely Connected Refinement Network),简称为 DCRN。DCRN将DenseNet中的稠密连接模块添加到Refinedet两个模块不同尺度特征图的连接过程中,使每一层学到的特征图都能被后面所有层直接使用,这大大增强了不同尺度的特征在整个网络中的复用,也使模型变得更加简洁。这样的密集连接方式提升了梯度的反向传播,使得网络更容易训练,在一定程度上提升了算法的准确率。(2)在DCRN的基础上引入了注意力机制,提出了用于多标签分类的attention机制下的DCRN算法。注意力机制可以通过学习各个目标之间的相似性关系为不同重要程度的目标赋予不同的权重,即对关心的目标分配一个较大权重,对无关紧要的目标分配一个较小的权重。通过这种方式可以有效增强识别的准确性。本文将包含注意力机制的目标关系模块代替非极大值抑制(NMS)算法用来去除重复的检测框,这样可以避免NMS需要手动设置参数的问题。通过对不同目标的类别分数和边界框坐标赋予不同权重来进行最后的类别概率输出和边界框回归,实验证明这种方法使算法变得更加准确。(3)在对算法进行研究和训练并得到了更高的准确率后,本文设计并实现了一个基于C/S架构的图像多标签分类系统平台,以作者拍摄所得的生活照作为系统的输入,经过上述算法对图像进行测试,为这些图像打上多个不同类别的标签,完成了图像多标签分类的任务。
其他文献
假如一箱苹果中有一个苹果出现了很小的斑点没有处理,那么到了第二天,那个斑点就很可能会变大。如果仍然继续不处理,过一段时间再打开箱子,就很可能会传来难闻的气味——不仅原来
报纸
构建包含基本生物学和生态学信息的外来物种数据库不仅对理解生物入侵分布格局至关重要,同时也是制定外来种管理策略和解释生物入侵过程的重要一步。作者在前人研究的基础上
彩塑是中国最古老的民间艺术之一。惠山泥人在彩塑发展中形成了独自鲜明的艺术风格及特征。本文从惠山泥人的起源和发展,惠山泥人的造型和用色等方面对惠山泥人的艺术特征和文
五卅惨案爆发之际,茅盾和叶绍钧都写下了纪实性散文,由于作者政治面貌的差异,散文涉及的历史背景各不相同;此后,这些文字又被组合成了长篇小说《倪焕之》和《虹》的五卅章节,
<正>《资本论(少儿彩绘版)》李晓鹏著接力出版社2018.1定价:78.00元推荐理由:《资本论》是马克思主义的重要百科全书,是政治经济学、哲学、科学社会主义的宝库。《资本论》创
地基土体中,附加应力的研究一直建立在弹性连续介质假设的基础上.但土体是固、液、气三相组成的松散体系,土体结构是由许多个层次组成的复杂系统,它与弹性连续介质相差甚远.
为了明确沙南地区原油的来源,采用全烃地球化学方法,分析准噶尔盆地沙南油田的原油各项地球化学指标,并进行油源对比.研究认为沙南地区原油碳同位素较轻,与二叠系烃源岩抽提
2007年5—9月,对松嫩草原盐碱土过氧化物酶活性及肥力因素进行测定,为改良利用盐碱草地提供理论依据。结果表明:研究样地内过氧化物酶活性变化范围较大,g月份变异系数最商;随着植
一、企业战略薪酬管理的基本分析$$企业薪酬策略与企业目标紧密结合,两者之间是相互联系、相互影响的,企业战略目标的变化直接影响企业的薪酬管理方法的确定,同时,企业薪酬管理制
报纸
目前以产权改革、电子商务、连锁经营和物流配送等为主要内容的流通现代化进程已经全面启动。这标志着中国进入了凭借流通创新来全面提升国民经济运行速度、质量、效率和综合