基于深度学习的多标签图像分类系统设计与实现

来源 :南京师范大学 | 被引量 : 3次 | 上传用户:viviane_px349
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网行业的飞速发展,图像数据不断增长,图像大数据的时代随之而来。最初的单标签图像分类技术已无法满足含有多种复杂语义的图像分类需求。多标签图像分类技术应运而生。但是,我们需要努力创新出一些分类识别速度快,精准度高的多标签图像分类方法。本文针对多标签图像分类的过程,研究一些不同的网络结构在不同数据集上的分类性能。提取出的特征的精细程度与多标签分类器对最后的分类结果影响十分重要。而不同的网络结构以及参数设置也会影响着最后的分类精度。本文中主要在前人研究基础上探索一种新型的网络结构,致力于提升多标签图像分类精度。本文主要工作如下:1.阐述了深度学习的基础知识,从各方面重点介绍了卷积神经网络。本文采用的模型是在牛津大学科学工程系提出的VGG网络的基础上加以改进。主要将原来由13个卷积层与3个全连接层组成网络的池化层进行改进,采用空间金字塔池化取代原网络中的池化结构。同时,还将原网络中的目标函数换成了一种由最大边距目标函数、最大相关目标函数、熵损失函数共同结合的一种新型目标函数。根据研究发现,已被提出的HCP网络结构与我们改进后的VGG网络之间各有所长,因此我们将两种不同的网络结构进行了一个结合,互相弥补彼此之间的不足,以达到最佳效果。2.我们将设计的新型网络分别在PASCAL VOC 2007和PASCAL VOC 2012数据集上进行实验。分别使用两个数据集对网络进行训练,测试。测试结果表明我们设计的网络能够很好的处理多标签图像分类任务。我们采用不同的方法进行对比实验,例如:人工设计特征方法、浅层机器学习方法、还有一些不同种类网络结构的方法在相同的数据集上进行实验。实验结果表明,采用深度学习网络结构的方法要比人工设计特征、浅层机器学习方法更加显著高效。最后,我们实现一个简单的图像分类系统。该系统使用简单,图像分类效果显著。
其他文献
针对大断面电力盾构隧道穿越长江时管片拼装方式对隧道结构内力影响显著的问题,以苏通GIL综合管廊工程盾构隧道衬砌结构为研究对象,利用梁-弹簧模型模拟管片结构,采用荷载-结
一切源自“酿造更美好世界”中国的酒文化博大精深。然而近年来,合桌尽兴、一醉方休的传统却日益困扰着人们的安全出行。据相关资料显示,在中国超过半数的交通事故是因为 Al
简讯是报刊政论语体中最简短的一种体裁。简讯最基本的特点是程式化。 语言学家对简讯的程式化在单词、词组、句型等方面的体现己做了大量论述。但是,简讯的程式化并不仅仅表
单目图像深度估计是计算机视觉领域的热点问题。然而,受到单个摄像头的制约,想要通过空间立体几何计算图像中精确的深度信息是极其困难的。单目图像深度估计是对一幅图像上的所有像素点赋予一个相对深度关系,传统方法估计深度通常使用人工特性,极易产生重构错误。近年来CNN网络在计算机视觉领域取得了瞩目的成就。与人工特性相比,CNN特征是从大规模的数据中学习得到的,能自动高效地进行图像特征提取,同时表征图像丰富的
建国以来,伴随着成人高等教育体制的改革,我国的成人高等教育在地位、目标、内容和类型等方面都发生了深刻的变化,并取得了巨大的成就。本文在回顾成人高等教育政策的基础上,
SOCS蛋白是细胞因子信号通路重要的抑制剂,最近的研究表明SOCS蛋白是天然免疫和获得性免疫系统中关键的生理性调节剂,它们可以调节树突状细胞的激活和T细胞的发育和分化等活
对所研制的法兰环缝局部真空电子束焊机作了简要介绍,对焊机的微机控制系统和电子枪极坐标行走的控制、二次电子焊缝对中、焊接轨迹的示教再现、真空系统和焊接工艺的微机控制
目的 探讨巨幼细胞性贫血患者出现精神症状的临床特征及病因。方法 选取82例巨幼细胞性贫血(MA)患者,按照有无精神症状分为2组,比较2组患者同型半胱氨酸的含量。结果 出现精神
研究一类平面2n+1次多项式微分系统的极限环问题,利用Hopf分枝理论得到了该系统极限环存在性与稳定性的若干充分条件,利用Cherkas和Zheilevych唯一性定理得到了极限环唯一性的若
以蛇莓、金银花、野菊花和蒲公英为研究对象,采用氢化物发生-原子荧光光谱法测定几种抗癌中草药不同器官中的硒含量。通过对比分析金银花、野菊花和蒲公英不同器官的硒富集系