基于卷积神经网络的服装衣领分类研究与应用

来源 :南宁师范大学 | 被引量 : 0次 | 上传用户:gin901122
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,互联网的高速发展和电子购物平台的不断涌现,线上购物方式显得更加方便快捷,人们逐渐从线下店铺转向线上店铺购买服装。此外,随着服装产业的发展,在服装设计领域、服装销售领域,都对服装图片的管理,尤其是分类检索提出了更高的要求,特别是服装属性、细节分类,例如服装颜色、服装领型等。因此,在购物网站上利用衣领类型检索服装成为一种日益增长的需求。目前针对服装领域的研究主要集中在服装的类别和属性的特征提取上,包括服装的色彩、形状、纹理等,只有较少的研究者关注服装的细节分类,如衣领。当前容易收集得到的服装衣领图像所包含的背景噪声较多,且衣领部分往往存在形变、拍摄视角不同、缩放程度不同等因素,如果使用传统的方法对此类衣领图像进行分类与识别,模型很难排除背景因素的干扰,图像分类难度增加。此外,当前没有针对性的衣领图像数据集公开供研究者开展研究工作。随着智能化和大数据时代的开启,传统的方法无法高效地应对实际应用场景中背景复杂的、高分辨率的图像,表现出低识别率、低效率和低适应性的缺点。卷积神经网络的层级之间具有紧密相关性,善于挖掘图像局部特征,能够处理图像中丰富的空间信息并抽取关键性特征。为了进一步提高衣领图像的分类性能,满足现实生产生活的需求,同时鉴于近年来卷积神经网络在图像识别领域取得的重大突破,本文提出了两套衣领数据集和两种基于卷积神经网络的衣领图像分类方法,主要研究内容如下:一、针对当前图像分类领域中缺乏衣领图像数据集的问题,本文构造了两套衣领图像数据集,分别命名为Collar-4和Collar-6。Collar-4数据集中包括圆领、翻领、立领、连帽领4种类别,总计39248张图片。Collar-6数据集中包括圆领、翻领、立领、连帽领、V领、毛翻领6种类别,总计18847张图片。Collar-6数据集和Collar-4数据集相比,每类的图像数量少,并增加了两个类别。两个数据集均从互联网中收集而来。衣领图像具有多姿态、多噪声、分类区域小等特点,给衣领图像分类任务带来诸多挑战。二、为解决含有大量噪声的衣领数据集的图像分类问题并提升现有算法处理现实衣领图像分类的能力,本文基于所构造的Collar-4数据集,提出一种用于真实衣领图像的分类算法,该算法是在Squeeze Net网络中的Fire模块里添加注意力机制CBAM块进行改进的,改进后的模块称为Fire CB,改进后的算法称为Squeeze Net-CB。实验部分,将Squeeze Net-CB的初始化模型、迁移模型与传统卷积神经网络的初始化模型、迁移模型进行对比。实验结果表明Squeeze Net-CB的分类效果优于传统卷积神经网络。消融实验部分,对Squeeze Net-CB进行结构简化对比实验,进一步证明了本文方法的有效性。通过实验表明Squeeze Net-CB在Collar-4数据集上的应用是可行的,该算法可以有效地解决现实世界中有噪声背景的衣领图像分类问题。三、传统的图像识别方法在粗粒度图像上的识别效果良好,但在处理复杂背景特别是粒度过细的图像时,却无法准确地区分和把握住图像的主要特征。为解决上述问题,同时探讨卷积神经网络在小型衣领图像上的细粒度图像分类性能,本文提出了一种M-Res Net50分类模型用于服装衣领图像分类,该模型是在ECA-Res Net50的基础上结合了MC-Loss损失函数所设计。实验使用的数据集包括本文构建的Coller-6数据集,公共数据集Deep Fashion。实验结果显示,改进的模型比现有的CNN模型有着更高的准确率,更好的特征提取能力,解决了细粒度的衣领图像分类困难的问题,推动服装商品图像分类的进一步发展。本文进行的多组对比实验中,提出的算法和模型取得了较好的实验的效果,验证了本文所提出的方法在衣领数据集上的应用是可行的,可以有效地解决现实世界中有噪声背景的衣领图像分类问题。此外,验证了本文提出的Collar-4和Collar-6衣领图像数据的分布是合理的,可以支持分类模型的构建,可以作为现实世界中衣领分类任务的训练集数据,对于开展服装衣领的分类、检索等研究具有实际意义。
其他文献
作业是教育环节中的重要一环,是学生学习生活的重要组成部分,是培养学学习能力的重要渠道,也是获得学习成绩的重要途径。我国的教育推崇尊重个体差异思想,使得人人都要学会知识,在个体中全面发展。在当前教育形势下,教育学家特别重视课堂教育的研究,由此我国教育改革取得了很大的改观,但是作业作为教育环节中重要的一环,关于作业的研究甚少。由于数学学科知识抽象,逻辑性高,技巧性强,对于学生来说是数学一门难度较大的学
水资源是人类赖以生存和发展不可缺少的一种资源。确保水资源可持续利用,是实现经济社会可持续发展的重要前提条件。全球气候变化和人类活动影响下,地球上水循环不断发生变化,许多地区正在发生严重的水危机,如水资源短缺、水质下降、水土流失、旱涝灾害频繁等,成为限制区域可持续发展的关键性因子。广西北部湾沿海区域虽然水资源充沛,但年内和年际分布不均匀,更为严重的是水质污染与水生态环境恶化。流域水质污染已严重影响到
2001年教育部颁布了《基础教育课程改革纲要(试行)》,在纲要中明确要求学生应当以自主、合作、探究的方式进行学习。随着纲要的颁布,接下来各个学科开始了课程标准的改革,制定的课程基本理念中就包含了“探究学习”。在数学学科方面,自从《义务教育数学课程标准(2011版)》将探究学习作为学生最主要的学习方式之一引入数学课程以后,使得探究式教学越来越受到数学教育者的欢迎。但是随着探究式教学进入课堂,其实践效
社会性科学议题(SSI)教学近来已在西方科学教育界引起广泛的关注。很多学者都认为社会性科学议题能够有助于学生对科学的本质进行进一步的了解,能够让学生对于科学知识的获取能力得到进一步的锻炼,同时还有助于学生伦理道德的发展以及社会参与和决策能力的成长。现代科学技术应用于社会使人们的生活质量获得了极大的改善,但同时也伴随着对社会、环境甚至伦理的冲击,对于科学技术不当的使用也带来了持续性的争议。不同的人因
《义务教育课程标准(2011年版)》在课程理念中明确指出:教师应当准确把握教学内容的教学实质;数学课堂教学要引导学生进行数学思考和数学思维。数学课堂围绕核心问题开展教学有助于激发学生的数学思考,引导学生积极参与,促进学生深入理解。因此本文将对初中数学课堂的核心问题进行理论与实践相结合的研究,为一线数学教师提供一定的参考。本研究首先通过文献研究法对“数学课堂核心问题的内涵”、“数学课堂核心问题的特征
纳米技术的蓬勃发展使纳米传感器进入了新的篇章。因其荧光性能优异、发射峰窄而对称等优良的性质,半导体量子点(QDs)在分析检测领域显示出极大应用前景。作为一种新兴的荧光纳米材料,金纳米簇(AuNCs)在近年来受到广泛关注,其具有出色的生物相容性、良好的光学性质及易于功能化修饰等性质。在金纳米簇表面包覆金属有机框架材料(MOF),可提高金纳米簇的稳定性、发光效率等性质。因而纳米材料以及MOF包覆的纳米
广义拓扑空间是拓扑学的一个重要概念。近二十年来,众多拓扑学者对广义拓扑空间的许多性质进行了研究,获得了一些成果。本文继续探讨广义拓扑空间,研究广义仿拓扑群的若干性质,由两部分组成。第一部分构造了广义拓扑空间中关于混合广义闭集的几个例子,指出了相关文献中的一些漏洞。在这部分(第二章),主要结果有:结果1(例2.2)设τ1,τ2是X上的广义拓扑。两个(τ1,τ2)广义闭集的并不一定是(τ1,τ2)广义
最优化问题大量存在于信息工程、社会经济等各种领域.信赖域方法是优化算法中的一种重要方法,而且具有更易于建立收敛性和鲁棒性等优点.本文主要研究求解一般无约束优化问题、非线性方程组及其非线性最小二乘问题的改进的信赖域方法.在第一章中,首先介绍问题的背景和意义,以及信赖域算法在优化算法中的地位及其基本思想;其次对信赖域算法在国内外的研究进展进行介绍,包括研究问题介绍、信赖域方法的产生与发展、信赖域子问题
台风灾害是全球面临的重大自然灾害之一,其不确定性因素是产生风险的关键,因而台风灾害的模糊性和随机性在风险评估研究中不容忽视。为了更科学地对台风灾害风险进行评估,本文采用模糊信息优化技术中的信息扩散方法,引入综合考虑随机性和模糊性的云模型,将三维信息扩散方法与随机过程、云模型与风险矩阵、云信息扩散与三维信息扩散方法相耦合,构建台风灾害风险评估模型,并以登陆华南三省的台风为案例进行分析,具体做了以下几
随着现代工业的高速发展,越来越多的汞离子随着工业废弃物被排放,并侵入到人类的生存环境中。作为有毒重金属离子,即使痕量的汞离子的存在也会对人体产生显著的生物毒性,严重者可导致死亡。基于对人类生命健康保护的需要,多种汞离子的检测方法和装置被不断研究和开发,但多数检测方法存在对汞离子的选择性差、灵敏度低且检测过程需要借助大型仪器、分析时间相对较长、操作复杂等缺陷,不利于痕量汞离子的高效便捷式检测和快速分