基于注意力机制的条状池化服装图像分类

来源 :东华大学 | 被引量 : 0次 | 上传用户:fq8628
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着服装业电子商务和网络购物的快速普及,准确和高效的服装图像分类不但可以实现服装的自动标注,也能大大提高服装检索和虚拟试衣等服装应用的效率。由于服装图像场景复杂,数量庞大,且易受光照、人体姿态和形变等因素影响,传统的服装分类算法例如支持向量机和K近邻算法等分类效率不高,错分类问题比较严重。因此,如何利用深度学习方法来实现服装的准确分类成为目前图像分类研究领域中的一个重要内容。本文针对服装图像VGG16和Res Net等分类模型较少考虑浅层的颜色、形状等特征,以及在特征学习过程中特征信息没有得到充分利用且会受到背景信息干扰等问题,分别提出了改进的基于深度聚合以及基于混合注意力机制和条形池化的服装图像分类算法。论文研究工作的主要内容包括:(1)针对深层卷积服装分类网络在得到高级特征信息时丢失较多浅层特征的问题,提出了DLA-VGG16分类模型。通过在每个卷积块内增加块内卷积层的深度聚合点,和在块与块之间增加聚合模块,使得分类模型能在充分利用不同尺寸的感受野得到服装深层特征的同时减少浅层特征信息的损失,从而减少了网络在学习过程中因为上采样和下采样造成的服装特征信息的丢失。(2)针对深层卷积网络使用注意力机制进行服装分类时通常只侧重于二维特征信息,而忽略三维特征信息的交互利用的问题,提出了基于全局三维信息的混合注意力模块。通过进行全局的三维特征信息交互,从而增强了跨维度信息的通道权重的利用。通过扩大跨维特征信息通道-空间依赖性,能够更好地分配特征信息的权重,从而能有效提取与服装图像分类任务结果相关度更高的特征信息。(3)针对服装分类易受背景信息干扰以及高相似度的服装类别被错分类的问题,提出了一种基于Res Net的长方形池化层分类方法。使用长方形池化层来代替网络中的传统正方形池化层,通过沿较长维度方向扫描全局来获得服装图像的全局信息的同时,还通过较窄池化层进一步提取局部特征,不仅有效避免了正方形池化层在提取特征时造成的损失,而且减少了与服装分类无关的背景特征的提取。通过在Fashion-Mnist和Deep Fashion服装数据集上对相关算法的验证,论文提出的基于非对称卷积的深度聚合服装图像分类方法表明相比于VGG16网络的准确率分别提升了1.22%和4.12%,改进的基于混合注意力机制的长方形池化Res Net服装分类方法相比于基础网络分别提升了0.55%和1.14%。综合实验结果,本文提出的基于注意力机制的条状池化服装分类算法能较好地融合服装图像的全局和局部、深层和浅层特征,同时结合混合注意力模块提高了服装图像的分类精度。
其他文献
不良资产占用资金,会限制商业银行的发展,及时处置自身的不良资产,构建并完善长效不良资产处置机制,有助于推动商业银行健康发展和改革创新。
服装关键点检测旨在定位出可以帮助识别服装样式、类别等的服装功能性区域。服装关键点空间分布差异大与服装图像尺度变化大导致服装关键点检测十分具有挑战性。为了解决上述挑战,服装关键点检测模型需要能够自主地专注于任务相关的特征,并提取出包含多尺度上下文信息的特征。因此,本文提出了基于注意力机制与残差网络的服装关键点检测算法,主要工作包括:(1)提出一种基于空间注意残差块与多尺度上下文聚合的服装关键点检测模
营商环境的优化需要法治的保障,刑事司法应当以适度宽和的运行方式助力营商环境优化。刑事司法的运行应当秉持以下原则:在宏观层面,保持刑事司法政策的稳定性,从历史唯物主义的角度看待民营企业的"原罪"问题,对于新兴行业保持一定的宽容性;在实体法层面,刑事司法的运行应当以规范保护目的限缩刑法的作用场域,以实质危害性作为行为入罪的标准;在程序法层面,刑事司法程序的启动和适用应当秉持谦抑性原则,切实保障民营企业
南宁白话属于粤方言邕浔片,是南宁城区最普遍使用的方言。文章对“孖、嬲、啽、噏、謴、攞、搣”等南宁白话的单音节古语词进行了考证释义。其中有词义完全继承古义的如“嬲”继承了“嬈”;有词义范围扩大的如“孖”;也有继承部分词义,与古义相关性极强的如“啽”“噏”“謴”“搣”“揸”等。
<正>为了满足客户加工多样化的需求,KADIA公司在机器人自动化解决方案以及去毛刺机器人单元上不断优化更新,通过调整及设置参数等多种途径,为客户提供了更优异的工艺保障。KADIA Produktion公司,位于纽廷根,多年来一直致力于设计基于6轴工业机器人的去毛刺机器人单元。目前,这一产品呈现出了新的趋势:具备更高附加值元件的解决方案,即含有常规加工工艺,如铣削、钻孔或螺纹切割。因此,机器人不再只
期刊
针对脉率的提取与监测需求,设计了一种基于Arduino单片机的脉率实时监测系统.该系统硬件主要由透射式脉搏传感器、Arduino单片机模块、声光报警模块、显示模块、Wi-Fi模块组成.系统采集人体脉搏信号,对其进行实时滤波和脉率计算,并通过Wi-Fi模块将计算结果无线发送到远端.通过设计实验,对所研制系统准确性进行评估,结果表明实时脉率的准确率在85%以上.该系统可用于家居、工作等生活场景下的脉率
<正>陶行知在创造教育中提出的"六大解放",即解放孩子的头脑、双手、眼睛、嘴、时间和空间这六方面。他认为学校的意义在于要教会每个孩子自主学习,让他们可以拥有自己发现和探索的能力,解放其创造力。陶行知先生是我国第一个提出"教育要以培养创造力为宗旨的",他认为"人人是创造之人",创造是人类代代相传的珍贵财富,是人类
期刊
中国传统的吉祥元素具有历史悠久的文化内涵和社会基础,是中华民族五千年不断沉淀和发展而传承下来的民族符号,对现代插画的发展产生了重要影响。融合了中国传统吉祥元素的现代插画更具民族风情、更具有辨识度,同时也激发了大众对中国传统文化的共鸣,具有前所未有的发展潜力。作为中国传统吉祥元素中的重要组成部分,中国古代石狮在插画当中的应用研究目前尚且存在空缺。因此,本文对中国古代石狮形象及中国传统吉祥元素进行了梳
地铁换乘站作为复杂的交通枢纽,它们的运行效率对于整个城市轨道交通系统至关重要。文章基于地铁车站的运营流程,分析了换乘系统的结构和流线,运用Anylogic软件建立行人微观仿真模型,并对仿真参数进行设置。以南京安德门地铁站为例,对早高峰时段的客流流线进行仿真。通过对仿真数据的分析,将拥堵区域客流密度变化以时变图形式表现,以此识别站内客流拥堵点,并针对站内空间及设施设备的布局提出优化建议。
随着我国教育改革进程的不断发展,教育正在逐渐回归育人的本质,教育目的在于发展学生正确的价值观、必备的品格和关键的能力。本文从培养学生核心素养的视角出发,探寻在高中生物领域中如何培养与提升学生的人文素养。本文主要的研究内容如下:第一,通过相关文献的查阅将人文素养分为四大类,包括人文知识、人文思维、人文精神与人文行为,具体细分为16个小类包括传统文化知识、人道主义精神、爱国精神与宽容合作等,据此制作人