基于深度学习的多标签服装图像分类研究

来源 :华北电力大学(北京) | 被引量 : 0次 | 上传用户:whfbbs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
将深度学习与时尚分析中的服装图像分类结合是目前的研究热点之一,然而目前对服装图像分类主要是分成单个标签单独处理。在现实生活中,随着网络购物等服装商务新模式的出现、复杂决策的迫切需要,单标签服装图像分类已经不能解决问题,多标签服装图像分类成为一个重要的学习问题,展现出巨大的应用价值。多标签服装图像分类的目标是预测每张服装图像的一组服装属性标签。本文深入研究深度学习在多标签服装图像分类领域的相关方法,重点解决目前服装属性识别所面临三个典型问题:判别性图像特征学习,处理服装属性标签之间的相关性和训练集数据不平衡。具体来说,本文工作的主要贡献有以下几点:(1)提出双路特征融合模块提取出输入服装图像中更具判别力的特征,充分利用输入服装图像中的全局先验信息和局部示例信息。在多标签的服装图像中,一张图像中可能不止有一个主体,主体具有不同位置、尺度和姿势,一个标签可能与多个主体相关联。此外,一些标签与整个图像而不是一个小区域相关联。因此,全局和局部信息对多标签分类都很重要。该模块包含两路,在第一路中引入一个空间金字塔转换层来学习多尺度标签相关示例的局部特征,第二路从输入服装图像中捕获全局先验作为全局特征。(2)为了处理服装属性标签之间的相关性,更好地提升多标签服装图像分类任务的性能,构建了一个图卷积神经网络来捕获标签相关性,并将提出的GCN中的节点映射到一组相互依赖的服装属性标签分类器。将这组分类器应用到双路特征融合模块学习到的服装图像特征表示上,整个网络可进行端到端的训练。此外,对GCN的相关性矩阵进行优化设计,提出一种有效的再加权方案。(3)采用阈值调优策略,减轻数据不平衡对多标签服装图像分类模型性能的影响。本文对于每个标签不是采用同一固定阈值,而是采用阈值优化器自动遍历搜索每个标签的最优阈值,使用迭代贪心策略对阈值列表逐列以最优阈值进行更新,最后以更新后的阈值列表对输出概率进行阈值拦截得到最后的评价结果。将本文的基于深度学习的多标签服装图像分类算法与其他经典的单网络模型在本文所构建的服装基本属性数据集FashionML上的实验结果进行对比,客观结果数据显示:本文提出的算法较对比算法,有更高的mAP值、C-F1值、O-F1值;从主观来看:本文算法多标签输出结果更加全面准确。
其他文献
化隆县是我国国家级贫困县,受到地理位置环境及气候条件等多种因素的影响,化隆县面临着艰巨的脱贫攻坚任务。自精准扶贫政策实施以来,化隆县政府紧抓机遇,将化隆县拉面产业的发展与精准扶贫深度融合,共同推进化隆县脱贫攻坚任务的顺利完成,在拉面产业成为化隆县经济发展主导产业的情况下,两者的融合对精准扶贫工作的推进具有重要意义。当前,化隆县已经形成具有化隆特色的拉面产业精准扶贫方式,而拉面产业精准扶贫绩效如何也
如果把生物学知识比作网,生物学概念就成为网上的纽结。生物学概念不仅是生物学知识的基本骨架,还是学生进一步探究生物学现象与规律的基础。随着信息时代的到来和素质教育的推进,单一的教学形式已经不能满足现今的教学需求,教学形式多样化发展成为形势所趋。但由于受到应试教育的影响,对概念性知识采取的教学方式往往以传统讲授法为主,忽视对概念的理解和应用,导致学生虽能将知识牢记于心,但解决实际问题的能力却极为薄弱。
局部放电检测是评估电气设备绝缘状态的有效方法,其中高频电流法因具有传感器安装方便,检测频带宽等优点获得了广泛应用。但是,在局部放电高频信号的检测过程中,测试现场存在
随着我国铁路产品的不断优化升级,铁路战略的优化升级,高速铁路、高原铁路、载重运输等科技成果不断的更新换代,促进了铁路交通快速发展。从重载运输角度来说,我国大秦线是西煤东输的主要路线,现今的运输速度有了质的变化;从技术方面来说,我国的大功率牵引电力机车技术已经成功实现量产,这其中最引人瞩目的是单机功率可以达到9600KW的HXD3B型电力机车,此机车是现在世界上功率最高的电力机车。牵引变压器是电力机
我国在“中国制造2025”战略中明确提出将工业机器人等高科技领域方面的发展列为当前提高我国核心竞争力的关键一步。采用搬运机器人从事搬运工作,不仅可以代替人工完成重复性劳动,实现材料和零件空间位置的变换,而且利于生产的自动化,提高生产效率。但在高速搬运工况下,工业机器人仍存在的动态特性差、定位精度低等问题,本文以Delta并联机器人作为研究对象,从Delta机器人的尺度综合和轨迹规划两方面出发,对D
等值线图是高考中地理科目的考查重点,等值线图读图能力的培养对于提升学生的地理综合素养具有积极的促进作用。但现阶段,对于等值线图读图能力评价的研究数量较少。基于信息识别、特征解读、关联推论三维角度,构建等值线图读图能力评价指标体系;通过对教材及高考真题的分析,制定出等值线图读图能力测试题,以获取原始数据;运用TOPSIS模型,对选取的高中生的等值线图读图能力进行综合评价;通过障碍度分析,识别影响学生
本课题以芒果为原料,选用植物乳杆菌、嗜热乳酸链球菌、干酪乳杆菌、酿酒酵母D254、酿酒酵母DV10和酿酒酵母R2六种益生菌微生物,对发酵芒果浆的理化性质和抗氧化能力等方面进行比较研究,从而确定出发酵芒果浆最佳的乳酸菌和酵母菌。以感官评分为响应值,以接种量、发酵温度和发酵时间为因素确定混合发酵芒果浆的最佳工艺。对最优工艺条件下混合发酵芒果浆的理化指标和抗氧化能力进行分析,以开发具有更高生物活性和更好
随着社会不断发展,居民与各类企业对电的依赖性逐年增加,电力与生活的联系日趋紧密。越来越多的用户对用电安全提出了更高的要求,其稳定运行也变得更加重要。传统事故处理模式现在已越来越不适应规模庞大的电力系统,同时也无法更准确地辨别电网中的薄弱环节。当电网突然发生故障时,面对大量涌来的各类数据信息,调度员往往难于立即判断故障,迅速采取措施。因此,会耽误事故处理的时间,给生产造成重大损失。从电网实际情况出发
目的:通过比较很可能的阿尔茨海默病(Alzheimer’s disease,AD)和路易体痴呆(Dementia with Lewy bodies,DLB)患者在初次就诊及随访6(±2)个月、12(±2)月、36(±2)月和60(±2)月后的认知及精神行为变化情况,探索两种疾病的病程变化,以及轻度AD和DLB的早期鉴别点。方法:根据DSM-IV痴呆诊断标准,选择在2011年4月至2019年4月,就
彩礼返还规则是我国《婚姻法》立法中的一个重要的法律规则。其中,2003年12月25日颁布《最高人民法院关于适用<中华人民共和国婚姻法>若干问题的解释(二)》,及时地对彩礼返还问题作出了明文规定,规定了三种彩礼返还情形。但是近年来,彩礼纠纷现象只增不减,各类问题凸显,而其由于彩礼返还规则过于笼统、不详尽,所以也会导致一些彩礼返还案件会出现同案不同判等问题。因此,本文针对司法实践中出现的一