基于深度学习的服装图像解析算法的研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:jiangyoung
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
服装解析由于其在时尚合成、姿态估计等领域的广泛应用而受到越来越多的关注。随着卷积神经网络的快速发展,现有的服装解析方法在卷积神经网络技术的帮助下也取得了优异的性能,极大地推进了服装解析任务技术的研究和应用。但是由于人体形态多变、服装类别多样、目标对象尺寸差别大以及对象边缘模糊等特点,现有的服装图像解析方法很容易产生错误解析结果,特别是在一些相似和细小的服装类别上。同时卷积神经网络自身也存在重复的下采样操作导致图像分辨率显著降低和大量空间信息的丢失等问题。因此,为了提升服装图像解析结果的准确性,本文主要研究如下:(1)提出了一个基于多尺度融合增强的服装图像解析算法。为了恢复卷积神经网络下采样过程中丢失的空间信息,该算法在解码过程中设计了一个融合增强模块对不同层次的特征进行融合,并用不同的感受野捕获融合后的多尺度特征信息。同时利用通道注意力机制获取全局上下文信息,然后将其作为权重对多尺度特征的重要程度进行选择。最后通过串联多个融合增强模块的输出特征进一步增强特征的表达能力,并将串联后的结果进行上采样获得最终的解析结果。(2)提出了一个由多级特征融合和边缘检测两个分支组成的双分支网络。该算法首先在多级特征融合分支中使用更轻量级的特征融合模块融合不同尺度的特征图,进而实现在保持参数量不变的情况下丰富了特征的语义信息。其次,本文还设计一个边缘检测分支,利用不同尺度的特征图提取精细的边缘信息弥补下采样过程中丢失的细节信息。最后将两个分支的结果进行上采样融合,从而得到最终的解析结果。(3)提出了一个多尺度注意力引导的服装图像解析算法。该网络从注意力机制的思想出发,提出了一个注意力引导模块在捕获全局上下文信息后引导有鉴别性特征的学习。同时在该注意力引导模块中使用额外损失函数监督特征的学习过程,实现准确识别相似的或者一些细小的易忽略的目标对象。接着本文还设计了一个多尺度融合策略逐步对多个注意力引导模块输出的注意力特征进行融合。最后将融合后的特征通过线性插值得到与原始图像同样的大小作为最终的预测结果。以上三个算法的所有实验都是在Fashion Clothing和LIP数据集上进行的。大量的对比实验结果表明,本文算法不仅可以有效地改善服装图像的解析结果,而且与其他先进解析算法相比,也都取得了优异的解析效果。本文提出的模型可以应用于服装识别、智能衣橱和姿态估计等实际应用场景中。
其他文献
随着人工智能的发展,智慧医疗已成为目前炙手可热的智能应用领域,在医学图像处理方面发挥着重要的作用。医学影像成像技术在临床医学领域的不断发展,使得人们对图像的依赖性逐渐增强,对诊断的准确率需求不断提高。因此,医学图像处理技术依然有很大的提高和发展空间。其中图像分割一直是该领域的突破点,尤其是针对脑部核磁共振这类灰度不均、存在部分容积效应、既模糊又复杂的图像,很难获得较高的精度。由于每个人脑内部组织存
学位
极限学习机(ELM)原理是利用一种基于单隐层前馈网络的学习算法,采用随机的方法确定输入层和隐含层之间的权值和偏置,通过分析的方法则可以进一步确定了输出层的权值,ELM克服了存在于基于梯度网络算法上的很多不足,如陷入局部极值、不合适的学习速率、学习速度较慢等,但ELM也存在着过拟合的隐患且单个算法稳定性相对较差。本文对此的研究工作如下:针对上述问题,本文提出了多样性正则化极限学习机的集成模型(DRE
学位
技术可以从一篇或多篇文档集合中得到总结文章主旨信息的简短摘要,并要求在遵循事实的前提下保持一定的流畅性。基于深度学习的自动摘要方法更接近人们总结摘要的思想,但其研究深度还远远不够,有待进一步深化。本文主要研究基于深度学习的单文档生成式自动摘要,并完成以下工作:(1)应用文本主题信息的短文本摘要研究。提出一种基于注意力机制和双向长短记忆神经网络的主题信息增强的自动摘要模型,并导入指针机制以避免OOV
学位
文本语义表示是自然语言处理的核心内容,也是文本理解、处理和搜索任务中最基本的工作之一。传统的文本表示方法通常无法充分建模文本的上下文信息,导致文本结构信息缺失、文本语义获取不充分。基于神经网络的方法虽然能获得相对较好的结果,但是其可解释性较差,严重影响了它的应用范围。考虑到知识在人类大脑中通常是以联想记忆的形式存在,论文从人脑联想记忆视角出发深入探究知识体系的内在结构,以探索一种新的文本语义建模技
学位
阿尔茨海默病(Alzheimer’s Disease,AD)是导致老年人死亡的最主要原因之一。其早期阶段为轻度认知障碍(Mild Cognitive Impairment,MCI),主要表现为记忆减退,判断能力下降等。发展到AD阶段则表现为记忆严重受损,情感变得急躁等,甚至日常生活不能自理。该病危害严重,不仅给患者带来巨大痛苦,也给家庭和社会医疗带来巨大负担。目前AD尚无法治愈,对该病的预防和早期
学位
频谱分析在信号处理中起着关键性的作用,其数学理论是正交函数系。地图曲线作为一类典型的几何信号,具有形态结构复杂、应用领域广泛的特点。本学位论文通过引入一类新颖的完备正交系——V-系统,展开对以地图曲线为代表的复杂几何对象的频谱分析。主要研究内容包括:本文第一、二部分:主要以地图曲线为例,实现基于频域滤波的线状要素化简方法和群组地图曲线的多尺度表达。首先,介绍了V-系统的基本理论和构造方法,并利用其
学位
本文在制度分析理论和科学社会学理论的指导下,对当前期刊论文撤销制度进行了梳理,在参考已有研究的基础上建立了期刊论文撤销制度学术净化效果的影响因素模型,以Web of Science中1951年至2021年的9089篇撤销论文基本文献数据、引用数据及其对应的撤销声明数据为主要数据来源,进行了变量的选取和操作化,将撤销后被引比例作为期刊论文撤销制度学术净化效果的衡量因素,在控制作者数量、参考文献数量、
学位
机器学习尤其是深度学习技术促进着现代医学的发展,在很多疾病的诊断过程中起到了重要作用。传统机器学习方法需要大量的数据来训练算法模型,而在智慧医疗领域,由于数据的来源涉及患者隐私,很难获取海量的生物医学数据进行公开研究,这给机器学习技术在该领域的应用带来了诸多挑战。在该背景下,本文主要结合EEG脑电癫痫信号和新冠肺炎肺部CT图像这两种生物医学数据的自动诊断问题,开展面向生物医学数据的小样本分类方法研
学位
点云的特征检测是点云数据处理中最基础也是最重要的一个环节,数据处理中的多数算法都与点云特征提取有一定的关联,例如:点云的配准、分割、曲面重建、重采样等。其中,点云配准技术在计算机视觉中起着举足轻重的作用,并且广泛应用于三维重建、目标识别与跟踪、智能机器人等领域,具有重要的研究价值。传统的基于点特征的点云配准技术,无法保证对应关系的准确性和效率。随着对测绘成果的要求不断提高,对配准技术的要求也随之提
学位
环状RNA(circ RNAs)-RNA结合蛋白(RBPs)结合位点在许多生物过程中起着重要作用。因此,研究RBPs在circ RNA上的结合位点是至关重要的。虽然基于传统机器学习和深度学习的方法已被用于预测circ RNA与RBPs之间的相互作用,但对已有算法还未能充分学习circ RNA的相关特征,也未能进行高效的协作学习。针对上述问题,本文研究两种用于circ RNA-RBP结合位点的识别方
学位