基于头像的发型识别研究

来源 :福州大学 | 被引量 : 0次 | 上传用户:Luke_ibox
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
发型是人脸外貌的重要特征,发型识别在许多领域都具有价值,如美容美发行业的发型推荐,游戏角色自动生成中的发型选择等。基于头像的发型识别是指给定一张包含具有头发,人脸信息的头像图片,通过对头像的分析,识别出头发的造型。本文针对网龙网络游戏公司提出的发型识别的任务需求,通过计算机视觉技术对发型识别进行了研究,主要工作如下:(1)通过引入注意力机制和多金字塔池化模块,本文提出了基于PSPNet改进的头发语义分割模型。注意力机制凭借其特有的结构,从特征图的通道信息和上下文信息中提取特征图的重要信息,抑制无关的噪声信息,细化上采样分割过程。金字塔池化能够将特征图的全局信息进行整合,让模型充分理解图片的全局信息,通过将图片的浅层特征与深层特征融合组成多通道的融合信息,使得模型对于全局信息的把握更完美。针对本文提出的模型进行实验分析,消融实验结果表明注意力机制与多金字塔池化对模型性能有所提升,与其它方法对比,本文提出的模型有效的提升了头发分割的精度。(2)从图片分类和特征度量两个角度对发型识别进行研究。从图片分类角度出发,针对数据量不足的问题,采用迁移学习方法将Image Net预训练模型作为特征抽取器,提取发型的深度特征进行分类,实验结果表明使用头发分割预处理的VGG16深度特征与逻辑回归分类器的组合方案发型识别效果最好,五折交叉验证的平均准确率达到94.6%。尽管发型分类是一种可行的发型识别方法,然而数据采集与模型重训练的代价较为昂贵,针对发型分类方法的局限性,本文从特征度量的角度出发,创新性地提出了基于特征的无监督发型识别方法,该方法首先使用基于人脸识别特征向量的性别识别方法识别头像性别,其次对头像进行解析,分析发型的长度特征,然后利用基于Image Net的预训练模型Res Net50提取发型的形状特征,最后对90类发型数据子集使用欧氏距离度量发型形状相似度,返回距离最小的前三个发型作为发型识别的结果。(3)设计并实现一个基于头像的发型识别系统。该系统具有用户登录模块,头像上传模块,头像解析模块和发型识别模块。本文从系统总体设计、功能模块设计和系统的实现与展示方面对系统进行了详尽的介绍,系统在windows环境下运行稳定,发型识别效果表现良好。
其他文献
随着地球村概念的提出以及经济的发展,金融市场变得更加开放,我国经济正在逐步进入信用经济时代,在这个时代,信用消费已成为人们常用的一种消费方式。随着各类信用用户的增多,信用缺失、信用欺骗等问题逐渐显现,这说明我国信用体制还有待完善。为了避免上述问题的发生,分析用户的信用成为关键环节。本文主要研究用户信用体系中的用户画像和信用评级,主要工作可分为以下几个部分:第一,介绍了金融数据的不平衡性并研究了不同
学位
图像修复的目标是利用图像中已知内容,按照一定的修复规则,自动地恢复丢失的内容,具有极其广泛的应用价值。而近年来深度学习在图像修复领域取得了一定的突破,但仍然存在一些问题,比如修复区域较大时,边缘容易产生伪影干扰等。且基于深度学习的模型大多数是基于自然图像进行设计训练,因此在自然图像上表现优秀的模型移植到特定样本经常难以达到预期效果,如医学图像。基于以上问题,本文主要的研究内容和工作创新点如下:(1
学位
近年来,人们在机器阅读理解的研究上取得了很大的进展。机器阅读理解的主要任务就是通过给定的文章和相对应的问题,利用模型的理解和推理能力给出问题的对应答案,因此如何提升机器阅读理解模型的推理能力,成为了机器阅读理解的重要研究方向之一。在机器阅读理解领域,大部分模型是针对特定阅读理解任务与数据集。本文分别针对离散推理和文本跨度预测类阅读理解问题提出相应的深度学习模型,并分别基于DROP(Discrete
学位
空气污染对人类健康造成严重危害,已成为一个难以解决或不可逆转的全球性环境问题。虽然建立了空气质量监测站来收集空气中的污染物成分数据,但由于监测站的建设费用非常昂贵,为了节省成本,监测站只部署在少数地点,并且需要进行维护,仅在部分时间启动。因此,我们只能得到部分位置和时刻的空气质量数据。由于空气质量数据量多且特征复杂,现有的工作根据已有部分位置和时刻的空气质量数据,使用深度学习技术推测其它位置和时刻
学位
随着信息通信产业的发展,在我们经历了互联的网时代、移动互联网的时代之后,如今已经走向物联的网时代,这个时代赋予了应用创新和发展的更大的机的会。在诸多场景应用中,对的于物的联网技术运用的得最丰富和的典型的就是的智能家居。智能家居是的以家庭的住宅为的平台,使用的物联网技的术集成与的家居生的活有关的基础的设施,提供了智能化的智能家居服务,从而为人们提供便利和舒适居住环境。同时随着各类智能虚拟助手的兴起,
学位
视觉目标跟踪是计算机视觉的一个重要研究领域。对于一个图像或视频序列,在仅有第一帧标注的情况下,视觉跟踪方法需要在后续的帧中预测目标位置。视觉目标跟踪可以对图像与视频中的任意目标进行跟踪,因而常常作为大型视觉系统的重要组成部分,具有较高的理论和应用价值。基于深度学习的目标跟踪方法在多个测试基准取得了较好的表现,但是仍然存在模型构建成本高、泛化能力受限、物体表征精确度低等问题。为应对上述挑战,本文从语
学位
随着智能手机等设备的普及,各种数字图片更加频繁地出现在人们的日常生活当中。如何让计算机通过图像来认识世界是许多学者一直研究的任务,其中一个重要子任务是图像显著性检测。图像显著性检测是许多图像处理任务的重要步骤之一,目前已经提出很多图像显著性检测方法。RGBD图像相较于彩色图像拥有额外的深度图,具有更全面的3D空间结构信息。本文致力于研究基于深度学习的RGBD图像显著性检测方法,包括基于边缘感知和跨
学位
文本情绪原因识别任务的目标是从文本中识别某种情绪表达背后的原因,已逐渐成为自然语言处理领域中的热点研究方向之一。近年来,随着深度学习技术的发展,该领域的相关研究取得了不错的进展。尽管如此,仍然存在着诸多挑战:未能充分利用文本子句间的相对位置距离特征,难以精确定位目标情绪子句的位置所在;未能充分挖掘文本中字符级、词语级等多粒度的文本语义特征;不能很好解决情绪多样化和数据不平衡带来的模型性能受限的问题
学位
公共交通在很大程度上能提高道路利用率,降低程度拥堵。城市轨道交通在公共交通中占据了相当重要的一环,相对于普通公交而言,轨道交通拥有独立路权,不会受到高峰时期道路拥堵的影响,同时城市轨道交通的运力又远大于同样拥有独立路权的快速公交。城市轨道交通成为了越来越多大城市缓解道路拥堵问题,改善路面交通的首要手段,是城市交通的核心之一。地铁客流关系到地铁系统的运营调度,是地铁数据中重要一环。分析不同条件下地铁
学位
跨领域文本情感分类旨在利用迁移学习算法实现领域间的知识迁移以解决目标领域标注样本匮乏的问题,是自然语言处理领域中重要研究分支之一。目前研究者们提出了一系列基于深度学习的方法来学习领域间的共性特征并取得了一定的成果。尽管如此,仍然存在以下挑战:现有方法捕捉句子中局部关系的能力不足,导致情感分类存在偏差;以往方法在提取文本特征时难以有效利用文本的上下文依赖关系与整体信息;现有模型存在分类特征空间受限的
学位