基于面部特征的人脸绘制技术研究与应用

来源 :北方工业大学 | 被引量 : 0次 | 上传用户:MaoZeDongNiMaBi2005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,依托于深度学习等人工智能技术的革新,人脸绘制技术逐渐成为专家学者们的研究热点,在刑事侦查、数字媒体、教育培训、影视娱乐等领域中应用广泛。基于面部特征的人脸绘制技术,是通过深度学习获得真实人脸图像与面部特征的对应关系,根据用户绘制的面部轮廓特征,实时生成二维图像,逐步逼近真实世界中的人脸。但目前的人脸绘制技术依赖于大量的人脸特征数据集,生成的人脸结果存在可控性差、细节不够清晰等问题,因此,本文研究了基于改进的Deeplab V3+的人脸面部特征提取方法和基于改进CGAN网络的人脸图像生成方法,并实现了一套基于面部特征的交互式人脸绘制系统。本文主要研究成果如下:(1)针对人脸特征提取方法难以获取到清晰、稳定的五官轮廓特征的问题,本文提出了基于改进Deep Lab V3+的人脸面部特征提取方法。基于Deep Lab V3+的网络模型,构建编码区网络结构,提取输入图像的特征;构建解码区网络结构,解码输出语义分割结果;改进编码区的ASPP模块,采用深度可分卷积代替其中的普通卷积,并采用BN层规范化输出,降低了网络的训练难度。(2)针对人脸生成方法存在生成结果可控性差、细节不够清晰等问题,提出了基于改进CGAN网络的人脸图像生成方法。基于CGAN网络模型构建生成器和判别器,改进生成器结构,在UNet结构上扩充细节生成器,捕获了输入数据的颜色特征。为生成器和判别器添加空间自注意力机制,捕获输入数据的全局结构化特征。设计损失函数,训练并输出模型,实现高真实感的人脸生成。(3)针对目前的人脸绘制系统存在编辑门槛高、交互性以及绘制效果较差等问题,本文设计并实现了基于面部特征的交互式人脸绘制系统。根据系统的功能需求,划分为人脸特征提取模块、人脸图像生成模块、交互编辑模块以及基础组件模块。经验证,本系统交互体验良好,编辑门槛低,绘制结果真实感强,能够满足实际应用需求。
其他文献
问题生成任务是指在给定一个段落和指定答案的情况下,逆向生成多角度的问题。问题生成任务具有广泛的应用性,已经成为自然语言处理领域内的研究热点之一。但是,传统的问题生成模型中存在很多问题。一方面,模型对长文本语义信息提取不足,无法获取丰富的信息特征;另一方面,模型在文本和答案的交互上欠缺,造成生成问题的语义偏离于文本和答案。针对以上问题,本文在基于LSTM的问题生成模型上进行改进。该模型的编码器和解码
学位
监控录像是记录、回放和分析异常行为的关键工具。以传统的方法检测和分析视频中的异常事件需要对监控视频进行人工处理,但这些方法需要耗费大量人力,而结合深度学习算法的动作检测技术能够在海量数据中自动学习到健壮的行为特征,因此逐渐成为实时识别异常行为的解决方案之一。以计算机视觉理论为基础不断改进的动作检测算法前景广泛,具有重要的研究价值和实际意义。常见的行为检测技术尚存在行为识别的准确率低、对非异常行为的
学位
“眼睛是心理之窗”。近期的心理学和视觉研究表明,人的心理活动可以一定程度地通过视线表达。然而,用视线分析心理活动还需要与发球技战术相结合,还需要区分人物视线特征发现的场景。本文针对运动人物视线分析中存在的视线采集中图像提取的自适应问题、关键人物确定的自适应问题,以及运动人物视线与视线目标的相关性问题,对运动视线分析模型的自适应方法与技术展开研究。为了有针对性地研究运动人物视线,文中把视线分成“运动
学位
近年来,以BERT(Bidirectional Encoder Representations from Transformers)为代表的预训练语言模型在口语理解任务中有着优异的性能表现。然而,这类语言模型虽然性能较为出色,却通常只能在文本层面建立上下文关联,而缺少丰富的外部知识来支持其完成更为复杂的推理。为了解决这一问题,进一步提升此类语言模型在口语理解任务中的性能表现,本文提出:(1)为BE
学位
在“双碳“背景下,电动汽车因零排放,噪声小,能耗低等优点,将迎来较大的发展机遇。然而,电动汽车的快速发展暴露了充电桩等基础设施落后、车桩比悬殊的问题。私桩的加入可以改善上述问题,但也带来了服务质量良莠不齐,计价不合理,用户体验不佳的挑战。目前,常用可信度计算的方法来解决上述挑战,用于可信度计算的数据主要存储在第三方或者区块链充电平台。基于第三方的信誉方案存在中心欺骗,单点故障的问题;基于区块链的信
学位
随着物联网技术的飞速发展,各种物联网设备采集的数据源源不断产生并大量积累,这些数据具有巨大的利用价值并产生了大量的业务应用需求,此类应用也成为了众多行业领域的热点。在这些领域的应用建设中,围绕这些物联网数据的很多应用往往可以被表示为物联网分布计算环境下由一组大数据处理与分析任务构成的工作流,本文中把这种工作流称为数据密集型工作流。与传统工作流不同的是,物联网环境下这种数据密集型工作流具有数据来源分
学位
人群计数是人群监测和人群分析的核心技术,对于公共安全管理、科学部署安保措施有重要意义。近年来,随着深度学习技术的发展,涌现出大量基于密度估计的深度神经网络用于人群计数工作,而这些网络在计数精度或检测速度上缺难以达到实际应用的需求。为了提升人群计数网络的计数精度和检测速度,本文设计并搭建了基于多尺度感知网络的密集人群计数算法,通过设计多尺度聚合模块解决了人群计数中普遍存在的人头尺度问题,引入空洞卷积
学位
近年来,机器学习(Machine Learning,ML)和自动化语音识别(Automated Speech Recognition,ASR)技术日渐成熟。语音输入替代文字键盘输入成为可能。然而,在一些专业技术领域,由于多采用专业技术术语,给语音输入提出巨大挑战。一个最主要的问题是带有标签的专业语音数据量较少,无法满足自动语音识别系统训练的数据量需求,进而导致语音识别模型过拟合,语音识别准确度不高
学位
异构网络是具有多种类型顶点(对象)和边(链接)的有向图,其不但能够表达丰富的结构和语义信息而且可以更加自然地抽象现实世界。凝聚子图发现作为图挖掘中的一个基础且重要的问题在异构网络中同样有较高的研究价值,并已成为该领域研究的重点和热点问题,也在社区发现、故障检测和生物研究等方面有着重要应用。为此,本文深入研究了两种不同异构网络中的凝聚子图发现问题并给出了对应的算法设计以及具体的应用案例。第一,研究了
学位
自然语言处理的研究目标是实现对自然语言的理解,这种“理解”被应用到很多领域,如:问答任务,阅读理解任务,文本摘要任务等,其中文本摘要任务指基于对源文本的“理解”得到精简摘要,在读者阅读大量文本内容时,这项任务能帮助读者减少阅读量,提高阅读效率,因此对文本摘要任务的研究具有十分重要的意义。的方式主要有抽取式和生成式,抽取式指抽取文本重要内容拼接成摘要,但如果对文本特征提取的不全面会丢失关键信息,生成
学位