人脸艺术肖像画生成算法及服务平台

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:liongliong551
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
艺术肖像画生成是指让计算机根据给定的人脸图像生成风格化的画像,其在公共安全与数字娱乐领域具有独特的应用价值。近年来,研究人员提出了各种基于生成对抗网络的艺术肖像画生成方法,并取得了令人瞩目的进展。但是,现有的方法在艺术肖像画的细节纹理生成、几何结构保留等方面仍然面临着很大的挑战。为此,本文提出了一种基于人脸语义正则化约束的肖像画生成算法,并将其应用于素描和钢笔画。然后,本文提出了一种基于非对称循环网络的人脸照片-画像合成算法。最后,为了实现相关算法的应用推广,本文开发了人脸艺术肖像画服务平台。本文的研究工作主要包含以下三点:(1)本文提出了一种基于人脸语义正则化约束的肖像画生成算法。该算法通过几何归一化和正则化来提高生成器的生成能力,其生成的艺术肖像画具有结构一致、纹理逼真的特点。具体而言,该算法提出了一个改进的空间自适应归一化模块。该模块利用输入图像的语义标签和编码特征,对解码特征进行调制,实现了语义自适应的肖像画的特征表达。同时,该算法利用几何一致性损失,来缓解生成的肖像画与人脸照片之间的几何差异。最后,该算法采用多任务生成器和语义重构损失,来约束生成的肖像画的局部结构。实验结果表明,该算法所生成的艺术肖像画,在结构和纹理方面都取得了显著提升。(2)本文提出了一种基于非对称循环网络的人脸照片-画像合成算法。该算法采用了异构的对偶学习,使用不同的网络结构来实现人脸照片与素描之间的相互转换。同时,该算法进一步提出基于距离变换矩阵的空间自适应调制模块,其利用每个像素点与其边界的距离来调制解码特征,从而模仿画家的绘制技法。此外,为了使照片和画像在局部区域之间保持一致的相似关系,该算法在生成器的编码特征和对应的解码特征之间加入了多尺度对比学习模块。实验结果表明,该算法显著提升了生成图像的视觉质量。(3)本文开发了人脸艺术肖像画服务平台。将不同语言环境下的艺术肖像画生成算法程序进行集成,通过前后端技术为用户提供艺术肖像画的生成接口。目前,本平台可以生成多种风格的艺术肖像画,其中包括简笔画、插画、素描以及钢笔画。同时,本平台为用户提供了API接口,用户可以通过API接口接入本平台的算法。除此之外,用户还可以挑选自己满意的作品在艺术商城进行线上周边制作。另外,本平台还可以连接智能画像机器人。该机器人能够自动为用户快速绘制逼真的人脸艺术肖像画。综上所述,本文提出了两种改进的生成对抗网络模型,并将之运用于艺术肖像画生成任务,显著改善了生成图像的视觉效果。为了推进算法的落地应用,本文还开发了人脸艺术肖像画服务平台。本文的工作内容对艺术肖像画生成的理论研究与应用推广具有重大价值。
其他文献
声呐作为水下机器人、航行器等载具的辅助设备,为其执行海底目标探测识别、海床建模与绘图等任务提供有效的声学数据信息。声呐图像是声呐数据信息的一种直观表现形式。当前通过声呐图像实现海底探测的自动化、智能化已经成为一种主流的形式。传统图像识别检测方法常常依赖于专业人员丰富的先验知识,需要其根据当前受检测物体进行手工特征提取,受人为因素影响大,且检测速度与检测精度不理想。深度学习目标检测算法作为当前目标检
学位
随着智能设备和无线网络等基础设施的普及,时空众包任务越来越多的出现在平时的生活中(例如,滴滴、美团以及优步等)。时空众包任务的研究也越来越得到学术界的重视。其中,时空众包任务的任务分配成为了研究的重点。传统研究方法通过匹配的方式进行任务的分配,大多缺少考虑到动态的环境。此外,大多数的推荐方法是针对职业性的时空众包任务工作者,注重考虑时空众包任务分配的效率和利益收入,较少考虑到工作者本身的兴趣与爱好
学位
人体的各个脑区并不是相互独立的,不同脑区之间存在某种联系,在脑电数据集上,体现为脑电通道间是相互依赖、相互影响的,即图数据中边的信息。因此脑电数据集需要被扩展为图数据,使网络可以提取到图数据节点之间的结构信息,这符合图卷积神经网络的观点。目前,针对图卷积模型,存在节点间关系挖掘的不够充分,挖掘出的均只含有一种信息,并不能充分表达节点间关系,以及模型迁移学习能力不强的问题。基于以上问题,本文主要进行
学位
随着教育事业和数字技术的蓬勃发展,高校内大量数据开始以电子形式进行存储。为了有效利用这些数据,辅助教学工作的展开,越来越多的高校开始研究教育数据挖掘。教育数据挖掘是从大量有噪声、不完整的校园数据中提取有价值的信息,如贫困生与普通学生的差异性,学生成绩与学生行为的相关性,学生的选课趋势,教师教学风格对教学质量的影响等。因此,教育数据挖掘是当前教育领域的研究重点。教育数据挖掘领域有许多研究方向,学生成
学位
随着科技的发展,移动摄像设备逐渐普及,翻拍泄密事件层出不穷,已有的数字水印技术能够有效解决多媒体数据版权保护等问题,但如何设计出能抵抗屏摄攻击的数字水印算法依然是个难题。传统的数字水印算法可以有效抵抗常见的攻击类型,如JPEG压缩、裁剪攻击等,但因为屏摄攻击是个复杂的过程,对于抗屏摄攻击的数字水印算法研究较少。为了解决这个问题,基于卷积神经网络(Convolutional NeuralNetwor
学位
睡眠是人类的生命本能,但是随着社会压力的增大,越来越多人面临着睡眠障碍的困扰。睡眠分期作为睡眠质量评估和障碍诊断的基础,在相关领域研究中占据重要地位。脑电信号记录睡眠期间的大脑活动具有高准确性,是睡眠阶段判读中的主要评判依据,被广泛应用于临床和科研中。然而现有的脑电睡眠分期方法更多基于特征工程或者深度学习框架,主要关注大脑局部信息而忽略了通道之间及脑区之间的信息交互,忽略了脑电信号固有的“图”属性
学位
网约车系统(Online Car-Hailing System,OCS)是城市交通的重要组成部分,随着汽车保有量的快速增多,在城市运营网约车会遇到交通拥堵问题。预测交通流指导网约车进行路径选择,对缓解城市交通拥堵具有现实意义。本文针对交通流预测与网约车路径选择展开研究。目前在交通流预测领域多采用深度学习方法,并且通常只考虑少数交通流影响因素,通过综合考虑多种交通流特征预测交通流能有效提高预测精度;
学位
在中国,每年有数以万计的人确诊听觉障碍,助听器可以有效地帮助康复治疗。大多数助听器放大有效声音的同时,也会放大环境噪声,影响体验。通过采集听者脑电信号,使用听觉注意力检测方法获取听者关注的声音并进行放大,是提升患者体验的有效手段,但是该方法通常要求听者高度集中注意力而难以推广应用。为解决该问题,本文试图通过听者脑电信号识别说话人身份,以此降低对听者要求。目前关于听者脑电信号的说话人身份识别研究非常
学位
网络编码在无线传感器网络数据采集中的研究与应用是目前较为热门的课题,其能够通过编码的方式提高灾难场景下数据的可靠性。在传统的编码采集方式中,一般利用节点采集的数据互相进行交叉式编码。然而,针对只有在达到某种特定触发条件后才开始进行数据采集的触发式数据场景,这种交叉式编码由于无法产生足够的数据,难以保证数据的可靠性。而且,传统交叉编码进行区域聚集收集时需要较高的收集与解码开销。针对上述存在的问题,本
学位
学位