半监督生成对抗网络及其书法汉字生成研究

来源 :宁波大学 | 被引量 : 0次 | 上传用户:zhaodaxiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生成对抗网络是一种无监督学习的深度学习模型,已广泛地应用于人脸合成、图像风格迁移、图像修复、高分辨率图像生成等计算机视觉领域。但是传统的生成对抗网络无法完成训练集较小的生成任务,而结合半监督学习的生成对抗网络不仅可以扩充训练样本量,而且能增强模型的鲁棒性。中国书法是中国的特色文化艺术,是中华民族的象征性符号。在书法漫长的演变岁月里留下过很多精彩绝伦的书法作品,然而这些作品中保存下的书法汉字十分有限,导致特定风格的书法汉字的数据量极小。因此如何利用少量的书法汉字生成完整的特定风格书法汉字成为新的研究热点。目前基于生成对抗网络的书法汉字生成研究大多在书法汉字生成的过程中需要大量的先验汉字组成信息,影响研究成果的扩展性;同时由于书法大家的传世墨迹可能仅数百至数千字,导致特定风格的书法汉字研究的数据量较小,这使得书法汉字的生成研究仍面临巨大挑战。本文针对书法汉字字形复杂多变、结构多样等特点以及训练数据缺乏等问题,研究基于半监督生成对抗网络的书法汉字生成技术,主要研究工作及贡献如下:(1)据调查所知,目前尚无明确定义的书法汉字图像数据集。因此本文收集了颜真卿书法家楷书风格的书法汉字图像数据,通过对数据样本进行数据预处理后,数据集样本数量为1014。本数据集已开源,可于https://github.com/Qiang Zi Bro/kai_character_dataset下载。(2)提出一个结构条件的堆叠生成对抗网络模型用于书法汉字的生成。该方法将源汉字图像直接提取的汉字笔迹作为结构约束的条件,通过条件堆叠生成对抗网络模型,生成高质量的结构正确的书法汉字,有效减少了研究工作的前期样本数据收集和预处理工作。(3)针对书法汉字训练数据缺乏的问题,本文提出了一种通过伪目标样本的半监督学习方法用于增加书法汉字生成研究的学习样本,提高网络模型的学习效率,同时可实现训练不可见的书法汉字字符的生成,且生成效果良好。
其他文献
柔性透明电极(Flexible Transparent Electrodes,FTEs)是一种新型的光电材料,具有较好的光电特性、强机械性、高热稳定性和高耐用性等特点,可用于穿戴设备、曲面太阳能电池、便携式加热器和智能窗口等多个领域,因此FTEs材料已经成为光电产业的重要组成部分之一。传统的氧化铟锡(Indium Tin Oxide,ITO)透明电极材料的脆性高、价格昂贵、热稳定性差、原料利用率低
学位
随着移动通信系统的高速发展,基带信号的带宽不断增加,第五代移动通信系统(5G)逐步商用,5G NR信号的带宽最高可达400MHz,5G NR信号采用QPSK、16QAM、64QAM和256QAM等高阶调制方式,因此射频功率放大器的动态非线性特性也越发严重,功放记忆效应也表现得格外明显。为解决功放的非线性问题,数字预失真技术作为研究射频功放线性化的重要技术手段,可以改善功放的非线性特性,提升功放效率
学位
光纤通信技术的快速发展让人类社会迅速进入了高速信息时代,对诸如波长转换器、光开关等无源非线性器件的要求以及需求量也随之得到了极大的提升,而寻找具有较高三阶非线性性能的材料是非线性器件广泛应用的重点之一。在众多可制备成光纤的材料中,硫系玻璃具有高的线性折射率(n0)与非线性折射率(n2),超宽的红外透过范围,低声子能量等优势,是全光开关、光频梳等红外非线性光子器件的理想候选者。本文中利用熔融淬冷法制
学位
如今,2μm超短脉冲光纤激光正朝着高强度和窄脉宽的方向发展,采用啁啾脉冲放大的方式来实现超短脉冲激光峰值功率的极大提升是当前的主流技术之一。脉冲展宽器是啁啾脉冲放大系统中的重要器件,尽管目前空间型2μm波长脉冲展宽器发展已相对成熟,但在如今追求全光纤化激光系统的趋势下,材料和光纤是依然是目前限制2μm全光纤系统的关键因素。经过特殊结构设计的石英光纤展宽器虽使用方便,但是单位长度的光纤提供的色散量相
学位
硫系光纤因其中远红外波段出色的透过特性,使其在红外激光光电对抗、光纤传像束、激光医疗等诸多领域具有巨大的应用潜力。其中以单模硫系光纤最受关注,这是由于单模光纤中只传输基模,光强分布接近于高斯分布,并且无模间色散,在长距离的激光传输和光束控制方面存在巨大优势。人们追求高质量单模硫系光纤的脚步从未停止过,但是受成型工艺条件限制,光纤制备过程中引入的材料或结构缺陷始终影响着光纤的整体性能。因此,亟需提高
学位
基于视觉的同步定位与地图构建(Simultaneous Localization and Mapping,SLAM)技术是当前机器人导航、自动驾驶等领域的研究热点,但是目前视觉SLAM的研究大多为基于静态环境下的假设,当场景中出现动态物体时,系统的精度和鲁棒性则难以保障,此外,构建出的地图往往会有移动物体重影。针对以上问题,本文在经典的ORB-SLAM2基础上,研究并设计了一种面向动态物体场景的视
学位
推荐系统作为解决“信息过载”问题的有效方法,推动了包括电商在内的众多领域的发展,序列推荐作为其中一类重要的方法,旨在建模用户动态行为偏好,预测其下一次可能的交互行为。近年来,基于各类深度学习方法的序列推荐算法喷涌而出,极大提升了推荐系统的推荐效果。现有序列推荐算法仅从项目间相对时序关系中挖掘项目间的关联,忽略了其真实交互时间信息的探索与利用;此外,该类算法还存在项目间高阶复杂关系挖掘不充分、辅助信
学位
随着网络规模的剧增,高速、无线、数据中心、卫星网络的逐渐普及,用户对网络的需求越来越多,而用户的需求使得应用趋于多样化、复杂化,这给TCP的传输质量带来了较大挑战。拥塞控制算法作为TCP的重要组成部分,对其性能有着较大的影响。低优先级拥塞控制算法主要承载大文件传输、应用更新等的非交互应用流,此类应用常常以背景流的形式存在于网络中,能够有效改善交互式实时性应用流的传输性能。然而在实际的网络中,低优先
学位
传统语音分离算法的数学建模有很大的局限性,导致其在复杂环境下,比如低信噪比和非平稳噪声等情况下,语音分离效果不理想,无法满足各种实际场景中的应用。而基于深度学习的语音分离算法通过对带噪语音信号与目标语音信号之间的非线性映射关系进行学习训练,因而能够极大的改善在复杂环境下的语音质量。本文主要通过充分利用门控循环单元网络(Gated Recurrent Unit,GRU)的结构优势来提高语音分离的性能
学位
近年来,视网膜疾病是最重要的公共健康问题之一。分析视网膜图像中丰富的病变信息对预防和诊断相关的视网膜疾病有着重大意义。视网膜血管的形态特征如角度、分支、长度、宽度和曲折度在分析视网膜图像的各种特征中有着关键作用,因此对视网膜血管的准确分割非常重要。然而即使经验丰富的专家通过手动方法对视网膜图像进行血管标注也是容易出错并且耗时的,因此,建立模型准确地自动分割血管至关重要。此外,一幅合格的视网膜图像是
学位