基于生成式对抗网络的多风格汉字字体生成系统

来源 :重庆大学 | 被引量 : 0次 | 上传用户:luiyun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像处理一直以来都是深度学习的重点研究方向之一,目前已经可以通过构造不同的神经网络结构来完成图像识别、超分辨率图像重建、图像翻译等任务,但在字体风格迁移,特别是汉字字体风格迁移方面的研究还相对较少。不同于英文字符,汉字字体结构复杂且数量众多,在官方给出的GB18030数据集中一共有27533个汉字,常用的汉字也多达3000余个。作为世界上使用人口最多的文字,汉字在世界各地广为流传,并且对韩语、日语的字体形态产生了一定影响,因此研究汉字风格迁移具有重要意义。首先,本文对比分析了经典的风格迁移网络:Pix2pix网络和循环一致生成式对抗网络。在相同实验条件下发现,虽然两个网络都能完成宋体向书法字体的转换,但Pix2pix网络需要成对的数据集来进行训练,这在实际生活中很难获得,因此本文选取循环一致生成式对抗网络作为基础模型。然后,本文在循环一致生成式对抗网络基础上进行了改进。主要改进内容包括:第一,借鉴2018年CHub中提出的Wasserstein-CycleGAN网络,引入Wasserstein距离代替KL散度来衡量生成分布和真实分布之间的距离,解决了网络在训练过程中出现的梯度消失问题。第二,添加感知风格损失。使用预训练好的VGG-16网络作为感知风格损失网络,将生成图像和真实图像作为该网络的输入,计算它们在每层卷积层的特征值之差,以此作为网络的感知风格损失。最后,为验证本文所作的改进,在TensorFlow深度学习框架下搭建了循环一致生成式对抗网络和改进网络的模型,并自行建立了中文数据库进行训练。实验结果表明,虽然两个网络都能生成书法字体,但改进的网络生成图像质量更高,收敛速度更快。本文利用改进的生成式对抗网络实现了不同风格汉字字体的生成,解决了传统字库创建时间长、需要耗费大量人力财力的问题。为将生成的字体应用到实际生活中,本文首先利用Opencv开源视觉软件库对生成字体图像进行二值化处理。然后,使用Findcontours函数提取汉字轮廓,得到各像素点的坐标,并按笔画存储在不同的路径中。最后,对用于汉字书写的机械臂进行运动学分析,将各像素点坐标转换成各关节转角,并通过Visusal Studio平台调用机械臂控制器端口,将各关节转角作为控制器的输入,控制机械臂实现汉字书写。
其他文献
党的十九大明确提出运用信息化技术方法,加强政府职能,加快国家数字化建设。国家税务总局响应号召,鼓励实现税务管理数字化,提升税收效率。在税务总局的号召下,深圳市税务局发挥敢于创新的精神,依靠互联网企业聚集发展的地理优势,积极推动了税务治理数字化的建立,走出了“区块链+税务”这条有中国特色的税收数字信息化道路。2018年8月,在国家税务总局的同意之下,深圳市税务局推出了首个区块链技术运用到税务治理具体
人脸识别技术目前已大规模应用于金融、医疗、安防等领域,从当初仅满足用于单一背景,到如今需要应对光照、姿态、遮挡等复杂环境。尽管现有人脸识别算法在约束条件下已经能够获得较好性能,但是在许多实际无约束环境,由于摄像头与被拍摄人脸之间存在距离较远和高度变化等原因,造成采集的人脸图像分辨率低下,因此导致实际识别性能的大幅降低。低质量低分辨率人脸识别是当前人脸识别领域关注的重要问题。深度学习技术在当前解决图
我国社会经济表现出的强劲势头和经济体制的变革,在一定程度上促进着我国企业的日益壮大和多元化经营;企业重组也逐渐发展成为企业快速成长的一种有效方式。资本市场的重组中,也吸引着越来越多的自然人股东,我国的自然人股东参与企业重组的所得税政策并不完善,导致同一重组行为中企业法人股东与自然人股东的税收待遇失衡,形成了诸多因为自然人股东无法承担参与企业重组所形成的个人所得税而导致重组失败的案例。2019年1月
虽然我国业绩预告制度已经发展了三十余年,但是仍有诸多规则需要充实和完善。管理层在业绩预告披露方面具有较大的决策自主权,这可能会导致我国企业发布的业绩预告不够及时、准确或者精确度不高。此类现实问题的存在使得外部投资者从业绩报告中获得的优质信息有限,从而可能会做出有损其权益的投资决策,甚至可能会降低整个市场的资金分配效率。实际上,深受企业发展状况影响的机构投资者通常也会对业绩预告质量发挥较为重大的反作
多智能体系统的协同控制无疑是近十年来系统与控制领域的热门研究问题。多智能体系统中的一致性一直被认为是分布式控制和协同控制领域的一个基本概念,指通过设计一个分布式控制协议,使一群自主智能体在某种意义上达成一致,其广泛应用于诸如分布式优化、航天器协调和机器人协同等领域。在多智能体系统的许多应用中,每个智能体通常配备有限的能量存储和通信资源。因此,如何减少对网络资源的占用具有实际意义。相比连续控制方法,
随着资源的短缺以及人们对环境保护的日益重视,闭环供应链的研究受到了国内外学者的广泛关注,使得相关文献数量快速增长。为了掌握领域的发展全貌、了解该领域的主要研究内容,一些研究基于定性分析对科研成果进行了系统总结与归纳。然而,鲜有研究从知识扩散视角出发,对国内外闭环供应链领域众多成果中的关键文献以及知识演化过程展开分析。这是目前急需解决的问题。基于上述出发点,本文借助主路径分析这一定量研究方法,以55
磷石膏(PG)是湿法磷酸生产过程中磷矿粉与硫酸反应后经淋洗过滤分离得到的一种工业废渣,主要由Ca SO4·2H2O组成,同时还含有残酸、可溶性磷、氟以及重金属等有害杂质,具有酸性强、杂质多、资源化利用难度大的特点。近年来,我国的磷石膏年产量维持在70-80 Mt左右,堆存总量超过500 Mt,并且堆存量还在逐年增加。大量的磷石膏堆存不仅造成土地浪费,也给环境带来了严重污染。因此,寻找经济、高效的方
由于节气门体的存在,当汽油机在小负荷工作时,泵气损失的增大和燃烧的恶化会导致发动机热效率下降。汽车发动机通常采用米勒循环、VVL或者发动机停缸技术来降低泵气损失,但空间和成本限制了这些技术在摩托车小型汽油机上的应用。而湍动能的提高有利于加快火焰传播速度,缩短燃烧持续期,从而通过改善燃烧的方式提高发动机热效率。气缸通过旁通道(进气道支管)充气能提高缸内的湍动能,而且对发动机原始结构影响不大,适合小型
在工程建设过程中,建筑工人是参与施工活动的最主要群体,其不安全行为与直接决定了施工班组的安全表现水平。相关研究表明,个体的人格特质能够影响其行为与决策方式,因此建筑工人的行为与决策模式也具有差异性。现有关于建筑工人人格特质与安全行为的相关研究大多为定性研究或传统数理统计分析,这些研究虽然可以发现普适性的规律,具有一定的指导意义,但忽视了施工现场工人组合的灵活性、工人与外界交互、与工友互助的动态性,
不同于奈奎斯特采样定理所规定的采样率必须大于或者等于信号最高频率的2倍,压缩感知理论指出如果一个信号在某一变换域内是稀疏的,该信号可由少量的采样值精确重构。作为一种新的信号采样方式,压缩感知为信号与信息处理提供了新的准则,对降低信号的存储传输成本具有重要意义,在通信、成像以及图像处理等领域具有良好的应用前景。压缩感知重构旨在从降维的采样值还原出原始的被测量信号,是压缩感知理论研究的核心问题。近年来