论文部分内容阅读
汉字作为中华民族文化的重要载体,其书写风格的多样性造就了汉字独特的艺术美感。作为中华民族文化的重要组成部分,缺失文献的修复非常有价值,汉字的自动生成研究为该课题提供了一种潜在的解决途径。汉字的自动生成关注的是如何生成指定风格的汉字。该问题主要的挑战在于汉字数量众多且部分汉字结构非常复杂。当前主流的汉字自动生成方法主要是基于配对数据的,即采用监督学习的方式。为了得到一个有效的机器学习模型,建立大规模的配对训练集是必不可少的,这将花费大量的人力、物力及时间成本。为了克服该问题,近期一些研究工作通过借助最近兴起的生成对抗网络(GAN)技术来实现基于未配对训练集的汉字自动生成,但已有的这些研究工作大多关注于单风格汉字自动生成。然而,在书法鉴赏等应用问题中将涉及多风格汉字的自动生成。因此,如何实现多风格汉字自动生成是一个非常有意义的研究问题。不同于单一风格汉字自动生成,多风格汉字的自动生成问题将涉及到多个不同风格转换域。现有汉字自动生成方法在这种多风格汉字自动生成任务中效率较低,主要归咎于如下两个方面:第一,为了学习k个不同字体域之间的所有映射,现有单风格汉字自动生成方法必须在每两个字体域之间训练一个生成器,导致需要训练O(k~2)个生成器;第二,每个生成器只能利用两个字体域的训练样本来进行训练,而未能充分利用整个训练数据,一定程度上造成数据资源的浪费。针对现有方法存在的一些不足之处,本文提出一种有效的多风格汉字生成方法。为了克服缺乏配对训练集的困难,本文借助当前流行的生成对抗网络来实现无监督学习。为了实现多属性风格之间的转换,本文基于一种“星状”的GAN模型称为StarGAN模型来处理不同特征域之间的相互转换,不同于采用单风格汉字生成方法来处理多风格汉字自动生成问题。本文所提出的基于StarGAN模型的汉字生成方法仅需训练一个生成器便可实现多个风格域之间的自动转换,一定程度上缓解了单风格汉字生成方法在处理多个字体域时可扩展性较差的问题。为了验证所提方法的有效性,本文首先基于中文手写数据库(CASIA-HWDB)建立相应的数据集,其中数据集大小约3万张图片;其次考虑StarGAN模型中不同的网络结构及训练技巧,具体包含:(a)残差网(ResNet),(b)残差网+谱归一化(Spectral Normalization)和(c)稠密网(DenseNet)。实验结果表明本文所提方法在上述三种不同情形下都能够有效生成高质量的多风格汉字,从而验证了所提方法的有效性。同时,对比所考虑的三种不同的网络情形,实验结果表明在StarGAN模型训练中采用残差网和谱归一化通常能得到更好的实验结果。