论文部分内容阅读
图像处理技术因深度学习的发展取得了革命性的进步,尤其在分类与识别领域,其表现已经接近甚至超越人类。然而这些成果主要体现在模式识别领域的成功,离真正的人工智能还任重而道远。深度生成模型因其对数据强大的建模能力具有广泛的应用前景。本文以深度网络生成模型研究中的两个应用——单样本的绘画风格迁移和多样本的书法字体生成为驱动,针对基于对抗生成和基于判别生成两种生成模型算法进行了较为深入的探讨和研究,提出了相应的改进方法。改进了现有绘画风格迁移的效果,实现了书法字体的生成,尤其实现了名家行楷书体的生成。本文的研究内容和创新点具体如下:(1)单样本风格学习——绘画风格迁移部分研究内容及创新点。提出了一种改善单样本风格学习效果的折线学习方法,具体阐述了基于样本的折线学习和基于损失函数折线学习的工作机制。对比原绘画风格迁移算法,在风格图与内容图的内容迥异的情况下,改进后的方法降低了结构信息重建偏差,改善了低纹理、无纹理区域的生成图的伪影效应。最后给出了一种可以定量评价图像风格迁移效果的评价方法。(2)多样本风格学习——书法风格迁移部分研究内容及创新点。提出了一种类比主动形状模型的深度生成网络及其训练方法,并将该方法应用于中国汉字书法的风格转换上,改善了生成式对抗网络难于收敛、难于训练的问题。提出一种风格嵌入编码技术对不同书写风格进行编码,提升网络泛化能力,实现网络同时对多种风格的学习。引入多径判别网络对目标函数进行多种正则处理,实现了像素级别精度的风格迁移,让网络在确保汉字书写正确的前提下,实现对大师书法风格的模仿。(3)基于神经节分化的判别网络增量学习部分研究内容及创新点。针对上一章主动形状生成模型中判别网络在遇到新字体学习时需要重头训练的问题,本章提出一种基于神经节分化的判别网络增量学习方法,在判别网络中加入“聚类层”和“分化层”,以自组织的方式对输入类别进行增量学习,通过部分网络结构和参数共享实现对已有知识的记忆和新知识的再学习。本文在公共分类数据集上验证了该方法在同等网络规模下具有更高的分类准确率,并测试了其在新字体上的学习效果,在同等收敛条件下所述算法具有更少的时间代价。