论文部分内容阅读
在日常生活中人们无法避免和汉字打交道,而无论是从书法文化的传承还是人们的汉字教学练习的角度而言,针对汉字书写美观性评估的研究都是具有重要的实用价值。目前的汉字美感评价标准方式多式多样,将评价标准和计算机技术的结合还在不断研究中。本文通过卷积神经网络对汉字字形图像提取汉字字形信息,并且分别从字形约束这一外部因素和汉字笔画信息这一内部因素进行汉字美感的研究,根据美感研究最终选择基于字形的凸包中心、物理中心以及特征图三种特征信息设计手写汉字美感评分系统,因此本文的主要工作如下:1、针对对汉字字形图像提取HOG特征后获取汉字字形信息不准确的问题,提出了一种基于VGG16网络的汉字字形信息获取算法。首先对汉字字形图像进行预处理,然后使用VGG16网络对预处理后的汉字字形图像提取卷积特征图,其次使用卷积特征图获取汉字字形信息,并进行处理作为最终汉字字形信息。选取Tiny Mind书法汉字识别竞赛中100个汉字字形图像进行实验,实验结果表明该算法获取的汉字字形信息更加准确,用于不同类型汉字字形约束方式与汉字美感之间的研究时会使得一般性规律更加具有严谨性。2、针对人们一开始书写美观汉字比较困难的问题,进行了汉字字形约束方式这一外部因素与汉字美感之间的研究。首先对字形图像进行预处理,然后选取不同类型的人进行汉字视觉美感实验,使得获取的美感评估数据更加充分和全面。其次使用VGG16网络对实验后的汉字字形图像提取汉字字形信息。最后对汉字字形信息进行计算得到汉字字形对角线长度、纵横比和四种中心偏心距。对所有汉字图像的美感评估数据进行分析,结果显示不同汉字字形约束方式下人们认为汉字美观时的高矮、胖瘦和中心位置存在差异,在不同汉字字形约束方式下掌握这些一般性规律会使得人们能够轻易快速的书写美观汉字。3、针对字形约束方式这一外部因素无法从实质上提高人们书写美观汉字的问题,提出了一种全周投影度量方法用于研究汉字中横、撇、竖和捺的笔画信息这一内部因素与汉字美感之间的联系。首先选取多种字体的汉字字形图像组成实验数据集。然后对所有汉字字形图像提取卷积特征图,并且根据卷积特征图获取汉字字形凸包中心。其次以凸包中心作为旋转中心对卷积特征图进行全周投影,从而获取每一张汉字字形图像中横、撇、竖和捺的笔画信息。最后对每一种类型字体中所有汉字字形图像的全周投影度量值求平均值作为该种汉字字体的全周投影度量值。掌握每一种汉字字体中笔画的书写技巧可以从本质上提高人们书写美观字体的能力,还可以使得人们从笔画的蜿蜒曲折中领略不同历史朝代的文化魅力。4、在前面的汉字美感研究中发现汉字物理中心特征向量、汉字凸包中心特征向量和第一层卷积特征图中第十九张特征图向量对于汉字美感评分有着重要的作用,因此基于三种特征向量设计了一种手写汉字美感评分系统。首先获取已标定评分的字形标准样本集和待测样本集图像的三种特征向量。将待测样本集中字形图像的每种特征向量与标准样本集中相同汉字的字形图像对应的特征向量计算余弦值,并将相同分数对应的余弦值的均值作为该分数的余弦值,然后通过softmax函数计算不同分数对应的概率值,筛选较大的三个余弦值并得到对应分数的数学期望。将其作为待测图像的美感评估值,并与真实评估值进行对比。实验效果表明该手写汉字美感评分系统能够准确的对人们手写的汉字进行评分,能够快速提高人们书写美观汉字字体的能力。