论文部分内容阅读
随着数字化的书法作品的增多以及用户新需求的不断提出,现有计算机书法的相关技术已经不能满足数字图书馆服务的需要。数字化书法研究面临着新的挑战:如何提供更快速的基于书法字视觉内容的检索服务?在当前OCR技术无法对书法字进行识别而用户又想知道书法作品内容的情况下,如何对书法字进行自动识别?如何生成具有指定书法家风格的书法字乃至书法作品?本论文主要针对上述关键问题就计算机书法处理相关的理论、方法和技术进行了研究,研究基于内容的书法字快速检索和识别方法、书法字笔画提取和识别技术以及书法字风格特征的量化表达技术,实现特定风格新书法字生成系统和书法牌匾生成系统。具体如下:1.书法字骨架提取。针对现有骨架提取方法无法准确提取书法字骨架的问题,结合各种图像细化方法,提出了融合数学形态学的索引表骨架提取方法(Morphology-Fused Index Table Skeletonization, MFITS)。首先利用结构元素对二值化的书法字图像进行初步细化,再采用索引表细化法抽取细化后的书法字骨架。2.基于骨架相似性的书法字检索与识别。针对基于轮廓相似性的书法字检索方法检索速度较慢的问题,提出了基于骨架相似性的书法字检索与识别方法,提取并分析了书法字骨架的形状特征,通过形状特征矩阵间的相似度比较进行书法字的检索。针对现有OCR方法无法对书法字进行准确识别的问题,利用标注书法字数据库和系统字库,提出了一种新的书法字识别方法,通过对书法字检索的结果中的标注信息进行统计并赋予权重来完成识别。3.针对大数据量的书法字库检索速度慢的问题,提出了两种快速的检索方法,基于关键点相似性的剪枝方法和基于识别的二次检索方法。提出的基于关键点相似性的剪枝方法,首先提取书法字轮廓中的少量关键点,计算其关键点的相似度,从而筛选出最相似的候选书法字进行进一步检索。与单独使用基于骨架的检索算法相比,检索速度提高一倍。提出的基于识别的二次检索方法,首先利用小规模数据库进行书法字识别,然后根据识别的候选结果从数据库中检索出书法字,再逐个计算相似度排序输出。实验结果表明,该方法大大提高了检索的准确率。4.在书法字笔画的提取和识别方面,提出了一种基于轮廓拐点的书法字笔画提取方法,用轮廓上的拐点将轮廓分为轮廓段,通过对属于同一笔画的轮廓段进行归并和配对,实现笔画提取。提出了基于支持向量机与规则的书法字笔画快速识别方法,使用支持向量机对笔画进行初步分类,然后对其中的特殊笔画再进行基于规则的判别。5.针对书法字的风格提取和表达,提出了风格评价模型(Style Evaluation Model, SEM)。在分析书法字的整体风格特征和局部风格特征的基础上,提取书法字的高宽比、笔画宽度以及各偏旁部首的位置和大小等风格特征,构成风格评价模型。6.特定风格书法字生成。提出了基于风格评价模型的书法字生成方法。首先利用汉字的三层层次化模型,对书法字进行分析,通过结构的判定,选取合适的偏旁部首和笔画,组成新的书法字,再利用风格评价模型对新书法字进行风格评判和修正,得到指定风格的新书法字。7.特定风格书法牌匾的生成。提出了生成特定风格书法牌匾的方法。首先检索已有的书法字,接着利用特定风格书法字生成方法生成缺少的书法字,同时根据牌匾的大小、书法字数量等要素得到书法字的布局,最后统一所有书法字的风格特征并排放在牌匾上。