论文部分内容阅读
手写汉字图像动态信息恢复是指从脱机静态字符图像中恢复书写者在书写过程产生的时序信息,将一个二维的静态图像转换为多个一维的动态时间序列的过程。对手写汉字图像进行动态信息恢复不仅可以实现对大量非结构化的静态文本图像的有效管理,使其方便地在计算机上进行存储和检索,而且可以在脱机和联机的应用处理方法之间构建桥梁,应用目前现有的联机处理方法来处理脱机图像,提高脱机处理的性能,满足越来越广泛和深入的手写汉字信息化管理与应用的需求。围绕手写汉字动态信息恢复中的基于结构分析和基于模型匹配两类问题,开展了5个方面的研究工作:基于模糊区域检测的手写汉字笔划提取、汉字的结构化建模表示、基于结构模型的动态信息恢复,手写汉字图像的骨架修正以及基于模型匹配的动态信息恢复技术。针对手写汉字笔划提取的重点和难点——模糊区域的识别和解析,提出了一种新的基于模糊区域检测的手写汉字笔划提取算法,提高基于结构分析的动态信息恢复的预处理效果。首先,由骨架特征点来确定模糊区域的近似中心点;接着,利用近似中心点和其周围的轮廓信息进行模糊区域检测;然后,利用图模型来对子笔划和模糊区域进行建模,构造贝叶斯分类器来分析子笔划对的连续性,并且相应地给出了约束条件和判断准则,分别用于笔划路径的搜索和处理多描绘子笔划;最后,进行B样条插值来提取细化后的笔划。该算法不仅能够有效地用于模糊区域检测和笔划提取,而且能够避免笔划在模糊区域内的形状畸变。在笔划提取的基础上,分析汉字的层次结构,提出了一种脱机手写汉字动态信息恢复模型。将汉字依次分为4个层次:整字、部件、子部件和笔划,利用4种拆分操作将整字拆分为部件,部件拆分为子部件,并由此形成了子部件间的5种拆分关系。通过定义一组拆分关系与子部件偏序关系之间的对应规则,得到子部件的全序关系。而子部件作为最基本的恢复单位,其书写顺序通过对笔划和交叉笔划对进行分类来得到。该方法对于具有完整层次结构的手写汉字的书写顺序恢复,具有较好的准确率和处理速度。针对现存的大多数的骨架提取算法会产生伪段或形状扭曲这个不可避免的问题,提出了一种通过识别和修正不可靠段来改进手写图像骨架的方法。首先,给出了一种新颖的特征——迭代次数,将骨架的不可靠段看做是迭代次数异常的点的集合,并且采用无向图对字符骨架进行建模,将图中的节点对应为骨架上的特征点及其周围具有异常迭代次数的像素点;其次,为了避免骨架分枝长度对不可靠段识别的影响,又给出了一种基于迭代次数的节点距离度量方法,用于对图中的边进行加权。于是,不可靠段识别的问题就转换成将该无向图分解为一个子图集合的问题,并可通过一种有效的聚类质量估算函数对该图进行聚类来解决。最后,在骨架修正阶段,利用最佳匹配的方法来得到可靠段之间的连续性,而对不可靠段的修正则是通过对其相连可靠段的采样点进行B样条插值来进行。该方法不仅可以修正汉字的骨架,而且对于英文的骨架也具有较高的修正效果。在基于模型匹配的动态信息恢复的研究中,采用序列匹配的方法找出输入字符的骨架和动态模型序列之间的对应关系,以达到动态信息恢复的目的。首先,采用形状上下文来定义输入图像和模型图像对应点之间的匹配代价:然后,通过建模对字符骨架进行分段,并采用基于DTW距离的子序列匹配来找出骨架各分段的最佳序列匹配;为了避免搜索整条序列,针对骨架分段的特点,设计一种具有较低计算代价的子序列匹配算法;最后,通过子图映射和子图恢复来找出最佳的全局匹配路径,并分析了输入图像的子图集合到模型序列的映射方法,以及子图内部的书写顺序恢复的路径约束。该方法对于形状和位置的变化以及笔划的缺省和连笔具有一定的鲁棒性和较高的恢复性能。