论文部分内容阅读
目前的结构识别方法基本属于盲析法,即把某种各个区位的识别算法,以固定的次序轮询于各个区位上,根据识别算法的结果判断当前符号处于前一符号的何种区位当中;或者是符号识别与结构分析同时进行的搜索解空间中最小代价的搜索法。这些方法由于均是基于区位遍历技术,识别速率或区位识别正确率都不同程度受到较大局限。对此本文研究基于上下文感知的联机手写数学公式结构分析方法,该方法依据不同教学层次数学公式各种符号链写结构出现的概率及源位符号的类别,建立上下文感知模型,根据模型对后继字符可能出现的区位进行预测并监督,有效避免了盲析法的区位识别弊端,区位识别正确率和识别速度得以提升,有益于推广使用间接式白板系统。本文的主要工作与创新内容如下:1.深入分析数学公式的书写结构,将书写结构分为一般、规范型非一般及专用符号体系三大类书写结构。规范型非一般书写结构重点讨论具有代表意义的分段函数结构与水平盖括等书写结构;专用符号体系重点讨论典型的分数、∑、∏、积分、等符号体系。2.详细描述CSDTW、SVM、KNN、多分类器四种有代表性的联机手写字符识别方案,并选取识别率最高的CSDTW方案实现系统的联机手写单笔画数学公式符号识别,利用组合策略实现联机手写多笔画公式符号识别。3.提出基于上下文感知的联机手写数学公式结构分析方法。设计一般书写结构、规范型非一般书写结构以及专用符号书写结构等的上下文感知模型通用结构。通用结构中建立了各个教学层次的数学公式符号在不同区位链接的教学概率及区位感知码。利用感知模型进行结构分析,分析过程包括区位推荐、后继感知区位监测、区位确定等重要环节。4.设计并实现基于上下文感知模型的联机手写数学公式结构分析算法。一般结构的识别是基于两符号质心间的连线与水平线所成的角度来判别的方法。规范型非一般结构和专用符号体系结构的识别是利用字符区域和质心的方法或者利用高度比的方法。实验的区位确定正确率达到98.2%;区位确定的平均时间约为3ms左右,与现有相关成果比较,上下文感知技术使得联机手写数学公式识别的正确率和速度都明显提高。该课题由湖南省十二五重点学科建设项目资助。