论文部分内容阅读
本课题研究印刷体数学表达式中符号的识别。
近年来,数学公式图像自动识别与理解已成为文档图像处理(DIP)领域的一个热点问题。数学公式图像识别主要包括两大阶段:符号识别与语法分析。多数学者将研究重点放在语法分析阶段,因为很多人误认为传统OCR技术能够较好的识别数学公式符号,但实际应用中却远非如此。
数学公式符号是介于普通文字字符与图形符号之间的一种符号,它在排版印刷、符号集方面都与普通文字字符有着很大的区别;而且数学公式符号图像受字体影响较大。因此设计专门的数学公式识别引擎非常必要。
本文针对这一问题,提出一个合理的、使用性强的数学公式符号识别模型,根据这一模型,实现通用、快速、精确的印刷体数学公式符号识别引擎。
该识别引擎包括预处理、字体识别、符号内容识别、后处理这一完整流程,在符号内容识别阶段,集成结构分析与统计分类的思想,并分别采用最小距离和基于ISOETRP聚类算法的决策树两种方法设计分类器。
本课题识别字符集包括普通字体符号330个,LATEX排版数学符号356个,基本囊括所有的数学公式符号;利用该系统对500个公式(约9000个符号)进行测试,识别率达到98%。说明该系统已经脱离实验室阶段,基本可以满足实际需要。