印刷体数学表达式识别技术的研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:a2422431
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的快速发展和网络的广泛普及,书籍和文献资料的电子化已经成为一项重要的工作。当前,OCR技术能够高效地识别中英文字符和数字,完成大部分资料的电子化,但对数学表达式的识别却无法取得满意的效果。原因在于,同普通的文本相比,数学表达式具有复杂的二维结构,很难确定字符间的逻辑关系。正确地分析与识别数学表达式,不仅需要正确的分割与识别单个字符,而且需要准确的分析数学表达式的整体结构。本文研究了数学表达式识别中的一些关键技术,完成了对数学表达的识别。将数学表达式图片输入之后,通过预处理、字符的分割、字符的识别以及空间结构的分析,最终用Latex表示识别结果并输出。本文的具体工作如下所示:1)图像预处理。通过对数学表达式图像进行滤波、二值化、细化等处理,去除图像中的噪声干扰及数据冗余,从而满足后续的处理需求。2)数学表达式字符的分割。本文在已有算法的基础上,采用了投影分割与连通域分割相结合的方法实现了对数学表达式字符的分割。最终,将数学表达式图像中的单个字符提取出来并确定出其空间坐标信息。3)数学表达式字符的识别。本文采用基于特征提取的模板匹配法,通过模板匹配法识别出每一个字符。字符识别主要包括字符特征的提取和对比字符数据库两个步骤。4)数学表达式的结构分析。这是数学表达式识别的关键过程。本文提出了一种分块树结构分析方法,该方法首先对数学表达式进行分类,将其划分成若干种类型的子模块,然后对每一个模块进行处理。在数学表达式字符分割和识别的基础上,通过分析字符之间的空间位置关系,从而得到整个数学表达式的结构信息。5)数学表达式的文本化表示。首先介绍几种常见的数学表达式描述方法。之后使用Latex描述数学表达式的识别结果,最终获得以文本形式存在的表达式。
其他文献
黑客的精神之一就是自由,然而有不少黑友上网的环境都是网吧这类有着种种限制的地方。既然是玩黑的.怎能忍受这样的自由限制呢?因此网吧破解成了黑客们必学的技术之一,不过各种同
大家都知道,非QQ会员网络硬盘的共享人数是不能超过5个的。如果想要突破这个限制,你只要升级为QQ会员即可。如果又不想出钱,又想突破限制该怎么办呢?那就只有在《网友世界》中找
为了能更好地了解艾比湖流域草地生态系统的健康状况,本研究以MODIS与Landsat数据为本底,引入信息熵分析艾比湖流域2001-2017年草地生态系统健康变化趋势,选用压力-状态-响应
信用风险评价是解决当前我国小型企业融资难问题的关键。信用风险管理的实务不断推动着评价理论的研究,同时该领域的一系列研究成果又促进了信用风险管理体系的建立与完善。与
QQ拱猪游戏的出牌都是围绕“黑桃Q”这张猪牌展开的,出牌的技巧也体现在这个“拱”字上。在自己手里没猪的情况下.何时该出手拱猪昵?
期刊
人们认识世界都是由简到繁、由具象到抽象,通过人们已经熟悉的事物来认识未知的事物,这是人们认知的规律。而与人类最熟悉的也莫过于人体本身,根据人体器官的位置和功能来指称一
采用碳酸钠熔盐法处理废SCR脱硝催化剂,回收其中有价金属钒、钨,在热力学计算基础上,研究了焙烧温度、碳酸钠加入量、焙烧时间等工艺条件对熔盐反应效果的影响。结果表明,当
目的:通过回顾性病例对照研究,以探讨男性声带息肉患者其声带息肉大小的相关危险因素。方法:选取2009年9月至2014年4月在福建医科大学附属第一医院行声带息肉手术治疗的76例男性
思政教育是大学教育当中的重要组成部分。思想政治理论课程的主要目的是实现国家政策和领导思想的三进——进教材,进课堂,进头脑。核心目的是将时事政策和先进的思想观念融入
大家在操作电脑的时候,经常会打开N多个程序,而且桌面和各个程序之间的切换也少不了.这样就会使你的操作极为不便,时常会手忙脚乱,如果你用的是nVIDIA芯片的显卡.只要安装了最新的