基于扫描表方法和命令串方法的数学公式识别与文本转化的理论研究

来源 :兰州大学 | 被引量 : 0次 | 上传用户:gnayief
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数学公式广泛存在于各类文献之中。数学公式的识别就是将科学和工程文献中的数学公式文件转化成可编辑的公式文本的形式。这对于数学资料的高比例压缩和快速利用、建立数字化图书馆以及按照数学公式进行文献检索等都有着极其重要的作用。但足公式的识别远比汉字和英文字符的识别困难的多。1968年,R.H.ANDERSON在其博士论文中首次提出了公式识别问题。经过30多年的研究,在这个领域出现了一些研究型论文,同时也出现了一些数学公式识别系统。本文对于数学公式的识别,提出了基于扫描表方法和命令串方法的理论。通过扫描圈的提取函数,所有的连笔符号,即几何圈都可以迅速转化为数字串,利用扫描表提取函数将数字串转换成扫描链与扫描阵的组合,进而得到命令串。这个过程用于完成符号的识别,属于微观识别。然后,将得到的命令串进行结构调整,实现公式文件的文本化,拟得到的可编辑文本是Latex格式的文本,这个过程属于宏观识别。同时,简要分析了一些复合公式的Latex文本化原理。文中给出了一些C++代码,用于探索建立基于扫描表方法和命令串方法的公式识别系统。
其他文献
基于Ian Stewart[11]发表的一篇论文(Defend the Roman Empirel,scientific Amer-ican,Dec.1999,pp.136-138)的意图,M.A.Henning和S.T.Hedetniemi[1]提出了防御罗马帝国的新策略使最高
学位
学位
本文主要针对一阶双曲型发展方程的数值解法进行研究,首先针对边界条件的不同处理方式,考虑了在Galerkin方程中不同检验函数的选取对于数值结果的影响,其次构造了高效、精确、稳
课堂教学的有效性指通过课堂教学活动,学生在最短的时间内获得最大的效益。在高中政治教学中,要想课堂高效,就要做到在传统教学的基础上创新,在有效的预设中助推动态生成,做
随着经济社会的不断发展,对国家行政管理水平的要求也随之提高,作为国家机关的行政事业单位的职责也在不断细化和完善。新的社会形式要求政府部门要转变职能,而预算管理作为
概率论的意义在于描述由大量随机因素影响所表现出来的规律性,因此,研究随机变量和的极限对于搞清楚随机现象的本质有着及其重要的价值。 关于相互独立随机变量序列的概率极
本文研究了 Hanski et al(1991)提出的生态学模型对捕食行为既有HollingⅡ型功能性反应,又有HollingⅢ型功能性反应,对食饵来说既有广食者又有专食者,文献[1]中只对此模型的进行
本文用极差分析法挑选出对预报量影响最大的几个预报因子,并在分析降雨量信息样本的随机性基础上,着重考虑了信息样本的模糊性,建立了模糊马尔可夫过程预报模型。据此试报了2001