基于扫描表方法和命令串方法的数学公式识别与文本转化的理论研究

来源 :兰州大学 | 被引量 : 0次 | 上传用户：gnayief

【摘要】

：

数学公式广泛存在于各类文献之中。数学公式的识别就是将科学和工程文献中的数学公式文件转化成可编辑的公式文本的形式。这对于数学资料的高比例压缩和快速利用、建立数字化

【作者】

：

程值军

【机构】

：

兰州大学

【出处】

：

兰州大学

【发表日期】

：

2007年期

【关键词】

：

扫描圈扫描表命令串数学公式识别文本转化

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

数学公式广泛存在于各类文献之中。数学公式的识别就是将科学和工程文献中的数学公式文件转化成可编辑的公式文本的形式。这对于数学资料的高比例压缩和快速利用、建立数字化图书馆以及按照数学公式进行文献检索等都有着极其重要的作用。但足公式的识别远比汉字和英文字符的识别困难的多。1968年，R.H.ANDERSON在其博士论文中首次提出了公式识别问题。经过30多年的研究，在这个领域出现了一些研究型论文，同时也出现了一些数学公式识别系统。本文对于数学公式的识别，提出了基于扫描表方法和命令串方法的理论。通过扫描圈的提取函数，所有的连笔符号，即几何圈都可以迅速转化为数字串，利用扫描表提取函数将数字串转换成扫描链与扫描阵的组合，进而得到命令串。这个过程用于完成符号的识别，属于微观识别。然后，将得到的命令串进行结构调整，实现公式文件的文本化，拟得到的可编辑文本是Latex格式的文本，这个过程属于宏观识别。同时，简要分析了一些复合公式的Latex文本化原理。文中给出了一些C++代码，用于探索建立基于扫描表方法和命令串方法的公式识别系统。

其他文献

图的弱罗马控制

基于Ian Stewart[11]发表的一篇论文(Defend the Roman Empirel，scientific Amer-ican，Dec．1999，pp．136-138)的意图，M．A．Henning和S．T．Hedetniemi[1]提出了防御罗马帝国的新策略使最高

学位

控制数弱罗马控制数图论最小权

一个具零特征的线性双曲线方程组的精确能控性

学位

约束优化问题中罚函数的理论及应用研究

学位

一阶双曲型方程的Legendre-tau方法

本文主要针对一阶双曲型发展方程的数值解法进行研究，首先针对边界条件的不同处理方式，考虑了在Galerkin方程中不同检验函数的选取对于数值结果的影响，其次构造了高效、精确、稳

学位

一阶双曲发展方程Legendre-tau方法最优误差估计数值解边界条件偏微分方程

高中政治课堂教学有效性探究

课堂教学的有效性指通过课堂教学活动,学生在最短的时间内获得最大的效益。在高中政治教学中,要想课堂高效,就要做到在传统教学的基础上创新,在有效的预设中助推动态生成,做

期刊

高中政治课堂高中政治教学课堂教学活动教学的有效性知识与技能过程与方法综合分析学生师生和谐三维目标情感态度精讲多练动态生成可持续价值观

新形势下行政事业单位预算管理的模式研究

随着经济社会的不断发展,对国家行政管理水平的要求也随之提高,作为国家机关的行政事业单位的职责也在不断细化和完善。新的社会形式要求政府部门要转变职能,而预算管理作为

期刊

行政事业单位预算管理模式

一类混合随机序列的概率极限定理

概率论的意义在于描述由大量随机因素影响所表现出来的规律性，因此，研究随机变量和的极限对于搞清楚随机现象的本质有着及其重要的价值。关于相互独立随机变量序列的概率极

学位

混合随机序列概率极限定理ψ混合强正相依强大数律收敛速度

钢琴集体教学与信息技术课程融合的教学反思

期刊

钢琴集体教学信息技术课程融合

具有两个功能性反应的捕食者-食饵系统的定性分析

本文研究了 Hanski et al(1991)提出的生态学模型对捕食行为既有HollingⅡ型功能性反应，又有HollingⅢ型功能性反应，对食饵来说既有广食者又有专食者，文献[1]中只对此模型的进行

学位

生态学模型捕食行为功能性反应食饵动力学行为

降雨量的模糊马尔可夫过程预报模型

本文用极差分析法挑选出对预报量影响最大的几个预报因子，并在分析降雨量信息样本的随机性基础上，着重考虑了信息样本的模糊性，建立了模糊马尔可夫过程预报模型。据此试报了2001

学位

降雨量预报因子极差分析法模糊马尔可夫过程

基于扫描表方法和命令串方法的数学公式识别与文本转化的理论研究

与本文相关的学术论文