离线阿拉伯手写体光学文字识别方法的研究

来源 :武汉理工大学 | 被引量 : 9次 | 上传用户：alexander_guwen

【摘要】

：

机器的识别本领无法与人的认知能力相比,因此手写体的识别特别是离线的手写体识别对于模式识别等学科和理论来说,仍有较强的研究价值和意义。同时,手写体识别的研究,对于进一

【作者】

：

程艳芬

【出处】

：

武汉理工大学

【发表日期】

：

2009年01期

【关键词】

：

离线 OCR PDA 基线检测特征抽取 K最近邻法神经网络隐马尔可夫模型/HMM 分类器融合

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

机器的识别本领无法与人的认知能力相比,因此手写体的识别特别是离线的手写体识别对于模式识别等学科和理论来说,仍有较强的研究价值和意义。同时,手写体识别的研究,对于进一步提高低质量,变形大,复杂环境干扰条件下的文字识别的准确率；解决视频图像的文字检测和识别；文字的字体、签字和字迹的鉴别；手写阿拉伯文档等的识别以及各种图像识别技术和应用问题等,甚至对于相对更成熟的联机手写识别技术来说,都具有重要的借鉴和启发作用。由于阿拉伯手写文档具有它独有的特性,识别起来不能完全照搬现有的文字识别方法,它有着自身的特点和难点,导致现在越来越多的研究机构投入到离线手写体阿拉伯文字识别这项研究中来。国内外科技工作者己对该领域从不同的角度进行了广泛的研究,并且取得了许多阶段性的研究成果,但由于以下的原因,到目前为止,离线阿拉伯文字识别还没有商用的产品问世：1)风格：阿拉伯文本,包括手写体和印刷体实际上都是连接的。2)文本流：和拉丁语文本以及其它的语言不同,例如汉语,日语或者韩语,阿拉伯手稿是从右往左而不是从左往右的书写顺序,字母连在一起通常形成一条基线,但对于手写体来讲,基线只是一个想象的概念,实际书写中可能并不存在,这增加了识别的难度。3)字符的形态：阿拉伯语字母的形态取决于它在词中出现的位置。同一个字母在词首和词尾有着截然不同的形态,加之用点代表元音,这样字母表就达到了160个字符。还有一个问题是横笔延长经常出现在相连的字母中,这也导致了字母的形态的截然不同。4)词的形态：在阿拉伯语中,即使是相同的词,不同的书写者有着不同的书写风格,从而导致不同的词的形态。5)重叠：由于书写风格的原因,一个词中的字母经常重叠在一起,有时候有些人还将这些字母次序颠倒地写,这给分割技术带来了很大的困难。现有的离线阿拉伯文字识别系统的识别率及对测试数据集的有选择性等都有待改善,其效果与实际需要还有很大的距离。本文对离线阿拉伯文字识别方法从文本图像的采集、预处理、特征抽取、分类这样一个完整的文本图像的识别方法作了研究,评估了现有的相关算法,改进了有关的增强算法。具体完成的主要工作如下：①在阿拉伯手写体文本图像识别的预处理过程中使用两步线性回归法来进行基线检测。在对离线阿拉伯手写体文本识别的研究中,基线歪斜不同程度地出现在大多数自由书写的阿拉伯手写体文本中,我们提出的基线检测算法是基于两步线性回归法,首先找出该词在轮廓线上的局部最小点,然后用线性回归法在最小点上计算基线的近似值,再找出接近第一个近似值的那些点,最后用接近第一个近似值的那些点,使用第二次回归法修正这条线。另外,在手写体识别的研究中,文本的预处理有分割和不分割两种方法,而我们针对阿拉伯文本字符相连无法实现完整分割的特点,采取不分割的方法。②特征抽取方面。我们人能够通过大脑很简单地认识文字,是因为在人的大脑中已经保存了文字的特征,像文字的结构、笔划等。要想让计算机去认识文字,首先也要存储类似的信息,通常的做法是根据文字的笔划、特征点、投影信息、点的区域分布等进行分析,常用的特征抽取方法有结构分析方法和统计分析方法。在这篇论文中,结合阿拉伯手写体的特点,我们采用常见的GSC特征,结合主成分分析PCA来压缩特征的维数,以此描述阿拉伯手写体文本图像。③分类器的设计。目前的研究中一般是选择BP网络识别方法、SVM识别方法以及隐马尔可夫模型等,因为阿拉伯文本中字符相连的特点和语音识别的类似,所以我们研究隐马尔可夫模型应用在无分割的阿拉伯手写体文本图像识别中的参数设计和选择,采用经验值选取恰当的参数,优化算法,实现识别系统自动学习、自动选取、自动优化,并尝试使用多分类器的融合,提高文本的识别率。

其他文献

电子商务Web数据库不精确查询方法研究

近年来,随着World Wide Web的迅速膨胀,电子商务也随之得到迅速发展,以Web站点形式展示公司产品信息已成为电子商务交易的一个重要环节,这些Web站点通常由一个后台在线数据库

学位

电子商务Web数据库不精确查询近似函数依赖查询结果排序top-k检索

工程应用导学的伺服运动控制技术课程教学改革

结合应用型高校人才培养目标，针对伺服运动控制技术课程理论性、综合性、实践性均较强的特点，详细分析了目前教学中存在的问题。以培养学生工程实践能力为教学导向，树立学生在整

期刊

培养目标定位提炼教学要点优化教学方式改革考核体系positioning of goals of talents trainingextracting k

数据挖掘与量化计算在钙钛矿体系QSPR研究中的应用

定量结构-性能关系研究(Quantitative Structure-Property Relationships,简称QSPR)为材料学的重要组成部分。研究者从材料的结构入手,推测其材料的具体性能。QSPR来自一个化

学位

定量结构-性能关系第一性原理钙钛矿导电率电子结构CASTEP数据挖掘支持向量机有机-无机杂化钙钛矿光学性能晶格常数

严寒地区人体热适应性研究(4):不同建筑热环境与热适应现场研究

冬季供暖期间对哈尔滨市住宅、办公建筑、宿舍和教室4种建筑的室内热环境进行了连续跟踪测试和热反应主观调查,得到不同建筑室内热环境的特征参数及人体热反应特征和热中性温

期刊

严寒地区热环境热适应住宅办公建筑宿舍教室热中性温度

通精冲剂对精索静脉曲张不育患者精子运动参数的影响

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们羽制作:陈恬’＃陈川个美食 Back to yield

期刊

不育男性/中药疗法精索静脉曲张/中药疗法@通精冲剂

上海地区污水源热泵夏季制冷性能研究

城镇污水具有温度相对恒定、冬暖夏凉的特点,是一种优良的低温热源,与热泵结合具有很好的节能前景。搭建了热泵实验平台,并以上海市某污水厂的二级出水为热源,通过实验对污水

期刊

城镇污水热泵性能系数制冷量减排量功耗

聚类与曲线进化方法及在农产品图像分割中的应用研究

农产品的无损检测是农业现代化的一个重要组成部分,随着计算机视觉技术的发展,许多新的无损检测技术应运而生,并取得了一些初步成果。在基于机器视觉的农产品无损检测技术中,

学位

图像分割农产品图像高斯混合模型水平集模糊聚类软边界球分分裂式层次聚类增强可能性聚类算法

企业信息检索中的对象检索方法研究

企业信息检索是信息检索领域的一个重要分支,其目的就是研究如何在一个相对较小的数据范围内有效地管理知识、组织信息,为提高企业管理者的领导能力和员工的工作效率提供服务

学位

企业信息检索对象检索专家检索邮件检索机率比经验元

中庸之道在构建社会主义和谐社会中的意义

中庸之道是以孔子为代表的儒家倡导的世界观、方法论和待人接物的基本道德与原则,是儒家思想的核心和精髓。长期以来,学术界普遍存在着对中庸之道的误解,将其等同于不讲原则

期刊

中庸之道和谐社会可持续发展

基于图嵌入与视觉注意的特征抽取

在模式识别领域,如何在高维数据中寻找有效的低维表示是个核心问题。而特征抽取是解决此问题的关键环节。本文对基于图嵌入和视觉注意的特征抽取理论与算法进行了较为深入的

学位

图嵌入视觉注意特征抽取人脸识别建筑物识别

离线阿拉伯手写体光学文字识别方法的研究

与本文相关的学术论文