离线阿拉伯手写体光学文字识别方法的研究

来源 :武汉理工大学 | 被引量 : 9次 | 上传用户:alexander_guwen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器的识别本领无法与人的认知能力相比,因此手写体的识别特别是离线的手写体识别对于模式识别等学科和理论来说,仍有较强的研究价值和意义。同时,手写体识别的研究,对于进一步提高低质量,变形大,复杂环境干扰条件下的文字识别的准确率;解决视频图像的文字检测和识别;文字的字体、签字和字迹的鉴别;手写阿拉伯文档等的识别以及各种图像识别技术和应用问题等,甚至对于相对更成熟的联机手写识别技术来说,都具有重要的借鉴和启发作用。由于阿拉伯手写文档具有它独有的特性,识别起来不能完全照搬现有的文字识别方法,它有着自身的特点和难点,导致现在越来越多的研究机构投入到离线手写体阿拉伯文字识别这项研究中来。国内外科技工作者己对该领域从不同的角度进行了广泛的研究,并且取得了许多阶段性的研究成果,但由于以下的原因,到目前为止,离线阿拉伯文字识别还没有商用的产品问世:1)风格:阿拉伯文本,包括手写体和印刷体实际上都是连接的。2)文本流:和拉丁语文本以及其它的语言不同,例如汉语,日语或者韩语,阿拉伯手稿是从右往左而不是从左往右的书写顺序,字母连在一起通常形成一条基线,但对于手写体来讲,基线只是一个想象的概念,实际书写中可能并不存在,这增加了识别的难度。3)字符的形态:阿拉伯语字母的形态取决于它在词中出现的位置。同一个字母在词首和词尾有着截然不同的形态,加之用点代表元音,这样字母表就达到了160个字符。还有一个问题是横笔延长经常出现在相连的字母中,这也导致了字母的形态的截然不同。4)词的形态:在阿拉伯语中,即使是相同的词,不同的书写者有着不同的书写风格,从而导致不同的词的形态。5)重叠:由于书写风格的原因,一个词中的字母经常重叠在一起,有时候有些人还将这些字母次序颠倒地写,这给分割技术带来了很大的困难。现有的离线阿拉伯文字识别系统的识别率及对测试数据集的有选择性等都有待改善,其效果与实际需要还有很大的距离。本文对离线阿拉伯文字识别方法从文本图像的采集、预处理、特征抽取、分类这样一个完整的文本图像的识别方法作了研究,评估了现有的相关算法,改进了有关的增强算法。具体完成的主要工作如下:①在阿拉伯手写体文本图像识别的预处理过程中使用两步线性回归法来进行基线检测。在对离线阿拉伯手写体文本识别的研究中,基线歪斜不同程度地出现在大多数自由书写的阿拉伯手写体文本中,我们提出的基线检测算法是基于两步线性回归法,首先找出该词在轮廓线上的局部最小点,然后用线性回归法在最小点上计算基线的近似值,再找出接近第一个近似值的那些点,最后用接近第一个近似值的那些点,使用第二次回归法修正这条线。另外,在手写体识别的研究中,文本的预处理有分割和不分割两种方法,而我们针对阿拉伯文本字符相连无法实现完整分割的特点,采取不分割的方法。②特征抽取方面。我们人能够通过大脑很简单地认识文字,是因为在人的大脑中已经保存了文字的特征,像文字的结构、笔划等。要想让计算机去认识文字,首先也要存储类似的信息,通常的做法是根据文字的笔划、特征点、投影信息、点的区域分布等进行分析,常用的特征抽取方法有结构分析方法和统计分析方法。在这篇论文中,结合阿拉伯手写体的特点,我们采用常见的GSC特征,结合主成分分析PCA来压缩特征的维数,以此描述阿拉伯手写体文本图像。③分类器的设计。目前的研究中一般是选择BP网络识别方法、SVM识别方法以及隐马尔可夫模型等,因为阿拉伯文本中字符相连的特点和语音识别的类似,所以我们研究隐马尔可夫模型应用在无分割的阿拉伯手写体文本图像识别中的参数设计和选择,采用经验值选取恰当的参数,优化算法,实现识别系统自动学习、自动选取、自动优化,并尝试使用多分类器的融合,提高文本的识别率。
其他文献
近年来,随着World Wide Web的迅速膨胀,电子商务也随之得到迅速发展,以Web站点形式展示公司产品信息已成为电子商务交易的一个重要环节,这些Web站点通常由一个后台在线数据库
结合应用型高校人才培养目标,针对伺服运动控制技术课程理论性、综合性、实践性均较强的特点,详细分析了目前教学中存在的问题。以培养学生工程实践能力为教学导向,树立学生在整
定量结构-性能关系研究(Quantitative Structure-Property Relationships,简称QSPR)为材料学的重要组成部分。研究者从材料的结构入手,推测其材料的具体性能。QSPR来自一个化
冬季供暖期间对哈尔滨市住宅、办公建筑、宿舍和教室4种建筑的室内热环境进行了连续跟踪测试和热反应主观调查,得到不同建筑室内热环境的特征参数及人体热反应特征和热中性温
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
城镇污水具有温度相对恒定、冬暖夏凉的特点,是一种优良的低温热源,与热泵结合具有很好的节能前景。搭建了热泵实验平台,并以上海市某污水厂的二级出水为热源,通过实验对污水
农产品的无损检测是农业现代化的一个重要组成部分,随着计算机视觉技术的发展,许多新的无损检测技术应运而生,并取得了一些初步成果。在基于机器视觉的农产品无损检测技术中,
企业信息检索是信息检索领域的一个重要分支,其目的就是研究如何在一个相对较小的数据范围内有效地管理知识、组织信息,为提高企业管理者的领导能力和员工的工作效率提供服务
中庸之道是以孔子为代表的儒家倡导的世界观、方法论和待人接物的基本道德与原则,是儒家思想的核心和精髓。长期以来,学术界普遍存在着对中庸之道的误解,将其等同于不讲原则
在模式识别领域,如何在高维数据中寻找有效的低维表示是个核心问题。而特征抽取是解决此问题的关键环节。本文对基于图嵌入和视觉注意的特征抽取理论与算法进行了较为深入的