基于人工神经网络的手写体朝鲜文字脱机识别技术

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:zuo541018125
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本学位论文研究了基于人工神经网络的手写体朝鲜文字脱机识别方法.朝鲜文字系统的文字数量庞大、相似文字多、手写体文字形变复杂、兼具西文单词和汉字的特点,同时又具有自身特有的构字规则和形态特征.因此,手写体朝鲜文字识别问题是文字识别领域中面临的困难大、理论与技术含量高、实际应用价值也很高的课题之一.朝鲜文字的识别可分别以整字、字母、笔划或笔段作为识别对象.识别整字的方案符合人类的认字规律,但因识别对象的数目庞大而难以作为机器识别的最佳方案;而识别字母、笔划或笔段的方案则以文字的逻辑结构或几何结构作为基础,直接识别的对象数目极少,但需要对文字图像进行字母、笔划或笔段的分割处理,这对手写体文字而言很难保证其有效性.在缺乏文字书写过程的动态信息的情况下,手写体文字的脱机识别还面临着合理有效地吸收文字形变的问题.只有面向文字全局考察,才可以有效地把握和处理形变问题,而只有充分利用朝鲜文字系统本身所具有的组字规则,才可以实现高效率的文字识别系统.本学位论文在方法论上采用了分析与综合相结合的思想,在全局中学习局部,用局部重构全局,即一方面利用神经网络的学习能力使识别系统从实际手写文字中学习字母,另一方面利用朝鲜文字逻辑结构的先验知识把各个字母组合成完整的文字.为此本文在朝鲜文字结构分析、手写体朝鲜文字特征选择与提取、字母分类器的研究以及基于字母学习与识别的文字识别算法等四个方面开展了研究.我们首先用形式化的方法分析了字母与文字的形态结构,并分析了朝鲜文字复杂性因素,同时揭示了手写朝鲜文字所遵从的规律.其次,根据手写体朝鲜文字的笔划特点,为吸收手写体文字的形变,选择模糊化动态网格方向线段作为文字特征并给出了特征提取方法,有效地表现了手写体朝鲜文字的特征.为设计字母分类器,本文研究了基于最佳平方逼近的三层前馈神经网络,并采用了隐层单元数目动态递增的训练方式.最后,在文字识别阶段,利用字母分类器给出的候选字母的有效输出值,把文字表示成字母空间中的向量,并通过计算与标准文字之间的匹配程度,确定了以候选字母组合的文字的可信度,产生了最终识别结果.在特征选择与提取、字母分类器的研究和文字识别算法的设计过程中,我们利用所采集的高频字样本对所提出的方法进行了测试实验.实验结果表明字母分类和文字识别效果明显好于单纯的字母分割方法,显示了本文所提出方法的优越性和良好的发展前景.朝鲜文字组成规律作为先验知识分别运用在字母空间特征区域的选定、训练过程中教师向量的产生、字母分类器驱动流程的设计、候选字母的合法性检验、字母空间中文字向量的表示以及候选文字可信度的确定等方面,使识别系统在图像处理与分析层次和文字的逻辑结构层次得到了有力支撑.
其他文献
网格是在计算机技术和网络技术发展到一定阶段提出的一种建立新型计算平台的计算技术,它要整合广域网中分布的,动态的,异构的资源,实现充分共享和各种资源之间广泛的协同工作
图像拼接是一个日益流行的研究领域,它已经成为照相绘图学、计算机视觉、图像处理和计算机图形学研究中的热点。图像拼接解决的问题一般是通过对齐一系列空间重叠的图像,构造
随着现代企业制度的建立以及社会经济的高速发展,企业人力资源已成为左右企业生存发展的重要因素,加强人力资源的有效管理和运作已成为企业提高竞争力的重要手段。 作者在研究国内外人力资源管理系统发展和Web技术的基础上,提出了一个实用的人力资源管理系统结构以及绩效考核算法,采用Delphi 7开发了基于Web的人力资源管理系统(HRMS)。系统包括九个模块:人事信息管理、考勤管理、培训管理、休假管理
智能交通系统(ITS)已经成为21世纪交通运输体系的发展趋势,其实质是对交通信息的分析、共享和综合利用。数据挖掘,简单地说,就是从大量数据中提取或“挖掘”知识。分类分析是数
本文在深入研究垃圾邮件的特点及其产生的根源、现有反垃圾邮件技术的优劣、中文分词技术、文本分类技术的基础上,将目前最优秀的中文分词技术与贝叶斯方法相结合,提出了针对中
随着攻击手段的复杂化和多样化,传统的入侵检测方法己不能满足安全需求,智能入侵检测已逐渐成为入侵检测乃至整个网络安全领域的研究重点之一。本文采用神经网络模型来实现系
随着网络技术的快速发展,依托网络,发挥网络信息资源丰富和不受时空限制的优势,实现网络教学,已经日趋普及。但是,由于学员个性千差万别,若使用划一的、模式化的教学形式,将
P2P(peer-to-peer)是一种新兴的互联网应用技术,因其自身的可扩展性、容错性、自组织性、高效性、低成本性,而受到越来越多的关注。目前在大多数的P2P系统上的信息检索(informa
近些年来,随着计算机视觉相关技术与理论的不断完善与发展,其在视觉检测、视觉导航与自动化装配领域中正被广泛地应用。在视觉系统中,通常摄像机因其价格低廉、获取信息丰富
长事务处理的框架级实现在整个企业级软件应用领域一直是人们研究的热门课题。其概念是指通过容器控制技术在分布式系统的整个软件范围内实现全局数据的一致性。在过去的几年