字符识别中笔段及特征提取方法的研究

被引量 : 0次 | 上传用户:chungkhoan2002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为汉字自动输入技术之一的脱机汉字识别技术,是汉字信息处理的重要接口技术。经过四十多年的研究,在脱机汉字识别的理论和技术上均取得了许多进展,但已有的研究成果还远不能彻底解决所有问题,在理论和技术上都有待进一步研究与发展。在整个OCR领域中,手写体字符识别的难度较大,成为该领域最具有挑战性的课题。论文以脱机手写体汉字识别方法为研究内容,对目前广泛采用的一些识别方法进行了认真的学习和总结。论文在总结学术上已有关于计算机文字识别成果的基础上,描述了计算机文字识别的基本过程,介绍了几种常用的汉字字符识别方法,对已有字符识别方法的改进主要有:(一)提出了一种提取汉字笔段的新方法。该方法从形态学骨架算法生成的骨架点出发,通过分析骨架点的半径分布及不同半径骨架点的位置,发现了笔段提取中产生的毛刺和畸变与骨架点半径之间的规律,进而以此规律为基础提出了一种克服毛刺和畸变的汉字笔段提取方法。(二)提出了一种采用复合特征进行手写体汉字识别的方法。该方法采用霍夫变换提取汉字图像的全局特征,并把这些全局特征与用弹性网格方法提取出的局部特征联合起来,这样得到的混合特征完整地反映了汉字全局特征和局部特征。在进行大类别手写体汉字识别时,采用该复合特征时识别率得到了明显提高。最后,论文介绍了作者参与研发的机器阅卷系统,包括其应用环境、主要功能、使用的主要技术。论文作者主要负责学号填涂区域的处理,并用基于霍夫变换和弹性网格方法提取的特征对姓名进行了识别实验。
其他文献
目前可持续发展思想已被全世界各国政府和广大人民所接受,并已成为国家和地区发展共同遵循的指导原则和战略目标。林业肩负着综合森林经营的健康性、森林环境的生态完整性和未
2005年和2006年在新疆叶尔羌河流域对典型绿洲生境地表甲虫群落和棉田昆虫群落进行了系统调查,分析了各生境地表甲虫和棉田昆虫的群落结构和动态的变化,并探讨了人类活动(土
随着传统语文教育向语文教育科学化转型,语文教育界对语言知识的观念和教学实践已经发生很大改变。过去语言知识在语文教育中的显赫地位风光不再,20世纪80年代以来,语言知识
开封二夹弦是一种具有浓厚乡土气息的地方小剧种,它主要流行于河南、山东、河北、安徽等地;最迟在清道光末期形成,于光绪初年进入开封城。它是在说唱音乐花鼓丁香的基础上,不
外空伦理是应用伦理学的一个正在形成中的研究领域,是以外层空间探索利用中的道德伦理问题为对象的伦理价值研究。本文首先界定了“外空伦理”的相关概念,回顾和分析了国内外
现代旅游业的发展必须坚持可持续发展的原则,这是时代的要求和发展的必然。依托滨海旅游资源进行海岸带旅游综合开发具有投资少、见效快、收益高的特点。滨海地区生态脆弱,滨海
<正>自7月至今,从国家住建部到各个地方住建委,几乎每周都有新政出炉:租售同权、购租并举、共有产权……越来越多的房地产新名词、新方案见诸报端。密集出台的房地产新政传递
宋末元初的舒岳祥、戴表元、袁桷是四明文士群体的代表人物。从南宋度宗咸淳元年(1265)至元泰定帝泰定四年(1327)的62年间,王朝更迭,变化巨大,而此间的历史实际、文士群体命
随着以计算机、网络、多媒体、通信、人工智能等技术的飞速发展,信息技术不断渗入到社会生活的各个领域,在全球范围内影响和改变着人们的生产方式、生活方式及思维方式。这标
在野外实测和室内分析的基础上,采用主成分分析、聚类分析等多种分析方法,对浙江省钱塘江流域五个定位监测站的几种主要植被类型的枯落物吸水、土壤渗透性、抗蚀性、径流量等