汉字文本图处理与手写体汉字识别

被引量 : 0次 | 上传用户:djjsl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手写体汉字文本图的处理和脱机手写体汉字单字识别是图像处理和模式识别的一个分支。在汉字识别技术中,图像的行切分和字符切分、基于单个字符图像特征的选择和提取以及基于单个字符图像特征的模式分类是最核心的技术。论文在彩色文本图的二值化、噪音消除、消除文本图背景框线、文本图的行分离、文本行的字分离等文本图处理方面,以及归一化处理、基于统计特征的单字识别、笔划提取、基于笔划结构的单字识别等汉字识别方面进行了算法设计、分析,并进行了相关的实验,取得了良好效果。 在汉字文本图的处理方面,在第2章通过分析彩色图像的光照、色彩分布不均匀现象,依据分块二值化的原则,采用公式法+阈值调整实现彩色文本图的二值化。第3章关于噪音消除问题,针对中值滤波的不足,提出了多种方法,包括连通部面积法、连通部膨胀法、雪融法等。采用连通部面积法和雪融法消除小的斑点、空洞以及孤立线条,然后消除孤立的悬空点、凸点和凹点。另外通过分析了背景框线的几种存在方式,提出了直线检测的几种方法。对于已知方向性的直线的检测采用投影分析法。霍夫变换法则是一种通用的检测方法。另外讨论了穿针引线法和受激辐射法用来检测背景框线的方法。 在第4章,利用连续0象素段数量特征生成投影曲线,我们进行了投影曲线分析,发现了文本图处理过程当中的一个现象——单行的单波峰及行与行间的单波谷现象及其稳定性,基于这个现象,第5章给出了一种文本图的行分离方法。 在第6章当中,关于从单独行当中进行字的分离,首先介绍了基于连通部的字分离方法,然后根据对于单行文字生成的投影曲线的分析,提出了惯性法单字分离方法。 汉字单字识别部分研究了识别预处理、基于统计特征的单字识别、笔划提取以及基于笔划结构的识别方法。第7章首先给出了投影函数,然后根据投影函数完成了单字的归一化。第8章研究了几种可用于生成统计特征矢量的单字文本图特征,并且基于这些特征矢量进行了单字识别的实验。 在第9章,首先提出了沉淀法,这是一种适用于工整字的简单的笔划提取方法;然后探讨了一种基于中线分析的笔划提取方法。基于笔划已经提取完毕的先决条件,我们在第10章讨论了基于笔划精确匹配的单字识别方法;对于字的分离、表示、识别等进行了分析。
其他文献
在产品日趋同质化的今天,设计越来越为人所瞩目,成为国民经济新的推动力。尽管中国工业设计的发展已历时数十年,但是,大众对设计本质的理解始终存在偏差,设计师自身对设计的思考也
采用微惯性器件构造惯性航向、姿态系统是国际上近年来发展起来的新技术。利用MEMS (Microo Electro Mechanical Systems)技术设计系统,具有价格低廉、尺寸小、重量轻、集成
香菇段木栽培包括场地选择、段木准备、人工接种、发菌养菌管理、架木出菇等程序. (一)菇场选择;一般选坐北朝南或坐西朝东的山腰缓坡上作为菇场。要求: 1.场附近有大量香菇
期刊
当代作家在文学创作中渐渐走近人文精神的思考领域。张承志以其独特的视角审视着现实生活,把哲学、宗教融进对人的终极思考之中,因而表现出与众不同的创作个性,呈现出骑手、先知
本文分析了用听写的方法进行词汇测试时存在的问题及原因,阐述了如何用延长式听写法和词块听写法促进词汇测试的有效和如何以句子、语篇为载体促进词汇测试的高效。
<正>2017年底2018年初,上海音乐出版社将出版一部钢琴史书译著《钢琴博物志》,由笔者拙译。本书作者斯图尔特·伊萨科夫(Stuart Isacof)系美国钢琴家、作曲家与乐评家,美国《
随着Internet使用的日益普及,企业信息化进程的不断深入发展,企业网络信息资源的安全备受关注。 本文对网络管理信息系统、网络安全技术进行了研究,并以湖北省交通运输物流信
针对传统讲授法的不足,在免疫检验技术教学中,采用PBL与CBS双轨教学模式。教学过程特点包括以问题为中心,学生为主体,教师为主导,侧重于纵向挖掘知识,是以病例为先导的小组讨
实施素质教育是我国教育面对21世纪挑战,适应社会主义现代化建设的然选择。要实施素质教育,关键要改革现行的高考制度。本文从我国现行高考制度存在的考试功能错位、考试导向
<正> 在中国现代文学史上专门从事历史小说创作的作家是没有的,但现代历史小说作为一个文学品种却在"五四"时期就出现了.1922年鲁迅的《补天》便是现代历史小说的一篇发轫之