论文部分内容阅读
汉字书写是中华民族自古以来形成、坚持并传承的习惯,利用键盘和鼠标的输入方式解决了计算机的汉字输入难题,但是传统的书写习惯被破坏,不利于汉字文化的传承;而借助写字板、触摸屏等辅助设备的输入方式需要额外的专业设备,且价格昂贵,未能大规模应用。本文旨在研究一种基于计算机视觉和机器学习的原笔迹提取与汉字识别方法;实现一种低成本、回归自然,但又适应现代数字化计算机的文字输入方式。本文的主要创新工作和研究成果总结如下。本文提出了一种原笔迹提取算法。该算法首先利用肤色检测算法获取握笔手指的位置信息,并根据空间位置关系确定笔迹提取的目标区域。接着采取“由粗到精”的策略逐步排除噪声,提取每帧图像中增长的笔划信息,具体步骤依次为:利用边缘检测,对图像进行“预分割”,获取可能存在笔划的区域位置信息,减少运算量;利用本文定义的一种针对笔划特征的特殊特征提取算子,对单帧图像进行疑似笔划像素点提取;利用连续多帧图像排除干扰噪声,选出疑似笔划中的真正增长笔划。最后根据笔划信息进行原笔迹实时显示,以像素点坐标序列的形式对笔迹进行数字化存储。本文以隐马尔可夫模型为基础,提出并实现了一种在线手写汉字识别算法。该算法首先在原笔迹提取得到的笔划像素点坐标序列中,利用拐点检测算法提取笔划的拐点,将笔划分割为笔段;其次,使用SVM方法对笔段进行分类,得到汉字的笔段编码序列;最后,通过隐马尔可夫模型对手写汉字进行模型建立、训练和识别。本文对40个常用汉字进行了训练和识别实验,正确率达到81%以上。本文使用VS2013开发环境,借助MFC平台和OpenCV库函数开发了一套原笔迹提取与汉字识别系统软件。借助上述原笔迹提取算法和手写汉字识别算法,该系统实现了原笔迹实时显示与保存、汉字识别等基本功能,以及原笔迹颜色设置、清屏、全屏教学模式等附加功能,可在课堂教学中进行板书演示。本文实现的基于计算机视觉的原笔迹提取与汉字识别方法,采用普通USB摄像头,书写人在普通白纸上自然书写,维持了传统的书写方式和习惯,保障了流畅的书写感受,可应用于数字化课堂教学、个性化签名、日常笔记等领域。算法也可移植到智能手机,解决其屏幕小、难以大量输入文字的难题,具有广泛的应用价值。