论文部分内容阅读
文字是人们相互交流的主要工具,从图的角度看,它是简单的图形;从技术上看,文字图形的识别相对其它图像(如人脸图像等)而言比较简单,易于处理和分类。进行字符识别可完成诸如文本和数据的自动阅读、邮件自动分拣、识别各种报表等复杂工作,极大地方便人们的生活。目前,文字识别的对象主要有字母、数字、符号、汉字;按识别的方式可分为联机识别和离线识别。本课题主要研究离线数字识别系统的设计与实现。 本课题中离线数字识别系统的设计与实现主要分为三部分:图像采集、图像预处理、图像特征提取与识别。图像采集的工作主要是由摄像头、CPLD、视频解码器和帧存储器来完成。视频解码器完成对摄像头输入的视频信号进行行场信号的同步分离和图像数据的A/D转换,输出的数字图像数据在CPLD的控制下保存在帧存储器中。 图像预处理部分主要包括平滑处理、目标增强与阈值分割,这一环节主要为图像特征提取和识别作准备。在分析图像预处理对图像特征提取和识别影响的基础上,提出了一种基于目标的图像增强算法,该算法计算量小、实时性好,有效地解决了图像背景颜色差异和环境光线差异对图像特征提取和识别造成的影响。 图像特征的提取与图像识别的方法有着十分密切的关系,不同的识别方法所要求提取的特征也会有所不同。神经网络具有强容错性、巨量并行性以及自适应、自组织、自学习的能力,在图像识别中的应用非常广泛。本设计采用神经网络来对图像中的数字进行识别。此外本系统还包含了识别结果的输出显示以及DSP与PC机的通信模块。 本课题主要完成离线数字识别系统的硬件设计和调试,并完成了相应的图像处理和识别算法在DSP中的调试。本文首先介绍了系统方案设计的理论基础,然后分章节详细介绍系统软硬件的具体设计和调试的各个细节,最后总结了本设计所完成的工作,为了完善本系统,还提出了一些改进的意见。本系统通过进一步完善后,在现实生活中具有一定的应用前景和实用价值。