论文部分内容阅读
光学字符识别(Optical Character Recognition,OCR)的概念在1929年就已经提出,经过几十年的发展,该技术相对比较成熟,目前的应用主要体现在办公自动化、车牌识别、票据识别等方面,而食品、制造、日用品等行业还有这巨大的潜在市场。随着自动化生产水平的普及以及物联网等高新技术的应用,字符识别技术在工业方面的应用还有这巨大的潜在市场,因此本文的研究重点主要是字符识别技术在工业方面的应用。本课题来源于产学研合作项目“嵌入式机器视觉控制器的研究与开发”(合同号:07398),基于嵌入式机器视觉平台进行研究,用于满足部分印刷字符和喷墨字符的市场需求。针对前端相机采集到的图像,本文先根据用户选择的感兴趣区域进行字符的预处理,减少噪声的影响,并将倾斜或圆环形的字符校正为水平字符;待识别的字符往往包括多行信息,因此在综合印刷字符和喷墨字符的情况下,本文引入波形膨胀的概念,对字符进行正确分行,再提取每行中的单个字符信息;对于黏连字符,本文运用一种实用而快速的分割方法,能有效的分割黏连字符;在提取字符特征的过程中,综合结构特征和统计特征,将多种特征进行互补,同时根据识别对象的特点,提出位置投影特征,对于字母数字的识别具有很好的效果;利用孔洞特征和穿越特征对字符进行分类,划分为多个小字符集后再分别进行加权处理,运用传统模板匹配的思想进行识别数字和字母,对于部分汉字,则利用BP神经网络进行分类识别。完成算法部分后,再对字符的人机交互界面以及字库进行设计,从而构成一个整体的系统,并运用到实际项目中。本课题按照工程化思路进行研究,确定实现方案后,先利用Matlab平台进行仿真,然后分别移植到上位机平台和底层DSP平台。在此之前,本文对程序部分、算法功能部分以及运行时间等方面进行反复测试,对于字符识别率的测试均高于99%,同时对于分辨率为640*480的图像,检测时间基本都在10ms以内,能满足实际现场的时间要求。目前该技术已经开始运用到轴承的分类,充分的验证了该课题的实用性。