基于图像识别技术的光学标记阅读机的研究与应用

来源 :安徽大学 | 被引量 : 0次 | 上传用户:lryna22
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机应用范围的扩大,需要计算机处理的数据量也越来越大,在很多领域里,常采用OMR(光学标记阅读机)来解决大规模数据的采集、识别和录入的问题。虽然OMR解决了一些填涂信息卡数据录入的问题,但是由于其自身存在对填涂信息卡裁切精度要求高、光电头安装位置和排列密度相对固定、分辨率低等难以克服的缺陷,使得其使用和推广受到了限制。本文利用图像识别技术对采集的填涂信息卡的数据进行识别,它使用文字识别的方法、算法完成信息卡上标记的识别。即首先通过CCD摄像头把信息卡作为整幅图像输入,再用算法定位、分割、按照文字的识别方法,识别出各种手写符号,对于涉及一些填写了汉字的信息卡,把包含汉字的图像块分割出来,并显示在计算机屏幕上进行人工校验、录入,大大降低了信息卡的填写和制作要求,减小了误识率,提高了信息卡的处理速度。这种方法除了可以避免上述OMR自身存在的缺陷外,还可使填涂信息卡的式样设计更为灵活和用户化,数据准确性高。该技术在教育、卫生、财政、民政、组织、司法、能源、邮电、交通等等诸多领域显示出其良好的应用前景,将成为当今大型数据处理的首选设备。本论文首先系统地探讨了光标阅读器(OMR)的原理、结构。接着对符号识别系统的关键,即图像预处理,做了深入的研究,讨论了提高图像质量的多种方法,分析了图像预处理中多种方法的特点。针对信息卡图像的特性,以提高识别率为目的,提出了相应的预处理方法。在对图像进行二值化处理时,我们提出了一种动态阈值二值化方法,它通过动态改变阈值,对光照造成的灰度不均匀图像有很好的效果;同时详细介绍了一种彩色二值化方法,它避免了灰度化的过程和灰度化方法选择的弊端,直接对彩色图像的RGB值进行处理,具有保留图像的原始特征、不依赖前期的灰度化过程、二值化效果稳定的特点。本文对当前多种已有的字符识别方法进行了探讨,并根据本系统需要识别的信息的特点,采用模板匹配方法、神经网络学习方法以及结构识别多种方法对用户手写符号进行识别,并且采用表决方式选择识别结果,提高了系统的识别率。识别时结合多种特征提取方法,在用最小距离分类器时,将一种误差均衡距离方法用于手写体符号识别,取得了令人满意的结果。在手写符号识别的基础上完成了信息卡的识别,实现了本文研究的基于图像识别的OMR系统设计。
其他文献
近几年来,XML已经成为Internet上数据表示、交换和存储方面的标准,为数据库的应用开辟了一个崭新的领域,然而由于XML数据的半结构化特性以及XML数据所特有的路径表达式查询方
近年来IT技术在企业管理中发挥的作用越来越重要,现代企业的发展速度越快,其业务流程的变化越大,企业对工作流建模技术的要求也就越高。通过对现有的一些工作流建模方法的研
数据网格是网格领域中并行和分布处理技术的一个发展方向,其目标是实现对地理上广泛分布的大量异构数据资源进行共享,其中副本管理是数据网格中一个重要的组成部分。良好的数
随着Internet的发展和应用,越来越多的商务、日常活动通过Internet进行,网络与人们的生活越来越紧密。然而,网络是双面的,人们在享受网络所带来便利的同时,不可避免地接触到
随着计算机产业的发展,以计算机存储设备为载体的电子信息愈来愈多,这些信息大致可分为两类:结构化数据和非结构化数据,结构化数据指的是诸如企业财务帐目、生产数据、学生的
图像融合是综合利用各种成像传感器获得的不同图像或同种成像传感器不同成像方式获得的不同图像以获得更为全面、更为准确的图像描述供观察或进一步处理。它在军事、遥感、机
T-Kernel作为一种嵌入式操作系统,由于实时性和开源性,在嵌入式操作系统领域中的应用越来越广泛。ARM是一款比较好的微处理器,T-Kernel在ARM上的应用研究基本上是空白,所以结
分形理论是近二、三十年才发展起来的一门新的学科,它主要描述自然界中的非线性系统中不光滑和不规则的几何形体。传统的欧氏几何主要研究规则图形和光滑曲线,对自然植物的描
随着Web应用的日益广泛,需求的变化也越来越多,用户希望提升操作体验,企业希望能够降低软件开发费用、最大化现有技术的利用、快速应对业务决策的改变。而以传统的方式来开发