发票印刷体数字识别方法的研究

来源 :沈阳工业大学 | 被引量 : 0次 | 上传用户:vicky1924
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
发票的管理工作一直以来都是采用传统人工方式完成的,由于发票单据处理的基数过大,时间紧迫,人员的工作存在任务繁重、效率低下等一系列问题,针对此问题,本课题旨在利用计算机来自动处理发票单据,在节约人力物力消耗和资金投入的同时也能够提高工作效率。发票处理的关键工作是对发票编号进行记录,因此本文的研究重点是通过计算机识别发票号码和发票代码,即普通商业机打发票中印刷体数字的识别。数字识别是光学字符识别的一种,通过对该领域国内外研究现状的分析发现单纯理论研究已趋于成熟,但是将理论结合到具体实用环境的数字识别技术依然有很大的研究价值与研究空间。进行发票编号的识别需对发票拍照,拍照条件导致了拍摄图像的效果具有不可控性,如何从存在干扰因素的发票图像中识别出有效的数字信息是本文的研究难点。对此,本文进行了如下主要工作,首先,对采集到的发票图像进行倾斜矫正和数字区域的定位,采用基于霍夫变换检测直线的方法对倾斜的发票图像进行倾斜检测,把所有倾斜的发票图像矫正为水平状态,利用投影法实现了数字区域的定位。然后,研究了发票图像的预处理工作,包括图像的噪声去除、图像的灰度化、二值化、字符的切分和归一化。对每个预处理阶段的算法进行编码实现,采用非线性的中值滤波器对图像进行噪声滤除。图像的二值化处理采用了自适应阈值分割算法,随机选取某一阈值作为起始阈值,通过不断迭代,最终确定出分割的阈值,应用投影法将数字串切分成单一的数字并且使用插值法将单一数字归一化到相同的大小。最后,分析了几种印刷体数字识别的算法,针对印刷体数字结构稳定、形态单一的特点,提出了一种改进的基于数字结构特征的识别算法。通过与基于穿越号码次数的结构识别算法、基于结构特征的号码识别算法以及改进的左右轮廓特征三种方法的对比实验发现,本文采用的改进的基于数字结构特征的识别算法的识别率为98.5%,运行时间低、对噪声的鲁棒性好。实验结果表明,采用改进的基于数字结构特征的识别算法可以提高发票图像识别的识别率和准确度,将此算法应用于发票数字识别方案,会有效提高发票处理和存储工作的效率。
其他文献
配电房电气设备安装及调试直接关系到配电网运行的安全性和可靠性。但是在安装和调试电气设备时还存在着很多问题,本文在此基础上重点研究了如何更好地进行电气设备的安装调
随着经济全球化的不断发展,知识经济已经成为当前经济发展的主流趋势。在此背景下,产学研联盟作为知识转化为经济的有效途径之一,是技术创新、经济发展的必然要求。产学研联
随着荔枝汁和荔枝酒的发展,产生了大量的可食用性荔枝果渣,但是这些荔枝果渣随着荔枝壳和荔枝核直接被丢掉,造成资源浪费,而目前对荔枝果渣的研究报道比较少。本研究主要分析
<正>近年来,随着互联网、信息存储、云计算、物联网、社交网络、移动智能终端突飞猛进的发展,数据的信息处理与应用已进入大数据时代。人们的生活方式也因此发生了前所未有的
<正>近日,特高压±800kV祁韶直流调相机动态验证试验圆满完成,为确保特高压安全稳定运行提供有力支撑;该试验在国家电网系统尚属首次。随着特高压直流输电工程的相继投运,应
<正>中小学数学教学衔接问题是数学基础教育工作者研究的重要课题之一,解决好这个问题,不仅反映了一个人从小学到中学学习内容上的连续性,更重要的是培养学生掌握科学系统的
会议
蓝草在我国历史上曾是重要的经济作物,蓝草制备的植物靛蓝具有抗菌消炎和抗紫外线等保健作用,然而在合成靛蓝商业化的冲击下,蓝草制靛技艺几乎消亡。近年来,伴随着人们对环保
纺织业自古以来就是我国国民经济的重要支柱产业,随着科技的发展,纺织技术的应用早已不再局限于纺纱与织布,在航空航天、医疗、军工等高科技领域均得到了广泛应用。在纺织过
本课题以开发婴幼儿、孕妇和老年人专用的调和油产品为目的,对市售多种调和油产品及以上三类人群的膳食宝塔进行研究,并对最终产品进行验证检测。论文主要内容包括:对从市场
酸奶中的乳酸菌能将大分子蛋白质分解成人体易吸收的小分子营养物质,这对人体具有很重要保健功能,但酸奶严重的后酸化问题不仅严重影响风味,还大大缩短了酸奶的货架期,阻碍了