论文部分内容阅读
发票的管理工作一直以来都是采用传统人工方式完成的,由于发票单据处理的基数过大,时间紧迫,人员的工作存在任务繁重、效率低下等一系列问题,针对此问题,本课题旨在利用计算机来自动处理发票单据,在节约人力物力消耗和资金投入的同时也能够提高工作效率。发票处理的关键工作是对发票编号进行记录,因此本文的研究重点是通过计算机识别发票号码和发票代码,即普通商业机打发票中印刷体数字的识别。数字识别是光学字符识别的一种,通过对该领域国内外研究现状的分析发现单纯理论研究已趋于成熟,但是将理论结合到具体实用环境的数字识别技术依然有很大的研究价值与研究空间。进行发票编号的识别需对发票拍照,拍照条件导致了拍摄图像的效果具有不可控性,如何从存在干扰因素的发票图像中识别出有效的数字信息是本文的研究难点。对此,本文进行了如下主要工作,首先,对采集到的发票图像进行倾斜矫正和数字区域的定位,采用基于霍夫变换检测直线的方法对倾斜的发票图像进行倾斜检测,把所有倾斜的发票图像矫正为水平状态,利用投影法实现了数字区域的定位。然后,研究了发票图像的预处理工作,包括图像的噪声去除、图像的灰度化、二值化、字符的切分和归一化。对每个预处理阶段的算法进行编码实现,采用非线性的中值滤波器对图像进行噪声滤除。图像的二值化处理采用了自适应阈值分割算法,随机选取某一阈值作为起始阈值,通过不断迭代,最终确定出分割的阈值,应用投影法将数字串切分成单一的数字并且使用插值法将单一数字归一化到相同的大小。最后,分析了几种印刷体数字识别的算法,针对印刷体数字结构稳定、形态单一的特点,提出了一种改进的基于数字结构特征的识别算法。通过与基于穿越号码次数的结构识别算法、基于结构特征的号码识别算法以及改进的左右轮廓特征三种方法的对比实验发现,本文采用的改进的基于数字结构特征的识别算法的识别率为98.5%,运行时间低、对噪声的鲁棒性好。实验结果表明,采用改进的基于数字结构特征的识别算法可以提高发票图像识别的识别率和准确度,将此算法应用于发票数字识别方案,会有效提高发票处理和存储工作的效率。