论文部分内容阅读
发票,是指在购销商品,提供或者接受服务以及从事其他经营活动中,开具、收取的收付款项凭证。在国内大部分的企业和政府单位,发票的处理基本采取传统的人工处理的方式,而发票的数量往往比较庞大,使得工作人员负担过大,同时也造成了效率低下等问题。针对此类情况,本文基于深度学习和图像处理算法,设计并实现一套能准确识别数字信息的发票自动识别系统。首先对扫描仪采集到的发票图像进行预处理及倾斜校正,然后对发票信息区域进行定位,获得感兴趣区域。接着对信息区进行去噪,利用投影算法完成单个字符切割。分别收集不同区域切割后的单字符,制作成字符数据集。深度学习的本质是通过构建多个隐层的神经网络来训练样本数据,而训练样本的实质则是让网络自主的学习样本的特征。分析发票印刷数字的特点,运用卷积神经网络的Alex Net网络模型进行数字的训练、识别。本文的主要研究内容如下:1.图像采集、预处理及校正利用扫描仪提供的SDK进行二次开发,实时采集发票图像;由于发票在采集过程中存在倾斜或者光照不均等情况,因此需要对发票图像进行一系列的预处理,然后再做倾斜校正。2.信息区域定位、去噪及字符切割本文需要对五个信息区域定位,分别是:发票号码、金额、税额、购买方纳税人识别号、销售方纳税人识别号。增值税发票是全国统一的,具有相同的且固定的版面结构,可以利用发票结构的特点获取信息区域。首先根据先验知识,获取各信息区域的大致范围,得到粗定位区域;然后根据各区域信息的特点,用模板匹配的方法找到信息的精准区域。接着对得到数字串区域进行去噪操作,以提高后续字符切割和识别的准确率。最后提出了基于先验知识的灰度投影字符切割算法,实现单个字符的切割。3.基于深度学习的数字识别首先搭建深度学习caffe框架,利用字符切割得到的单字符制作字符数据集;然后对卷积神经网络Alex Net网络模型的参数进行调整,训练模型;最后用训练得到的模型进行数字识别。实验结果证明,本系统能快速,准确地识别发票信息,大大提高了发票处理工作的效率,减轻了工作人员的工作量。