基于深度学习的发票识别研究

来源 :西安石油大学 | 被引量 : 0次 | 上传用户:ZYYZH
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在现代信息社会,由于国民经济的健康发展与科学技术的提高,人们的经济活动也变得更加频繁,发票成为了记录经济活动的重要载体。然而,在传统的发票录入流程中,大多数录入工作都需要人工完成,这种录入方式效率低下且浪费人力资源。随着光学字符识别(Optical Character Recognition,OCR)技术与深度学习技术的兴起,给人们自动化的信息提取提供了极大的便利,因此,利用深度学习技术来解决发票的快速识别具有重要的现实意义。本文基于深度学习技术对发票识别算法开展研究工作,以最常见的发票为例,根据发票图片的内容特点,将发票识别任务分为两个主要步骤:文本区域检测和文字识别,并通过两个基于深度学习的算法模型实现发票的快速识别,本文主要工作如下:(1)发票文本区域检测部分,选用Pse Net网络模型作为基本框架进行发票文本区域检测。在原有的网络结构中加入了可以扩大感受野的形变卷积,提高了模型的特征提取能力;结合工作实际,根据发票文本的实际场景进行分析,引入了dice coefficient loss损失函数,有效避免了检测结果偏向非文本区域;收集发票图片并制作发票数据集作为模型训练数据,进一步提高了发票文本区域的检测精度,发票文本区域检测准确率提升了4.3%,实验结果表明了本文方法的可有效性。(2)发票文字识别部分,选用CRNN模型开展文字的识别研究,针对文字识别的数据集庞大、场景广泛以及文字识别模型训练困难等问题,制作了部分发票字符数据集;在模型训练环节利用了基于共享参数的迁移学习方法对CRNN模型进行二次训练,文字识别的准确率由90.4%提升到了94.8%,并减少了训练时间和物理设备的消耗。最后,本文基于深度学习技术,将发票文本区域检测与文字识别算法结合起来进行发票识别实验,实现了一种端到端的发票识别的方法,获得了良好的识别效果,实验结果表明了方法的可行性。
其他文献
太赫兹技术(THz)的研究和应用涉及物理学、材料科学、生命科学、天文学、信息技术和国防安全等多个领域。作为太赫兹技术的关键性器件,太赫兹发射源虽然有多种产生方式,但半导体等离子波太赫兹发射源器件(Tera FETs)由于其室温性、紧凑性和可调频性,成为太赫兹技术研究的热点。基于Dyakonov-Shur不稳定原理(D-S不稳定原理)的半导体等离子波器件(Tera FETs)的结构和工作机理很早就被
学位
高性能微波带通滤波器综合技术多采用窄带N+2耦合矩阵综合。耦合矩阵可通过相似变换得到不同的电路拓扑,矩阵中的元素值可精确对应实际电路拓扑。然而,当使用波导腔体来设计高性能滤波器时,耦合矩阵中的交叉耦合和不同符号的耦合有时很难实现。提取极点滤波器结构简单,能够更加灵活地指定传输零点的位置,并且电路中不存在交叉耦合。但是提取极点滤波器的原型电路与物理尺寸之间很难像耦合矩阵和其对应电路拓扑一样建立精确的
学位
随着以人工智能、机器人技术等为突破口的第四次工业革命的到来,现代钻机装备正逐步朝着智能钻机方向发展,借助智能控制理论和人工智能专家系统进行钻井设备优化及安全监控运行是实现钻机智能化的整体转型升级。钻井过程中铁钻工是钻机井口钻井作业中重要的上卸钻具装置。随着自动化、智能化钻机装备的提升,对铁钻工装置有了更高的要求。针对现有液压控制铁钻工自动化程度低、运行灵活性差、安全可靠性不高,数据采集难等问题。本
学位
管道输送是油气运输的主要方式,具有输送效率高、成本低的特点,近几年发展迅速。但随着管道在役时间的增加,油气井采出的流体对管壁侵蚀不可避免,特别是地层砂被携带到地面输送到管道中,高速的固体砂粒侵蚀管道弯管处,可导致管道刺穿、油气泄漏事故的发生。为了及时掌握管道侵蚀状况,保证油气安全、高效的输送,开展管道侵蚀检测技术的研究有着实际意义。本文提出了基于电磁超声的管道弯管侵蚀检测的方案,即通过电磁超声的测
学位
随着工艺尺寸的不断缩小,单粒子瞬态成为研究的重点。当器件尺寸在亚微米甚至深亚微米工艺下时,即使粒子入射到漏区周围单粒子瞬态脉冲也会出现。这使得只把漏区作为敏感区域进行分析将存在较大的偏差,因此有必要对器件的敏感区域进行更细致的分析。本文针对65nm工艺标准单元的单粒子瞬态敏感性进行了研究。主要研究内容和成果如下:1.基于Congenda的仿真工具构建三维器件模型,采用混合仿真的方法,针对反相器的单
学位
随着复杂压裂工艺在油气开发中的应用,非均匀外挤成为套管损坏的主要原因,大量非API高抗挤套管被应用到非常规油气资源开采中。由于制造缺陷因素对高抗挤套管有着较强的敏感性,API公式在指导高抗挤套管的强度计算时存在较大误差。对此,提出一种基于数据驱动的石油套管非均匀抗挤强度预测方法,从套管自身非均匀制造缺陷与非均匀外挤作用两个角度出发构建数据驱动模型,实现对非API/高抗挤套管的抗挤强度预测。结合套管
学位
工业仪表在石油钻井现场中被广泛应用,为了实现石油钻井现场的数字化转型以及智能化发展,需要对仪表的数据进行实时的采集,但由于环境条件的限制当前现场仍存在大量的指针式仪表难以自动传输数据,因此提出了基于深度学习的方案对指针式仪表图像进行自动识别,获取仪表数据,实现井场的数字化管理、控制。本论文的主要工作内容如下:(1)提出了基于MobileNet+SSD的三步式仪表图识别方案。首先提出了MobileN
学位
随着深度学习领域的发展以及人们安全意识的提高,深度学习在安防领域的应用越来越广泛,应用于门禁系统的人脸识别算法在数字化时代成为研究热潮。但由于目前人脸识别算法大多为面部无遮挡物的识别,在新冠疫情流行期间,对佩戴口罩人脸的识别效果不佳,造成了门禁系统工作的不便。为了实现戴口罩人脸的识别,加强门禁系统对戴口罩人脸识别的鲁棒性,提出一套应用于门禁系统的深度学习人脸识别模型。模型训练阶段,本文模型采用基于
学位
目前我国大多数陆上油田已经进入高含水阶段,采出液具有“低产油、高含水”的特点,而精确的含水率测量对实时调整油井开采参数和开采策略,提高采收率、减低成本、延长油田寿命都有着重要意义。由于油井采出液电特性与含水率有着对应关系,通过测量油水两相流的电特性参数以获取含水率成为当前研究的热点。本文借鉴生物医学领域电导率测量技术,提出基于磁声耦合效应的油水两相流电导率测量方法,并开展激励方式的研究工作。文中首
学位
非常规油气资源逐步成为我国油气勘探开发的重点,其开发难度大,导致对钻具姿态测量的要求较高。为了提高姿态测量算法的精准度,需要在开发过程中对算法进行深入的验证。但是,真实传感器测量存在环境电磁干扰和实验室无法模拟井下环境等问题,导致姿态测量开发过程算法验证困难。因此,本课题提出虚拟随钻姿态测量传感器的设计来解决以上问题。本课题通过对姿态测量传感器在钻井过程中受到的干扰及噪声影响进行建模,结合数据输出
学位