财务票据图像处理与智能信息识别研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:moniter2001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,金融财会蓬勃发展,也促进了大量的货币交易数据的产生,其中部分交易数据记录在电子发票当中,还有大部分的交易数据记录在打印的纸质票据当中,而且纸质票据也因为其独特的防伪特性和监管特性大量存在于企业的文件库中。目前多数企业会聘请大量的专业会计人员手动录入这些纸质票据数据,然后进行一些财务方面的计算和汇总。这样暴露出的最大问题就是浪费了很多的时间成本和经济成本,并且录入数据的准确性不高,影响企业效益。本文针对以上提出的企业纸质票据录入问题研究并设计了一套财务票据自动识别处理算法,可以有效缩短处理周期,提高票据录入效率,规避数据错录、漏录风险。论文主要工作如下:第一,票据分类。企业财务票据的种类是多种多样的,常见的如增值税通用、专用发票,交通出行发票等等。本文综合对比视觉词袋模型与CNN深度学习模型处理效果,决定采取改进型Le Net神经网络对常见7种票据模板进行分类,分类准确率达到98.54%;第二,票据预处理。某些票据样本由于扫描或拍摄时环境因素的影响,输入系统时呈现出歪斜、对比度低、扭曲、噪声混合等特征,同时票据本身也会携带干扰因素,如印章遮掩等。为使后续定位识别算法流程准确率更高,本文主要借助于Open CV图像处理工具箱,采取旋转变换、透视变换、色域分离、对比度增强等组合手段对票据进行了有效的干扰去除等预处理操作。第三,票据感兴趣区域标定。本文提出ROI比例筛选定位算法和相对坐标基准定位算法相结合的方法,将定位分为粗定位和精定位,同时结合票据版面特征利用Hough变换寻找基准坐标,标定票据图像感兴趣区域,有效的提高了定位精度和速度。第四,文字切割和识别。本文改进了迭代式文本切割识别算法,强调处理算法流程的连续性和准确性,融合卷积神经网络、循环神经网络、CTC序列对齐模型将文字识别流程构建为一个CRNN端到端的算法模型,规避了字符分割和字符识别割裂设计带来的复杂度上升、准确性下降的问题。论文针对大量票据存储和分布式调度问题,使用Java和Python语言实现了票据自动识别处理系统。实验结果表明,整体识别准确率达到91%,单张票据的平均处理时间为1200ms以内,极大减少了人力和经济成本,达到了预期的效果。
其他文献
日粮纤维是改善母猪繁殖性能及其后代生长性能的重要营养素。课题组及相关文章研究表明,妊娠期提高纤维摄入量,可提高仔猪断奶重和母猪泌乳期采食量,缩短产程。但仍有研究发现,妊娠期饲粮添加纤维对母猪繁殖性能无显著影响。造成结果不一致的原因可能是由于纤维添加类型的不同。不同纤维原料的不可溶性纤维(ISF)和可溶性纤维(SF)的含量不同,导致饲粮中的ISF/SF比例存在巨大的差异。研究证实,饲粮中的ISF/S
文本转SQL(Text-to-SQL)是一项将语句转换为SQL查询的任务,该任务是自然语言处理中语义分析子领域的一个子任务。本文主要关注上下文相关的跨域text-to-SQL任务,该任务要求模型在训练集和验证集的数据库完全不一致的情况下能够依赖对话历史信息和当前语句生成对应的SQL查询。本文针对上下文相关的跨域text-to-SQL任务首先提出了基本上下文相关的序列到序列模型BCSQL。BCSQL
卫星、无线网络和各种定位设备的发展普及,带来了移动对象的海量轨迹数据,轨迹数据挖掘也成为数据挖掘领域新兴的研究方向。轨迹数据富含时空特征信息,挖掘轨迹数据有助于人们了解人员流动趋势、实时交通动向、动物迁徙习性和气候气流变迁等重要知识,并采取相应的措施保证社会正常运行。旅行同伴挖掘是轨迹数据挖掘的一个重要研究分支,其目的是从海量轨迹数据中寻找时间和空间距离都很接近的一组轨迹,而相应的移动对象即被认为
1986年,Jimbo给出了量子群上的q-Schur对偶,说明了量子群和Hecke代数在V?r上表示的像成为双中心化子,推广了经典Schur-Weyl对偶.本文引入二重Hecke代数HHr,它是由两个Hecke代数环绕生成的无限维代数.这一概念源于“增广简约代数群相关的Schur-Weyl对偶”理论中的退化二重Hecke代数(见文献[1]).本文将研究二重Hecke代数的有限维“自然”表示(张量空
本文是国家自然科学基金面上项目“矿用干式变压器Nomex绝缘老化机理研究”(项目编号:51577123)的主要研究内容之一,此研究旨在解决矿用干式变压器主绝缘的老化问题。Nomex绝缘纸因其优异的电气、热稳定性和抗潮性能而被广泛应用于矿用干式变压器匝间绝缘。然而,煤矿井下环境恶劣,变压器绝缘往往经受着过电压、高温、潮湿等因素的影响。在高温和水分的作用下,Nomex绝缘会发生水解反应导致内部微观结构
本文研究课题来源于国家自然科学基金青年基金“基于严重故障集筛选技术的“电力-天然气”综合能源系统耦合风险评估理论研究(51807129)”和国网山西省电力公司科技项目“特高压骨干网架下山西电网的稳定特性变化及控制策略研究—新能源及跨区电网优化策略(52053017000T)”。发展风电等可再生能源的发电技术是应对全球气候环境恶化以及煤炭、化石等一次能源稀缺等问题的有力措施,可有效推进全球能源结构调
与交流输电技术相比,高压直流输电技术在进行大容量、远距离的电力传输时具有明显优势,因此在我国的应用前景十分广阔。最近几十年来我国修建了大量的超高压、特高压直流输电工程。接地极系统是直流输电系统的重要组成部分,主要起到钳制中性点电压,为不平衡电流提供通路的作用。随着接地极线路长度的增加,线路发生故障的概率越来越不容忽视。然而工程运行经验表明,现有的接地极线路阻抗监视系统(Electrode Line
随着电力电子技术的快速提升,开关磁阻电机以其优异的性能受到了传动领域的广泛关注。由于开关磁阻电机特殊的工作原理,具有结构简单、制造成本低及在较宽的调速范围内都能够保持较高的运行效率等优点,这使得开关磁阻电机在纺织与航天业得到了广泛使用,同时随着电动汽车行业的兴起,开关磁阻电机也开始在电动汽车领域崭露头角。由于电流斩波控制具有实现简单、可靠性高的优点,因此是开关磁阻电机在实际使用过程中最常采用的控制
微型加速度传感器,特别是基于微机电系统(MEMS)的加速度传感器广泛应用于汽车安全、导航系统、航空航天、军事、空间微重力等核心领域。目前,高精度微型加速度传感器更是近年来研究的热点。因此,进行基于易集成、抗干扰、检测精度高的加速度传感器研究具有重要的理论意义和需求背景。本文基于场发射理论,提出了一种新型的高精度真空微电子加速度传感器,设计的真空微电子加速度传感器由敏感结构和接口电路组成。其中敏感结
无线电能传输(Wireless Power Transfer,简称WPT)技术综合电力电子技术、自动控制技术、电能变换技术等,通过能量传输介质(如磁场、电场、微波、激光)实现无电气连接的电能传输技术。该技术以其便捷、安全、灵活等优势,应用于电动车、家电、手机等行业,得到国内外专家学者的关注与青睐。在WPT系统中,最核心的环节(部件)是电磁机构和耦合线圈,是实现发射端与接收端能量无线传递的桥梁。其中