基于深度学习的发票图像文本检测与识别

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:fantong518
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习的发展,场景文本检测与识别许多难题都迎来了解决方案,发票识别有着迫切的现实需求,发票识别的研究具备很大的应用价值,但是目前针对发票识别的公开研究成果非常少,其中大多数方法还是基于模板的方法,性能相对较低,且鲁棒性不高,深度学习的优势没能被利用起来。由于发票本身的柔性、机打效果、以及拍摄环境等众多因素的影响,发票图像往往具有形变、文本不清晰、票面不完整、成像质量差等特点,这些特点是影响发票识别性能的关键性因素,也是发票识别的研究难点。发票的这些成像特点与场景文本检测识别所面临的问题有许多相似之处,票面文本的呈现形式又与场景文本有所不同。针对这些难点,结合了场景文本检测与识别最新的研究成果,在端到端的场景文本检测与识别网络FOTS的基础上,针对发票图像识别问题进行改进,替换FOTS网络的文本检测方法,改为基于角点的文本检测与位置敏感区域分割方法,以此来增强网络对于检测多方向、多尺度文本的鲁棒性,设计了端到端的网络结构。此外,还提出了用程序合成发票图像的可行性方案,并在实验中使用合成的发票图像数据集训练深度模型。实验结果显示,该网络在发票图像数据集上,文本检测的F-measure达到92.16%,票面有效信息的整体识别准确率可达到96.56%,网络处理单张发票的平均时间为264ms,这表明基于深度学习的方案能有效提升发票识别的准确度和速度。
其他文献
提升机液压站液压油温过高或过低都会直接影响到液压站的正常运行,对煤矿的安全生产带来隐患。通过对液压系统的热力学计算,对液压站设置冷却和加热装置提供了理论依据,并从
电视纪录片《南通民间儿童游戏》是南通大学教育科学学院在总结以往成功经验的基础上做出的一次新的尝试,本次毕业设计采用跨专业团队组合形式,主创成员分别来自教育技术学专
随着改革开放的不断深入,港口航运限制不断放开,芜湖港也迎来了新的发展契机。随着WTO的全面深入,航运业的全面开放已是大势所趋。面对激烈的市场竞争,港口企业必须制定符合
一  在社区建设中我们非常强调社区的自治性 ,然而从目前社区发展的状况来看 ,社区建设是以一种准行政化的方式展开的。这主要表现在以下几个方面 :首先 ,社区自治组织居委
<正>风险管理(RM))是一门研究风险的发生规律和风险控制技术的新型科学。医疗废物是医疗卫生机构在医疗、预防、保健以及其他相关活动中产生的具有直接或间接感染性,毒性以及
会议
英语教学的模式和方法受到教育界人士和一线教职人员的高度关注,在中等职业院校所开展的多模态课堂教学中,以多种教学方法重新诠释了中职英语教学的方法理论,它架构起一种新
为了揭示西北地区暴雨的时空演变特征,利用该地区109个站44年(1961—2004年)的日降水资料,采用小波分析等方法研究了该地区暴雨的气候变化。研究指出,西北地区平均每年有40站次的
【正】 在“五四”新诗的队列中,《新月派》代表诗人之一的徐志摩,对现代新诗的倡导与发展有过自己的贡献,也曾产生过不同的反响。然而,他像一颗璀璨的流星,闪过一片迷人的异
<正>又快临近期末考试了,看到还有几张复习试卷和一大堆练习题未做未讲,算算时间,我心里万分着急。每逢此时,我总会占用一些"副课"来进行系统复习,这次也毫不例外。周五有节
燃料电池技术的标准化作为规范燃料电池技术、引导燃料电池产业发展走向的重要工作,需要先期开展。文章介绍了燃料电池技术的发展状况,分析了现阶段国际和国内燃料电池技术标准