【摘 要】
:
近年来,受光学字符识别技术发展的影响,文档识别的应用和需求与日俱增,自动地识别文档并从中挖掘关键信息具有实用价值。表格以直观简洁的方式表示数据,是文档页面的重要对象,在生产生活中有广泛应用。但是,由于复杂的文字布局和表格结构,表格识别难度高,面向用户和开发者的表格识别系统少,无法满足一般需求。因此表格识别系统的设计与实现有现实意义。本论文的主要研究内容如下:首先,本文创建了一个大规模表格识别数据集
论文部分内容阅读
近年来,受光学字符识别技术发展的影响,文档识别的应用和需求与日俱增,自动地识别文档并从中挖掘关键信息具有实用价值。表格以直观简洁的方式表示数据,是文档页面的重要对象,在生产生活中有广泛应用。但是,由于复杂的文字布局和表格结构,表格识别难度高,面向用户和开发者的表格识别系统少,无法满足一般需求。因此表格识别系统的设计与实现有现实意义。本论文的主要研究内容如下:首先,本文创建了一个大规模表格识别数据集,提出HTML标记语言生成数据的方法。数据集收集科学文档中的表格图像,使用真实的文本语料和单元格结构,为基于深度学习的表格识别模型提供大规模的训练和测试数据,方便公平比较,同时介绍了生成数据集的方法和表格识别常用评价标准。其次,本文提出了三阶段的表格识别算法,算法分为表格文字检测、表格文字识别和表格结构识别,表格文字检测基于角点检测与区域分割网络,表格文字识别基于不定长序列识别算法,表格结构识别基于图网络模型,分别针对实际问题进行工程化改进,在数据集和实际图片上设置多种对比实验,验证算法的性能和速度,分析错误结果和算法缺陷。对输入图像数据,检测、识别和表格结构重建结合识别完整表格,为系统设计提供重要算法支撑。最后,本文设计并实现了在线表格识别系统。系统使用Flask框架,提供网页应用程序服务,包括前端页面、数据库和后台程序,功能上采用模块化设计,实现图片的实时上传识别显示和识别结果修正,详细说明模块的功能分析、功能实现和性能评估,设计模块关联数据表,分析系统优越性和局限性。
其他文献
光纤陀螺仪是基于Sagnac效应的高精度角速度传感器,具有体积小、成本低、寿命长、功耗低、动态范围大等一系列优点,在航空、航天、陆地、航海等军用、民用领域都具有广泛的应用。然而,光纤陀螺关键元器件几乎都是从美国进口,国产率远远达不到95%的要求,设计具有自主知识产权的光纤陀螺专用芯片具有重要的意义。本文针对干涉式闭环光纤陀螺数字控制电路进行优化集成,设计光纤陀螺数字控制专用芯片,以满足光纤陀螺电路
受在线评论的评论质量参差不齐以及评论数量爆炸式增长的影响,消费者已经开始逐渐转变评论阅读的方式,从大范围阅读评论转变为只阅读顶端少数几条或十几条评论。在目前实际的评论领域中,对评论进行简单的分类排序,其粗略的排序结果已经不符合当今需求,而对评论进行简单的回归排序,其全局的排序结果又不够精确,也不满足目前消费者阅读评论的需求。针对现有评论排序研究在目前实际需求中存在的不足,通过将分类排序和回归排序进
相对于线极化天线,圆极化天线因其自身特点在遥控、遥测、雷达和卫星通信等领域得到了广泛的应用,特别是在Ku波段卫星通信中的应用。随着现代通信技术的飞速发展,对圆极化天线的带宽、增益等性能指标提出了更高的要求,基片集成腔(Substrate Integrated Cavity,SIC)天线具有尺寸小,高增益以及能有效抑制表面波等优点,已成为天线设计领域研究的热点之一。基于SIC结构,开展Ku波段宽带、
为了更好存储多元化的数据,存储系统中引入了局部修复码技术。局部修复码能够在保证可靠存储的同时,显著降低数据重构开销,因此适合应用于冷数据的存储。但是随着存储系统的不断发展,局部修复码的编码性能逐渐成为了限制存储系统发展的重要瓶颈。因此,充分利用存储节点所使用的廉价图形处理器(GPU)并设计实现一个能显著提高编码性能的局部修复码优化方案是当务之急。为了更好利用局部修复码提高存储系统性能,提出了一种基
工控系统涉及众多关键基础设施,一旦受到攻击将造成惨重的经济损失,然而工控网络相对比较封闭,内部没有足够的数据支撑,缺乏对于外部威胁的应对能力,并且传统的网络安全分析方法具有一定限制,只能预测已知攻击,无法预测未知攻击。为了提高工控网络安全分析能力,本文提出了一种数据驱动的工控网络安全分析框架,并围绕工控网络安全知识图谱的构建和应用开展研究。针对工控网络安全分析缺乏数据支撑的问题,本文将互联网中海量
文字,作为一种传播信息的载体,其往往包含了丰富的同时也是人们需要的重要信息。自然场景文本识别就是检测识别自然场景中的文本实例,包括车牌、路牌和广告牌等,所以自然场景文本识别在日常生活中有着广泛的应用前景。本文的研究内容就是如何准确提取医疗票据图像中文本信息,从而保证后续文本识别的准确性。因为人工录入效率低、成本高,并且录入人员会因疲劳而导致出错,而如果能够使用场景文本检测算法通过机器完成录入票据信
随着网络技术、数据通讯技术、人工智能等的不断发展,智能视频监控系统的应用在不断扩大。在网络通讯高速发展和计算机技术快速进步的情况下,基于监控摄像头下的人脸识别技术的智能视频监控系统能够减轻大型场所监管人员的工作压力并且提高工作效率,对加强安全和自动化管理有着重大的作用,拥有巨大的发展空间。另外,由于监控场景下的人脸识别技术需要面对运动模糊、光线不一,姿态各异等众多非约束场景的不定因素,这些问题值得
在压水堆冷管段小破口失水事故(SBLOCA)中,一回路蒸汽发生器与主冷却剂泵之间的U型管内会形成阻碍一回路循环流动的环路水封。一回路循环的中断会导致堆芯上腔室内蒸汽不断聚积,引起堆芯坍塌液位下降和燃料包壳峰值温度上升,直到发生环路水封清除(LSC)现象。因此,研究LSC现象发生的时间及影响因素对燃料包壳峰值温度的精确安全分析具有重要意义。本文利用最佳估算程序RELAP5/MOD3.4对压水堆小破口
双目立体视觉是通过模拟人的眼睛对目标物体的感知来获取目标物体的三维深度信息。目前双目立体视觉技术在机器视觉领域发展已经成为最为关注的方向,在自动驾驶、无损探伤以及无人机飞行等领域已经得到了大量的应用。立体匹配是双目视觉技术的重要环节,传统的稠密立体匹配算法具有计算速度慢,视差精度低的特点,因此很难适用于实际场景,使用稀疏立体匹配的方法虽然计算速度快,但其计算精度差,容易受到噪声干扰。为了解决上述问
网络协议识别是指根据协议或者某种应用产生的流量中包含的代表性特征对协议进行分类,确定该协议所隶属的应用层协议。研究出高效的识别协议的方法对于提升网络环境的安全以及网络通信的管理有重大意义。然而网络环境中不断涌现出的各种不知名的、未公开的通信协议,使得现有的大部分网络协议识别方法都不再满足实际需求。所以识别未知协议成为协议识别领域亟待解决的问题。针对未知协议的识别,无监督学习算法中的聚类方法成为其中