便携式非规制表格有效信息智能识别系统设计

来源 :西安工业大学 | 被引量 : 0次 | 上传用户:supercow
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大量纸质历史文件的数字化复现管理,尤其机械零部件测试报表,对保障机械零部件长期稳定运行及故障预测管理具有重大意义。由于早期制表技术的欠缺,目前有大量的纵向框线为不连续虚线、框线错位、跨页等非规则表格,需要进行表格信息化批量处理,是构建设备信息化管理系统的关键所在。通过分析非规则表格本身特性,结合国内外针对表格研究的发展现状,从工程实际项目应用出发,利用QT设计了一套非规则表格有效信息智能识别系统,并完成NVIDIA Jetson TX2嵌入式系统端移植,具备集成度更高、算法冗余度更低的特性,实现了纸质文档录入、识别、导出功能一体化的便携式设计。为特殊场合下机械零部件的历史测试报表的数字化复现管理、寿命预测等提供必备的实验指导性数据。主文主要研究内容为:1)系统交互及文件管理为了实现软件系统与WEB大系统(ZCYS)集成交互,实现了 WEB与EXE文件之间的信息传递;其次采用MUPDF动态库对导入的PDF文件进行高分辨率切分,并以UUID为索引记录保存至SQLite数据库;最后为了保证系统的稳定运行及中断管理,实现了基于配置文件及识别标志的系统暂存日志管理功能。2)非规则表格处理及图控映射辅助研判通过分析非规则报表的特殊性,实现了基于双直方图统计、聚类等的非规则表格处理,包括横纵向直方图统计的最小外接矩形检测、基于局部特征表格完整性检测和拼接处理、基于行距阈值的纵向框线检测及表单元提取分析处理;最后实现了一种基于图控映射的人工辅助研判功能,快速有效的实现异常表格识别入库。3)有效信息识别及数据格式化导出为了实现表格有效信息的数字化处理,利用兼顾精度和速度的CRNN模型进行有效信息的识别。采用ICPR MTWI 2018开源数据集及实际样本进行了 2500次迭代训练,有效信息识别准确率达到95%以上;其次,实现了一种C++与Python之间基于源文件的跨语言交互式设计,便于软件系统的集成化管理;最后将数据以XML、CSV、XLSX格式化导出,便于后续处理。4)系统实现及实验分析为了实现系统松耦合,采用模块化集成思想将各个模块进行类封装软件集成,分别在PC端和TX2端实现,其中PC和TX2端分别采用的EPSON Perfect v19和KS12A884 USB摄像头作为文档扫描输入设备。实验结果表明,本系统可分别在PC端和TX2端实现非规则报表有效信息的智能识别,针对相应功能在PC端和TX2端分别进行了批量处理测试,表名、测试时间、非规则表格识别、有效信息识别、跨页拼接平均准确率分别为:90.18%,99.19%,96.02%,97.55%,96.65%,PC端和TX2端平均处理一页PDF文档时间开销分别为4.58s和14.86s。前后系统迭代20余版本,识别准确率、运行时间等各项指标均符合合作企业要求。该系统已在研究所信息化中心得到了成功应用,目前运行效果良好。
其他文献
爆炸点空间位置的准确测量对检验兵器系统的效能非常重要。基于多相机图像采集与分析的交汇法为空间坐标测试提供了极佳方案,测试模型的系统参数的准确获取是获得高精度测试结果的关键。针对近地炸点空间位置的测试需求,本文采用“双目等高异侧对视交汇”的布站方式,主要进行了对未知点的空间位置解算和系统参数标定技术的研究。首先推导了理想共线对视交汇下的目标位置解算公式,在此基础上,进一步分析了实际测试状态下相机主点
G3-PLC是电力线载波通信(Power Line Communication,PLC)常用的国际标准。由于国内电力网络环境复杂,通信信道存在噪声干扰严重和信号衰减明显等问题,降低了G3-PLC系统的通信可靠性。为提高G3-PLC系统的信道适应能力,在对其物理层传输模型研究的基础上,通过纠错编码和物理层信号滤波相结合的方式优化通信可靠性,完成了算法的设计并实现了一套具有较高通信可靠性的G3-PLC
自动机驱动机构是高射速武器正常运行的关键,由于长时间处于高温、高压等极端环境下,所以也是故障发生率最高的部件。自动机驱动机构故障类型主要集中在三个方面:转膛衬套闭气性、关重件强度、滑板滑动位移。因此,对于转膛自动机驱动机构的故障检测与诊断方面的研究就显得尤为重要。本文针对转膛自动机驱动机构部分的各类故障,并结合其系统的功能需求与技术指标,完成了转膛自动机驱动机构故障检测与诊断系统总体方案的设计,其
随着齿轮制造精度的提升,对其主要测量仪器齿轮测量中心的测量精度有了更高的要求。几何误差是影响齿轮测量中心测量精度的主要误差来源,对其快速检测并准确辨识,是提高齿轮测量中心测量精度的基础保障。球杆仪是一种使用方便、测量速度快的高精度误差检测工具,已经成为机床领域误差检测的主流工具。但球杆仪检测出的误差,不仅包含几何误差,还耦合有运动误差,本论文的主要目的是利用球杆仪的测量数据,剔除齿轮测量中心的运动
商洛地区由于其特殊的地理位置环境导致强降雨多发,是陕西省内典型的强降雨多发地区。为在发生强降雨时保证商洛地区公路、设施运行安全,在发生灾情、突发情况时积极响应,对商洛地区强降雨环境下路面受损的应急响应进行研究。本论文根据我国强降雨环境下路面受损应急响应和路面养护管理的现状,以商洛地区强降雨环境下路面受损养护管理应急响应时的决策优化问题为研究对象,在路面性能预测和评价基础上,分析商洛地区强降雨环境下
深度强化学习具有深度学习和强化学习的双重优势,不但理论取得重大突破,而且获得实际应用。随着机器人应用领域的广泛,工作环境更加复杂多变,对机器人的导航和智能化能力要求更高,传统的路径规划方法已无法满足现代机器人的需求。这时就需要进一步提升机器人的自适应力和自主决策力。人工智能中的深度强化学习方法对机器人路径规划彰显了优异的性能,该方法通过与环境交互试错实现机器人路径规划任务。本文以深度强化学习方法作
随着大型武器装备、机械设备的高性能化发展,各类以合金材料为基体的大长径比异形截面深孔类零件需求量与日俱增。本文针对异形深孔加工过程中存在的效率低下、高成本及工艺稳定性较差等问题,通过电熔爆加工机理研究,以深孔加工机床及辅助工装为基础,结合深孔加工刀具设计理念开发工具电极,提出采取基于传统深孔加工技术的大长径比异形深孔电熔爆加工工艺和方法。首先,从电熔爆技术的基本原理上分析了加工异形深孔的可行性,探
滁宁高速公路是国家重点干线公路,是安徽、江苏、河南省公路网的核心组成部分。自2006年建成通车以来,为当地人民群众创造了更多的经济效益。但是随着道路使用时间的延长和交通荷载的增加路面出现了多种病害,路面后期维修养护不仅耗费大量资金且造成环境污染,路面预养护作为一种主动养护方式,在延缓路面破坏、增加路面使用期限的同时降低了工程造价。本文在多种预养护措施的基础上研究适合滁宁高速路面的预养护方案,为有关
在靶场测试领域,红外光幕靶因测试精度高、靶面直观,是外弹道参数测量中广泛应用的测试设备,其探测灵敏度是衡量靶面性能的重要指标。目前,红外光幕靶由于结构因素影响,导致探测靶面的各区域灵敏度不一致,同时受环境照度制约,影响其在使用过程中的探测灵敏度,进而导致测试精度较低,这对于武器性能测试非常不利。因此,本文针对红外光幕靶灵敏度存在不一致和受环境照度制约的问题,改进红外光幕靶的设计方法,并建立红外光幕
战术通信网是一个极其复杂的系统,影响其可用性的指标多种多样,为了尽可能准确的对网络系统进行评估,必须建立较为合理的方法体系。本文针对战术通信网可用性评估的迫切需求,基于可用性理论,首先分析并给出了系统Markov稳态可用度模型,并对其有效性进行了仿真验证。在此基础上,考虑结合业务运行的性能需求,从“稳态可用度”和业务运行“性能指标达标率”两部分量化取值来对网络系统进行可用性效能评估研究。接下来,本