基于图像的表格识别算法与自动录入系统

来源 :北京邮电大学 | 被引量 : 13次 | 上传用户:gm_686
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着近年来测试试验任务不断增多,许多企业为了更好地管理试验任务和数据开始使用电子方式对其进行管理,然而,大量已完成的试验数据仍以纸质表格的形式存储,需要大量人力资源将试验数据录入到系统中。为了减少低效率的人工录入,论文研究基于图像的表格识别算法,并实现表格数据的自动录入。论文设计了一种对试验表格图像进行表格线检测和单元格定位的通用算法;并对特定试验表格集的试验数据进行手写数字语言库训练,提高了试验数据的识别效率;实现了基于Web的表格图像数据自动录入,用于电力绝缘子试验数据管理,具有基于图像的试验数据定位、识别和自动录入功能。论文的主要工作如下:(1)研究表格线检测与单元格定位算法。研究图像预处理算法,对扫描或拍照得到的原始表格图像进行预处理,图像校正,然后使用基于参数自适应动态调整的Hough变换算法和二次单元格定位方法对处理后的表格图像进行表格线检测和单元格定位。(2)研究表格内容识别方法。针对特定试验表格数据集,获取试验数据图像样本,对训练集进行手写数字语言库训练,应用Tesseract-OCR对单元格内容进行识别。通过试验对比,证明针对特定数据集训练手写数字语言库能够提高试验数据的识别准确率。其正确率稳定在92%以上,在少量人工干预的情况下,可以满足企业级应用要求。(3)自动录入系统实现。基于图像的表格识别算法设计了一套基于Web的试验数据自动录入系统,并将其应用于电力绝缘子试验数据管理。输入拍照或扫描所得的相应试验表格图像,对其进行表格线检测与单元格定位提取,然后对单元格内试验数据进行识别,自动录入识别结果至系统相应试验表格中。
其他文献
设计楔刀型免耕开沟器。楔刀型免耕开沟器由锋利的前刀刃和带有侧翼的底座两部分组成,前刀刃与底座之间采用内螺栓连接,磨损后能够方便更换。开沟器设计完成后在玉米秸秆粉碎
试论新时期审计理论的新变化石彦文,李一建当前,我国经济领域内进行的“两个转变”,必将引起方方面面的深刻变化。本文着重从审计的角度阐述两个转变引起的审计工作职能、内容和
认真履行监督职责在两个文明建设中发挥更大作用──郭振乾全国审计工作会议上的讲话(摘要)1997年1月21日一、1996年审计工作有了较大进展1996年审计工作的形势是好的。全国共审计17.8万个单位,查出
一九九二年三月在济宁市中区吉祥小区房基施工中,距地表1.5米深处发现一堆铜钱,约有一百余枚.从一农工手中买得十三枚,经处理清除锈迹,辨识出全是蒙文大元通宝钱,青红铜质.济
日本从20世纪50年代开始,就着手以东京为中心进行城市群建设,发展探索东京大都市圈的过程中,也曾经历经济快速发展和城市化高速推进引发劳动力、产业和资源向东京一极高度集
是否出现了疯猫病据荷兰一项研究报告,一种前所未有的急性多神经病正在荷兰的猫中蔓延,人们担心这会以变化了的模式传染给人类和其他动物。据Utrecht大学兽医神经病学家VanEs博士说,4月初已诊
学习贯彻《中国审计规范》自觉规范审计行为本刊记者陈建国由审计署制定发布的《中国审计规范》(以下简称《规范》)已于今年1月1日起贯彻执行。这是我国继《审计法》出台后又一部
辽宁省委、省政府领导重视审计信息反馈工作丁世平近年来,辽宁省各级审计机关注意在搞好微观审计的同时,不断强化宏观意识,通过审计厅向省委、省政府反馈了一大批较有份量的审计
考察我国审计理论研究的现状,目前,至少存在以下五大误区:误区一:围绕领导讲话开展审计理论研究,表现:①把领导讲话内容作为审计理论研究的重要内容。例如:审计工作的法制化、规范化
本文主要概述了人脸识别技术发展的历程和发展现状。从人脸检测定位、面部特征提取以及人脸确认识别三个方面,归类和总结了现有开源的方法和技术,包括:seetaface方法和腾讯优