表格识别相关论文
测试文档是产品的重要组成部分,与测试数据紧密相关,且有严格的编制要求。针对以往测试文档编写中存在的重复繁琐、灵活性不高、效率......
冶金设备长期处于高负荷状态,工况十分恶劣,极易造成设备故障。而设备故障多以故障调查单及运维履历文档的形式由工人记录,存在内......
近年来,受光学字符识别技术发展的影响,文档识别的应用和需求与日俱增,自动地识别文档并从中挖掘关键信息具有实用价值。表格以直......
目前信息资源构成中仍然存在大量的文档资料,随着信息技术的不断发展,如何借助计算机技术对文档资料进行数字化处理、存储和管理已......
学位
在金融业务中,存在大量如报销、核验等对表单票据进行识别的需求。传统的文字识别算法对图像质量要求很高,且识别精度较低,具有更......
在大数据飞速发展的今天,探索从图像中自动解译表格信息具有重要现实意义,基于此提出了一种基于对比度特征深度学习的图像表格识别......
本文对打印表格的共性及自动识别中版面分析和字符识别进行了探讨,提出通过对表格的整体定位,提取出要识别的数字图象,用笔划密度......
表格文件广泛应用于人们的日常工作和生活中,方便人们简明规范地展示、组织和收集信息。为获得表格中的信息,传统的处理方法是依靠人......
表格是一种常见的文档形式,广泛地应用于人们的日常工作和生活之中.随着计算机技术的发展,利用计算机获取、存储和管理数量巨大的......
当前的社区选举活动中,选举模式的生成以人工制作为主,在短时间、大批量上会服务时,人工操作繁琐,模式制作过于耗时且易出错。因此,研究......
文档是信息的载体,互联网的飞速发展使得信息传播方式发生了变革,传统的纸质文档由于信息传播不便、难于保存和管理、信息检索受限,正......
基于表格的影像文档类型识别是影像文档识别的一个重要组成部分,是图像处理与模式识别领域内一个重要的研究课题。随着表格识别过程......
随着互联网的快速发展,越来越多的企业人力资源开始实施无纸化管理,员工个人信息,薪酬情况都会以数据流的形式录入计算机。但是涉......
科技文献是一种多模态数据,除文本外包含多种信息,比如图像、公式、表格、音频、视频、超链接等,这些信息相互解释、相互补充,为用户充......
目前成熟的OCR技术使得各类文档图像的智能处理成为可能,其中电子扫描表格图像的自动识别对办公室表单数据的高效化管理有着重要意......
期刊
Hough变换是一种常用的检测直线的算法.在表格识别的预处理阶段,对倾斜的表格进行倾角检测,Hough变换是一种比较好的方法,但Hough......
提出了一种单色表格的快速分析方法.其主要内容是:利用Radon变换检测表格的歪斜角度将其校正,用投影法找出表格线的位置,根据表格......
针对普通文档图像中表格结构的识别近年来已经成为了图像处理的研究热点。本文旨在探讨文档图像中的表格转换成Html表格的实现,通......
表格文档在日常生活中运用十分广泛,对这类文档进行计算机自动处理能提高文档处理速度和准确度,具有重要的现实意义。表格文档版面......
表格作为网页的一部分,蕴含丰富的信息,因而表格的识别工作已经成为了一个很值得研究的课题。把表格识别看作是一个分类问题,提出......
本文概要讨论了非限定表格信息提取系统的结构和技术难点,提出了一种既有利于表格识别,又能进行表格定位的方法──四角定位点法,介绍......
对手写表格数字识别系统进行研究,提出了输出规则的概念,解决了常用表格数据识别处理的输出描述问题。用此方法已成功地开发出手写......
基于表格自动录入系统中票据图像的自身特点,提出了一种基于游程的倾斜表格图像的快速检测及校正算法.通过对游程分布直方图的分析......
3 文字识别 清华TH—OCR for HP Version 7.0的界面可以分为几部分:菜单下面是工具栏,鼠标在上面放置片刻,会出现提示说明。左面是......
提出了一种单色表格的快速分析方法,其主要内容是:利用Radon变换检测表格的歪斜角度将其校正,用投影法找出表格线的位置,根据表格中线......
在数字影像中,理想的直线段由呈阶梯状排列的游程所构成。论文利用这一特征提出了一种检测直线段的新方法,它以逐行或逐列搜索带有......
表格的识别近年来受到了越来越多的关注,已取得了一些行之有效的成果,其中的部分方法要求知道表格影像的倾斜角度。给出了一种可以......
结合某铁路分局车辆段列车轮轴卡片自动录入及管理系统开发的实际,提出了一种单色表格的快速分析方法.其主要内容是:利用Radon变换......
采用一种表格识别方法实现对多种类型表格的识别,系统利用表格投影轮廓的功率谱密度作为表格的不变性特征向量。为了解决具有相互......
针对Web数据挖掘预处理中,Web表格无结构化描述及缺乏清晰语义信息的问题,构建了面向结构的Web表格数据提取系统.利用HTMLParser库的......
本文提出了一种复杂表格识别的处理方法。该方法首先输入一张未填用用信息的空表格作前景信息表格。然后输入已填有用信息的同类表......
本算法利用数字影像中直线段的结构特征高效地检测出表格的一条边框线,并由此获得所需的角度值。这一算法也可以用于快速检测其它......
从表格的分析入手,提出对表格进行整体自动识别的具体方法,该方法在编辑软件中的应用,使对表格的处理就象处理一般文字一样轻松自如。......
提出了一种面向对象的表格图像版面分析方法,引入属性关系图的概念来描述表格版面结构,以表达表格组件间的复杂高维关系.属性关系......
近年来,我国矿山安全生产状况持续好转,但重特大事故仍有发生,安全形势依旧严峻。伴随2018年国家应急管理部的设立,我国的应急救援......
表格文本图像版面中存在的大量的非表格框线对象,干扰正确提取表格框架结构。提出了一种基于字线分离的预处理算法。该算法在不提......
目前,大部分表单数据都是通过人工采集的方式进行统计和分析,而利用计算机对表单图像进行自动化识别、统计与分析可以大幅度提高工......
从政府部门的人口普查、民意调查、人事考评,到企业单位的销售数据采集、市场调研等,表格识别产品的应用前景极其广阔。......
为了对非固定样式的手写表格文档进行批量识别处理,实现自动录入功能,首先通过空表识别生成单元格信息,分析版面结构;其次对图片进......
提出一种基于距离加权的自适应字线分离算法。应用一定的启发式规则,计算表格线上像素点的权值,将权值与阈值相比较来判断该点是否......
表格的识别近年来受到了越来越多的关注,已取得一些行之有效的成果。其中的部分算法可抗任意角度的倾斜,然而其运行效率却都低于投......
通过分析表格的框线特征与结构特征,提出一种基于投影特征与结构特征的表格文本图像识别算法。该方法通过投影计算提取表格的框线......