版面分析相关论文
蒙古文铅活字印刷技术的发明给我国蒙古民族文化和教育的发展带来了非常深远的影响。活字印刷实现了批量化、规模化生产,大大降低......
乌金体是一种常用的藏文字体,它不仅出现于日常使用的各类藏文文档中,也存在于记载着中华民族优秀文化的古籍文献里。在信息化时代......
随着互联网时代的到来,各种信息的数字化在人们的生活中随处可见。比如之前学生上课大多采用纸质书籍作为信息承载媒介,而近年来课......
文本检测与识别的相关工作在我们的日常生活中随处可见,如身份证识别、停车场的车牌识别等,极大地方便了人们的生活。不同应用场景......
古籍文档图像版面分割是古籍数字化流程中至关重要的一步,藏文古籍文档版面分割是后续藏文版面分析等工作的基础。针对藏文古籍文......
在当今时代,网络和多媒体技术迅猛发展,在促进了信息交换的同时,也带来了对信息的巨大需求。光学字符识别OCR作为计算机信息录入的......
随着信息时代的来临,人们处理信息更加智能化和高效化。传统的文档信息主要记录在纸质文档上,OCR技术实现了纸质文档信息的数字化,......
文档图像处理的研究目的就是要利用计算机从文档图像中获取需要的信息.首先对文档图像处理和文档分析作一个简单概述,接着对版面分......
文档图像理解(Document Image Understanding)是把纸介质上的信息转变成计算机能够理解和编辑的信息,以方便保存和使用.在OCR技术......
通过OCR(Optical Character Recognition)系统自动识别图像上的文字对于信息检索、智能交通和票据、证件处理等方面有重要意义.通......
票据类文档是较为常见的一类文档,其中,银行票据又是应用范围最为广泛的的一种.目前,大量的银行票据仍然由人工进行处理,包括用户......
文档图像理解就是把纸质介质上的信息转变为计算机能够理解和编辑的信息,以方便保存和使用。在OCR技术已经相当完善的今天,图像分析......
随着全球信息技术的飞速发展,文档数量急剧增加,人们的查询需求日益多样化,传统的文档检索系统已经不能满足用户需求,因此文档检索......
中文版面(特别是中文报纸版面)中文本域与非文本域经常交错嵌入。非文本域对文本域的提取会造成干扰。针对这种特点,本文提出了一种......
随着信息时代的来临,数字信息已经成为人类最重要的资源。而表单是最常见的一种信息载体,如何将表单文档中的信息电子化、数字化,......
信函自动分拣是机器视觉技术的应用,是邮政自动化的一个重要环节,它直接决定了邮政是否能够实现自动化,是否能满足日益增加的信件处理......
随着信息科技、网络技术和通信技术的迅速发展,电子文档是如今信息传播和分享的主要载体。信息的不断膨胀对电子文档的存储产生巨......
文档图像的版面分析是文档信息处理系统的重要组成部分,以及复杂文档OCR必不可少的环节,它是实现纸质文档数字化的重要环节。版面......
随着电子信息化进程的加快和互联网的快速发展,图像资源正海量的增长。越来越多的文档以图像的形式进行存储。文档图像中除了纯文......
银行为了扩大信用卡业务,每天会产生大量的关于申请信用卡的纸质银行表单。为了实现银行的信息化,需要将纸质银行表单上的信息录入......
随着智能终端和计算机技术的不断发展,文档图片作为纸质文档的一种替代品逐渐开始被很多政府部门、公司、学校等机构所使用,而如何......
目前,OCR技术对简单版面的分析已经解决并得到了一定的普及,然而随着信息时代的到来,文本图像的版面已经不再是简单的文字和图形的......
我国历史悠久,珍贵的古籍藏书丰富,随着计算机技术的高速发展,利用计算机辅助古籍研究是必由之路。古籍图像版面结构复杂,对其进行......
大家在学校图书馆常能看到有价值的文章,可阅览室的杂志不好借,资料馆的借书数量也有限。别再疯狂摘抄到手发酸,带上数码相机,咔嚓一下......
设计海蓝目录自动识别系统。该系统在获取已预处理过的目录图像之后 ,对图像进行版面分析 ,利用OCR技术识别文字 ,并自适应地获取......
本文介绍了一个实用性较强的专用OCR系统——邮政信封识别系统。版面分析与字符切分是OCR系统的两个重要组成部分,前者是将文档图象......
信息抽取研究旨在为人们提供更有力的信息获取工具,以应对信息爆炸带来的严重挑战。Web信息抽取便是其中一项重要研究课题,研究范围......
随着科学技术的发展,出版物的有声化已经成为一个趋势。字符分割和语音分割是出版物有声化过程中的两个主要问题,在目前的产品设计......
本文对中外多份财经类日报,如《亚洲华尔街日报》、《亚洲金融时报》、香港《经济日报》、《信报》及台湾《经济日报》、《工商时报......
1939-1941年的桂林《救亡日报》是中国抗日战争时期一份相当特殊的报纸,它名义上是国共双方共同创办的具有抗日民族统一战线性质的......
随着中国经济发展势头的上升,中国汽车市场的购买力不断扩大,国家政策性扶持,消费水平的提高,这些因素都促使了中国汽车消费的兴起,因此......
工程图的计算机识别和理解技术是计算机应用于工程方面的研究热点之一,图形的版面分析是图形理解的基础。文章给出了基于图形和基......
民主选举过程中选票的统计是一项严肃而繁琐的工作,传统的手工操作方法不仅效率低,而且在统计过程中很容易出错,影响了选举工作的......
提出了一种单色表格的快速分析方法.其主要内容是:利用Radon变换检测表格的歪斜角度将其校正,用投影法找出表格线的位置,根据表格......
基于图像处理和版面分割等技术,提出一种可快速检索中文期刊论文得到题目、作者、摘要等结构化数据的方法。该方法可以对中文期刊......
光学字符识别是计算机视觉领域的重要研究内容之一,在实际生产环境中具有巨大价值。传统光学字符识别包括文本图片的预处理阶段、......
针对传真图像,为了提高版面分割与分类准确率,提高处理速度,以连通区域为处理元素,通过合理设定阈值,将水平和垂直相邻连通区域进......
在实际的商务活动中,名片已经作为一个重要的身份信息载体,使用频繁。然而随着名片数量的增多,管理越来越麻烦。在实际应用中,研究......
针对基于OCR和版面分析的应用中,需将页眉页脚与主体部分分离并加以单独处理的需求,在分析主流书籍、杂志的页眉页脚特征基础上,提......
介绍了一种基于版面结构距离的文档图像检索算法,使用版面特征作为文档图像的特征检索图像。先将文档图像进行梯度和最大梯度差(MG......
随着光学字符识别能力的提高 ,处理日渐复杂的版面成为文件处理系统中的关键部分。针对中文版面的特点 ,在基于组件的版面分析方法......
版面分析是一个将文本页面图像分割成不同区域,并标定区域类型(如文字、图片、表格等)的过程,与字符识别具有同等重要的地位.提出......
版面分析过程可以理解为同模式类对象间聚类(合并)的过程,而这种聚类存在的风险(hazard)是伴随整个聚类过程中的。而且越是在后期,......
连通区搜索算法是在自底向上版面分析方法中获得初始版面分析信息,故其算法质量如何将决定是否能够在各种版面情况下提取全部连通区......
论文提出了基于数学形态学的版面分析方法。该方法是以自底向上为主,同时结合了数学形态学的思想。论文提出的方法,利用数学形态学......
文章提出了一种对于横竖混排中文版面倾斜的校正方法。通过对数字图像进行遍历,得到版面上的所有连通体。然后切分横竖混排区域,并......