基于自适应重组策略的中文文档版面分析

来源 :图象识别与自动化 | 被引量 : 0次 | 上传用户:wlp00
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在文档版面分析中,采用一些数值化参数定义文本行和文本区域(如字符与字符的间隔和行与行的间隔),但只有在形成文本行和文本区域后才能确定这些参数的值。这类似先有鸡还是先有鸡蛋的问题,可以通过自适应重组策略解决。这个策略大致分为三步:第一步,根据最初的参数值将一些基本图像成分分组,组成预备的文本行和文本区域;第二步,根据已分好的小组推敲对参数值的评估;第三步,根据重新确定的参数值拆分或合并已存在的分组,形成新的分组。本文运用上述策略分析时,同时存在水平文本行和垂直文本行的中文文档。使用这种方法可以成功地获得结果
其他文献
4月29日,由陆良县总工会、团县委、县妇联主办的纪念建党90周年系列活动暨“红色记忆活力陆良”广场歌咏活动在囊文化公园举行。县委副书记解天云,县人大主任赵鸿翔,县政协主席
随着当前信息技术与计算机技术的不断发展与促进,我国市场经济在不断的发展过程中。企业是当前市场经济的重要组成部分,是当前经济发展的主体。由于我国当前的国情影响,使得当前
本文论述和分析了一种新颖的特征提取技术的特性,它采用基于分割的手写体字符识别系统的上下文关系来分割/书写字符。改进型的方向特征(MDF)提取技术以方向特征(DF)为基础,从字符轮
目的:探讨儿童正畸治疗的护理方法。方法:2011年至2013年我院共对200例患儿进行了口腔正畸治疗,将其进行随机分组,对照组和实验组各100例,对照组采用常规护理,实验组给予系统化护理
近来,许多基于书写的方式使人们自然书写的数字笔迹输入成为可能。通常,书写时的污点或修改不仅使文本受污,而且看上去也不舒服,还影响到手写体的识别。本文首先论述笔迹修正的问
期刊
本文以3+1的倒换系统为例来说明N+1倒换系统的构成和原理。基带倒换系统是数字微波设备中极其重要的组成部分。
本文对电源保护系统进行了详细分析,防雷保护是转播台的一项重要任务。
钢结构具体指利用钢制材料制成的结构,是目前我国建筑材料中不可或缺的重要结构之一。由于钢结构其建筑强度较高、施工较为简便的特点,被广泛应用于各类大型建筑的施工使用。
工人一年收入十几万元,享受与高管一样的年薪待遇。2009年以来,马钢全面试行“首席技师年薪制”,通过切实可行的激励制度,保障一线劳动工人能够体面劳动,