特殊印刷体粘连字符切分方法研究

来源 :南开大学 | 被引量 : 0次 | 上传用户:hlg1205
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人们对DLA领域的不断探索,印刷体粘连字符切分技术已经逐渐成熟、完善。但是,现有技术绝大部分局限在对Roman字符集的处理,而对其它字符集没有做过多的讨论,这就使得现有技术不能够很好的满足人们对文档自动处理提出的越来越高的要求。同时,现有技术绝大部分针对字符左右粘连这种情况,而对其它粘连情况一般不做详细的分析和处理。其次,在现有技术中由于其处理情况相对单一(横向粘连),从而使得现有系统并没有对粘连情况区分这一问题进行深入的研究、设计。最后,针对文档图像中存在的粘连字符这一问题,人们研究的焦点往往集中在如何将这些粘连在一起的字符分离成单独字符,并没有考虑如何抑止大量粘连字符在同一文档中的出现。 针对上述问题,通过对现有切分算法及系统的分析,提出了针对数学公式和Devanagari粘连字符的完整的处理系统模型,从而,首次提出了完整的针对非横向Roman粘连字符的切分的解决方案。在原有切分系统基本模型的基础上,加入了粘连情况判别这一模块,从而完整,清晰对各种粘连情况加以区分。同时,本文引入了傅立叶分析的方法使得对于过窄的横向两两粘连字符与较宽的单个字符区分这一问题得到了较好的解决。对投影,外围轮廓,骨架等特征的提取及其各自特点进行了详细分析探讨,从而将这些特征较好的应用于各种粘连情况。最后,本文首次分析了预处理对于粘连字符切分模块的影响,从而进一步在切分之前加入了文本区域局部二值化模块,使得系统对于严重粘连样张的处理性能有了进一步的提高。
其他文献
  随着宽带网络技术与数字技术的快速发展,人们对于数字媒体产权保护的技术需求越来越强烈。作为一种全新的知识产权保护和数字媒体防篡改手段,数字水印技术应运而生。  本
随着信息化社会的到来,数据库被广泛应用并取得了巨大的成功,同时也对数据库系统提出了更高的要求。在实时性要求较高的领域,数据随着时间及时变化才能有效反映应用当时的状况,传
通过建立图像采集与识别试验平台,应用机器视觉获取显示值的方法来快速组成新的测试系统,并且应用Linux系统来实现机器视觉,具有实际应用的意义。 本文设计了图像采集与识别试验平台,针对待识别的对象类型广泛、所需采用的图像处理算法各异的问题,可以用它来比较鉴别并从中选择最优的图像处理算法;可以组合各个图像处理步骤,改变了以往图像处理软件中只能单步进行处理的缺点,具有单步、连续、实时三个处理调试方
随着人们生活水平的不断提高,健康越来越受到重视,因此各种体育运动也如火如荼的开展起来,其中的羽毛球运动更是有着广泛的群众基础。因此,羽毛球的需求量非常大,同时对羽毛球的质
本文以某厂硝酸生产装置为优化对象进行了离线稳态参数优化工作的研究。在研究过程中,作者首先深入该厂了解生产工艺,进行了大量数据采集和分析,并结合了该厂的实际生产经验,
随着微机械电子系统、组合导航技术、车联网和智能交通的发展,现代车载导航系统不仅要求导航具有高精度和高可靠性的定位功能,同时还必须具备高性价比、小型化和易集成等特点。
国外某公司研制的链条滴油润滑系统,结构巧妙、工作可靠,能够在确保润滑效果的前提下极大地节约润滑油,目前已在国外摩托车润滑中获得广泛应用。为了进一步扩大该系统的使用
随着社会与科技的发展,社会竞争的日益加剧,世界各国都在不断加大对武器研究的力度,其中微型飞行器是最受世界各国重视的侦察武器之一,它是在上个世纪90 年代发展起来的一种
降秩估计的基本含义是在估计过程中用降秩矩阵来近似被估计的信道矩阵。降秩估计和滤波在信号处理与通信系统中有广泛的应用,尤其是在处理数据和模型冗余、抗噪声和模型误差的
本文对Viola方法做了一些扩展和改进,并设计了一个快速人脸检测系统。首先,我们对Viola方法中所使用的矩形特征进行了扩展,采用了Rainer Lienhart等人提出的扩展的矩形特征。