表单图像版面分析方法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:cerfa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息时代的来临,数字信息已经成为人类最重要的资源。而表单是最常见的一种信息载体,如何将表单文档中的信息电子化、数字化,已经成为研究的热点之一。表单图像版面分析作为表单图像文档电子化的重要部分,其准确性直接影响文字的识别率。本文对表单图像的版面分析方法进行了深入的探讨。首先,论文简述了表单图像版面分析的发展历程和国内外现状。并从表单图像的特点出发,介绍了几种图像去噪方法和二值化方法,并通过梯度调整改进了最佳熵阈值分割二值化算法,实验证明这种改进的算法使目标边缘细节信息不易丢失,减少了出现线段断裂以及丢失的情况。其次,针对扫描图像可能产生倾斜,论文采用了一种基于有向单连通链的表单倾斜检测与校正算法对倾斜图像进行校正。再次,论文介绍了几种表单框线的检测算法,并对数学形态学提取表单框线的算法进行了改进,改进后的算法不必获得表单中最宽字符的宽度,速度快,提取出来的表单线效果较好。最后,论文提出了基于特征点提取表单单元的版面分析方法以及基于拓扑关系和几何关系提取矩阵的版面分析方法,并进行了实现。
其他文献
心血管疾病发病率有逐渐加重趋势,急需相关成像手段的提高。相对于血管造影术成像技术,血管内超声可以获得动脉粥样斑块的组织信息,便于医生对血管病变做出全面和准确的评价,
网络的利用是工业现代化的标志,而机器的自动化控制则是现代工业文明的产物。在汽车、医疗、航空航天等领域中,计算机与机械控制有着完美的结合。本文结合目前非常流行的语音识
有效预测DNA二级结构是生物信息学中的重要研究领域。基于DNA分子二级结构的结构稳定性和热力学稳定性,本文提出了一种预测DNA二级结构的算法。该算法改进了Nussinov算法,能
移动机器人是机器人研究领域的重要方面,如何在未知的非结构化环境里,寻找到一条从起始点到目标点的安全无碰撞的有效路径,属于移动机器人路径规划方面的一个重要问题。通过对以
进入90年代以来,工作流技术作为计算机支持的协同工作领域的一个新的应用技术,已被广泛应用于提高企业的信息化程度、工作效率等方面。然而,随着Internet上电子商务的飞速发展,传
机床制造业是我国传统的制造行业,面对日益激烈的市场竞争,机床制造业必须提高自身的响应能力、创新能力和员工素质,才‘能使自己立于不败之地。为了解决敏捷制造中应用交互问题
计算机硬件的发展正根据摩尔定律前进,宽带网络的应用条件日益成熟,计算机互联网上各类服务不断完善。流媒体技术作为计算机应用在宽带网络上的一项新兴技术,正得到越来越多的关
随着科学技术进入一个多学科相互交叉、相互渗透、相互影响的时代,源于模拟某一自然现象或过程并且具有自组织、自学习、自适应等特征的神经网络、细胞自动机和进化计算等研
21世纪,计算机迈入了充满机遇的阶段一后PC时代,嵌入式系统已广泛地应用于信息家电、移动通信、手持信息设备以及工业控制等领域。由于嵌入式软件的特殊性,使得它的开发比传统应
互联网业务的种类和数量近几年来迅速增长,与此同时人们对网络服务质量的要求也越来越高,如何在现有设施的基础上使网络性能达到最优是网络管理者和网络服务提供者都非常关心