论文部分内容阅读
金融票据的自动识别是模式识别的重要应用领域。几乎涉及了模式识别与图像处理的所有重要分支,是一个综合的研究课题,具有理论和实用两方面的价值。本文在收集和分析大量近年来国内外文档图像处理方面的研究报告、学术论文的基础上,对文档图像版面理解所涉及的若干问题进行了深入探讨;着重对文档图像的倾斜校正、版面分析和版面识别进行了研究,并且完成了原型系统的实现,经测试,可以满足要求。主要工作包括:1.对文档图像的预处理进行了研究。文档图像输入时会产生一定的歪斜,文档版面理解和OCR识别算法对文档的倾斜非常敏感,文档图像的倾斜校正十分重要。针对种类繁多、版面复杂的文档,本文对基于整数Bresenham算法求方向投影的倾斜检测方法进行了研究,并与改进的Hough变换方法进行了比较,发现其具有很强的抗干扰性和应用适应性,可以自动进行倾斜调整并且具有较高的可变的精度。2.对表格文档图像的版面结构进行了分析。论文研究了完整的表格结构表示方法,提出了基于表格线段交点为特征的文档类型识别算法。该算法由两个步骤组成:首先是文档图像中表格线段的提取。目前,在图像中提取线段的算法有很多,这些算法各有优缺点。在分析这些算法优缺点的基础上,根据文档图像中线条的特点采用了一个基于线段支持区域的线段检测算法。第二步,在表格线段检测的基础上,根据不同文档有不同几何和拓扑结构这一原理,提出了一种以参数化表格交点为特征点的文档类型匹配算法。3.对表格文档图像的逻辑结构进行了分析,论文提出了一种基于数据域与标题域联系的树形结构表格全局逻辑结构的表示方法,此方法可以很好地将表格的逻辑结构与数据库中表中的数据结构对应起来。并对一种关于表格文件逻辑结构提取的方法进行了研究。此方法主要分为整表的全局划分、局部的逻辑结构分析、整表的再次全局划分和将分析出的各个局部表区用树形结构表示,最后将整个表格用树形结构表示等几个步骤。该方法强调对文件全局和局部布局结构的综合分析,与以往的仅仅从局部上对表格逻辑结构进行确定的方法相比,它具有较高的识别正确率,并可以识别结构更为复杂的表格文件。