论文部分内容阅读
文档作为信息的载体,在社会生活中被大量使用。为了能方便有效地使用和管理文档信息,人们从上世纪六十年代就开始研究文档处理技术。通过扫描仪或文档处理系统可以将文档输入计算机,转化为文档图像,使人们能够方便有效地对文档进行存储、管理、传输。随着文档图像的数量增加,对文档图像分析和识别的研究逐渐受到人们的重视。文档图像分析与识别主要研究的是如何利用计算机视觉、模式识别等方法将纸质文档或者互联网上图像的内容转化为计算机可以处理的信息。文档图像分析与识别的研究在国际上受到了广泛的关注,其相关技术的研究不断进步,但仍存在较多尚未解决的问题。文档包括文本文档和图形文档两类,本文的研究对象是以工程图纸为代表的图形文档,重点研究了在分析工程图的过程中遇到的图形(如直线,圆弧和曲线等)识别和图形符号识别等问题,实现了对工程图中图形对象的有效分析和识别。工程图中包括直线、圆弧、曲线、图形符号等元素,因此首先需要利用直线、圆弧等识别算法识别出图像中元素的类型。已有的识别算法在图像内容较复杂的情况下识别效果较差。本文提出了一种圆弧识别方法,并将其推广到椭圆图形和抛物线图形的识别。通过实验验证了算法的有效性。在理解图像时,仅获得图形的类型还不够,还需要计算出图形的参数信息。因为大量圆形图形出现在工程图中,所以本文重点研究了圆形图形的识别与解析。为了能够准确地解析含有圆形图形的图像,准确计算出圆形图形的参数(圆心坐标和圆半径)是处理这类问题的关键。传统的方法在寻找计算圆参数的种子点时不太精确。本文提出了基于拟合的圆参数计算方法,该方法首先根据奇偶线宽的不同找到合适的种子点,然后利用改进后的拟合方法和种子点计算出圆形参数。本文提出的方法还可以推广到计算椭圆图形和抛物线图形的参数。利用测试数据进行实验,结果表明该计算方法得到的参数较准确。图像中的各种元素相交或者相切很常见,圆弧(圆或者部分圆)与其他图形相交或相切较多。准确地获得圆弧的参数信息对理解图像内容至关重要,在相交或者相切的情况下准确计算圆的圆心坐标和半径存在一定的难度,这是由于找到合适的种子点来计算参数很困难,在计算部分圆的参数信息(圆心坐标,半径,起始角度,终止角度)时,除了圆心坐标和半径具有一定的难度外,准确计算部分圆与其他图形的切点具有更大难度。现有方法不能够很好地处理图形相交或相切等情况。针对上述问题,本文提出了基于几何性质的Sym CAve圆弧分割算法(Sym CAve是Symmetry axis,Circle Fitting和Average Distribution Points的缩写)。在采用基于拟合的方法计算圆参数时,首先利用两个半径不同的同心辅助圆在待处理圆弧上计算初始种子点,然后采用本文提出的三个策略从初始种子点中去除与其他图形相交或者相切时产生的噪点。环境信息(对称轴)被用来进一步校正参数信息。本文采用圆参数计算出辅助点并将其均匀分布在圆周上的方法来判断待处理圆弧是圆还是部分圆。若是部分圆,需要在部分圆的两端再次均匀分布较密集的辅助点从而计算出准确的起始角度与终止角度。该圆弧分割方法经过扩展后可以分割椭圆图形和抛物线图形。实验采用国际模式识别协会圆弧分割竞赛提供的标准测评数据,算法性能分析也使用该竞赛指定的标准评价工具,分析结果表明Sym CAve圆弧分割算法比其他已有算法具有更好的分割性能。椭圆分割方法和抛物线分割方法也用相关图像数据进行了测试,取得了较好的实验结果。针对工程图中图形符号种类多样,不同符号形状和尺寸差异较大,且存在旋转、噪声的问题,基于结构的方法在矢量化过程中容易受到噪点等影响,基于统计的方法不能适应图形的旋转等不变性。本文提出了基于关键点的统计整合约束直方图的特征提取方法和基于多特征多图半监督工程图符号识别方法。该符号识别方法采用了三种特征,分别是本文提出的基于关键点的统计整合约束直方图特征,Zernike矩和Tchebichef矩。基于关键点的统计整合约束直方图的特征具有结构方法和统计方法的优点。Zernike矩和Tchebichef矩具有较强的描述能力和较好的鲁棒性。实验采用图形符号识别竞赛所用的数据和美国马里兰大学的公开logo数据库。首先采用16种矩提取图形符号的特征从而评估这些矩的描述能力,实验结果表明在16种矩中Tchebichef矩和Zernike矩描述这类符号的效果最好。然后实验分析矩的阶数对识别率的影响,当矩的阶数达到临界值时,其识别率不会继续提高。最后分析了基于多特征多图半监督工程图符号识别方法的性能,其识别率比仅用基于矩的方法的识别率高10个百分点。采用多种特征时其计算效率有所下降,本文提出了两种矩的快速计算方法,该方法的效率比原始计算方法的时间效率高,方法一约提高了5.72倍的速度。