文档图像中图形分析与识别关键技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:jumty
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文档作为信息的载体,在社会生活中被大量使用。为了能方便有效地使用和管理文档信息,人们从上世纪六十年代就开始研究文档处理技术。通过扫描仪或文档处理系统可以将文档输入计算机,转化为文档图像,使人们能够方便有效地对文档进行存储、管理、传输。随着文档图像的数量增加,对文档图像分析和识别的研究逐渐受到人们的重视。文档图像分析与识别主要研究的是如何利用计算机视觉、模式识别等方法将纸质文档或者互联网上图像的内容转化为计算机可以处理的信息。文档图像分析与识别的研究在国际上受到了广泛的关注,其相关技术的研究不断进步,但仍存在较多尚未解决的问题。文档包括文本文档和图形文档两类,本文的研究对象是以工程图纸为代表的图形文档,重点研究了在分析工程图的过程中遇到的图形(如直线,圆弧和曲线等)识别和图形符号识别等问题,实现了对工程图中图形对象的有效分析和识别。工程图中包括直线、圆弧、曲线、图形符号等元素,因此首先需要利用直线、圆弧等识别算法识别出图像中元素的类型。已有的识别算法在图像内容较复杂的情况下识别效果较差。本文提出了一种圆弧识别方法,并将其推广到椭圆图形和抛物线图形的识别。通过实验验证了算法的有效性。在理解图像时,仅获得图形的类型还不够,还需要计算出图形的参数信息。因为大量圆形图形出现在工程图中,所以本文重点研究了圆形图形的识别与解析。为了能够准确地解析含有圆形图形的图像,准确计算出圆形图形的参数(圆心坐标和圆半径)是处理这类问题的关键。传统的方法在寻找计算圆参数的种子点时不太精确。本文提出了基于拟合的圆参数计算方法,该方法首先根据奇偶线宽的不同找到合适的种子点,然后利用改进后的拟合方法和种子点计算出圆形参数。本文提出的方法还可以推广到计算椭圆图形和抛物线图形的参数。利用测试数据进行实验,结果表明该计算方法得到的参数较准确。图像中的各种元素相交或者相切很常见,圆弧(圆或者部分圆)与其他图形相交或相切较多。准确地获得圆弧的参数信息对理解图像内容至关重要,在相交或者相切的情况下准确计算圆的圆心坐标和半径存在一定的难度,这是由于找到合适的种子点来计算参数很困难,在计算部分圆的参数信息(圆心坐标,半径,起始角度,终止角度)时,除了圆心坐标和半径具有一定的难度外,准确计算部分圆与其他图形的切点具有更大难度。现有方法不能够很好地处理图形相交或相切等情况。针对上述问题,本文提出了基于几何性质的Sym CAve圆弧分割算法(Sym CAve是Symmetry axis,Circle Fitting和Average Distribution Points的缩写)。在采用基于拟合的方法计算圆参数时,首先利用两个半径不同的同心辅助圆在待处理圆弧上计算初始种子点,然后采用本文提出的三个策略从初始种子点中去除与其他图形相交或者相切时产生的噪点。环境信息(对称轴)被用来进一步校正参数信息。本文采用圆参数计算出辅助点并将其均匀分布在圆周上的方法来判断待处理圆弧是圆还是部分圆。若是部分圆,需要在部分圆的两端再次均匀分布较密集的辅助点从而计算出准确的起始角度与终止角度。该圆弧分割方法经过扩展后可以分割椭圆图形和抛物线图形。实验采用国际模式识别协会圆弧分割竞赛提供的标准测评数据,算法性能分析也使用该竞赛指定的标准评价工具,分析结果表明Sym CAve圆弧分割算法比其他已有算法具有更好的分割性能。椭圆分割方法和抛物线分割方法也用相关图像数据进行了测试,取得了较好的实验结果。针对工程图中图形符号种类多样,不同符号形状和尺寸差异较大,且存在旋转、噪声的问题,基于结构的方法在矢量化过程中容易受到噪点等影响,基于统计的方法不能适应图形的旋转等不变性。本文提出了基于关键点的统计整合约束直方图的特征提取方法和基于多特征多图半监督工程图符号识别方法。该符号识别方法采用了三种特征,分别是本文提出的基于关键点的统计整合约束直方图特征,Zernike矩和Tchebichef矩。基于关键点的统计整合约束直方图的特征具有结构方法和统计方法的优点。Zernike矩和Tchebichef矩具有较强的描述能力和较好的鲁棒性。实验采用图形符号识别竞赛所用的数据和美国马里兰大学的公开logo数据库。首先采用16种矩提取图形符号的特征从而评估这些矩的描述能力,实验结果表明在16种矩中Tchebichef矩和Zernike矩描述这类符号的效果最好。然后实验分析矩的阶数对识别率的影响,当矩的阶数达到临界值时,其识别率不会继续提高。最后分析了基于多特征多图半监督工程图符号识别方法的性能,其识别率比仅用基于矩的方法的识别率高10个百分点。采用多种特征时其计算效率有所下降,本文提出了两种矩的快速计算方法,该方法的效率比原始计算方法的时间效率高,方法一约提高了5.72倍的速度。
其他文献
对京尼平苷的分离提取、分析和应用前景几个方面进行了综述。栀子是一种传统中药材 ,其中含有京尼平苷等多种有效成分。京尼平苷是栀子果实中起利胆保肝作用的主要活性成分 ,
<正>"白日将近,潮湿的黄昏使他心里乱糟糟的;他瞧着墓穴,埋葬了他青年人的最后一滴眼泪,神圣的感情在一颗纯洁的心中逼出来的眼泪,从它坠落的地下立刻回到天上的眼泪。"[1]28
本文主要分析了当前铁路通信技术应用的现状,同时预测了我国铁路通信技在未来的发展方向,希望可以对我国和铁路交通部门有一定的帮助。
<正>农业产业链已成为现代农业发展的新趋势,并成为当前金融支持现代农业的重点和"三农"金融创新的重要领域随着我国农业现代化步伐的加快,以龙头企业为核心的农业产业链发展
回顾我国小城镇的发展,多强调产业是城镇发展的动力,高度追求产业尤其是二产的发展,“以产兴城、以园促城”成为东部沿海地区小城镇发展的典型模式。这种过度追求第二产业发
目的观察中西药结合保留灌肠治疗慢性溃疡性结肠炎的疗效。方法采用对照试验观察中西药结合组(治疗组)和单纯西药保留灌肠组(对照组)的临床疗效。10天为1个疗程,共2个疗程。
在不同的制度形态下,不仅国家与地方的关系迥然不同,士大夫精英也呈现出不同的形态:在宗法封建制之下,它们是封建大夫士;在贵族制下,他们是世家大族;而在王权官僚制下,他们是官僚士大
报纸
中国传统村落的总数已经达到1561个,其谱系之建立应该成为一个首先要考虑的问题。只有建立起谱系,这些传统村落才不会是一盘散沙,而是编织起来的一张结构清晰的知识之网。也
<正>小说《红高粱》完成于1986年,是莫言的早期作品。1987年国内著名导演张艺谋将其改编成同名电影并获得了柏林电影节金熊奖。从此《红高粱》蜚声海内外,得到了广泛的认可,
二十世纪九十年代以来,我国工业化的推荐速度明显加快,同时第三产业的发展也很迅速,我国经济实力得到了极大的提升。其中生产性服务业对于第一、二、三产业的促进作用非同一