航空气象地图的分层化OCR系统及其若干关键技术的研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:mjsega
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
OCR(Optical Character Recognition光学字符识别)系统技术是一种专门针对电子文本信息化处理的系统。随着电子文本的日新月异的发展,目前国内外针对常规性对象(26个大小写字母和10个数字)的主流OCR系统已经显现出无法满足现实需求的情况,尤其遇到像航空气象地图这样的复杂背景下的大信息量(其不仅包含线条,而且包含着字符和特殊气象符号)电子文本而言可以说是束手无策。本文依托企业项目“航空气象地图分层化OCR技术的研究”,在分析国内外的相关理论及关键技术的基础上,以架构航空气象地图的分层化OCR系统结构为目标,而且对其中的前景区域和背景区域的图像分割算法、图文分离算法、线条的重组识别算法、字符特征的提取和识别等一系列相关的关键技术和迫切需要解决的效果问题展开了深入而细致的相应研究和讨论,其主要的研究内容及成果如下:(1).提出了一种有效的图像前景区域和背景区域的分割模型(二维直方图熵值斜分算法),此外又根据K-L距离理论,提出了一种可避免繁琐计算,更能全面直观反映指标的仿K-L距离评判函数。该种分割方法建立在局部区域信息统计和全局区域信息统计的整体之上,可以有效的避免了在复杂背景下常规彩色分割方法失效的情况发生,而且又克服了常规的灰度分割法中的双刃剑问题:如果仅仅采用局部分割法容易造成全局信息上的分割错误和如果仅仅采用全局分割法容易造成局部信息上缺损和不完善。(2).根据形态学的相关理论推导出了一个有效的图文分离算法,而且给出了形态学方法中的关键部分:结构元素的主要参数。对比目前常用的图文分离算法,该方法具有实现简单,速度快、分离之后的结果完整性好等优点。(3).提出了一种专门针对线条提取重组、识别的快速算法,可以填补目前暂无有效的线条重组、识别算法的空白。该算法主要依据线条与线条之间的数学关系表达式理论和粒子群快速算法(PSO)理论下完成,它在具有了粒子群算法的较快速度的优点之外,还具有较高的重组准确度,从而可以为间断的实线进行修复。此外,根据线条类型之间的差异(虚线符合规律分布、间断直线不符合规律分布),提出了利用能量函数来区分其之间的可靠识别方法。(4).提出了另外一种改进型复数矩的数学表达式,并在该式的基础上进行了矩不变量的推导和矩不变量阶数范围的证明。该表达式主要根据目前最为先进的中心矩方法、复数矩方法上整合得到,不仅具有中心矩的位置不变性优点,也具有了复数矩的多坐标系转化能力。此外,也根据相关的定理和实验证明出了对于不变量特征的选取不能仅仅局限在独立与非独立范围上,应该转化为在全局上选取最优。(5).提出了一种基于多层结构的Winner-Update标准互相关矩不变量的特征匹配方法。该方法主要依据Jensen’s和Cauchy-Schwarz不等式理论,在Winner-Update方法和深度优先搜索的DGA图的辅助下,能够有效的解决标准互相关函数的计算量繁琐问题以及上小节提到的特征不变量的优良选取问题。此外,该方法运用了多学科的知识交叉,利用了数据库技术中的Hash表来有效的提高最终结果的搜索和信息存储优化等问题。(6).依据以上提出的单个字符识别算法和仿生学滴水分割算法的相关理论,提出了针对粘连字符的分割识别算法。其中重点针对仿生学滴水算法中存在的问题,利用相关的交叉学科理论(经典的牛顿物理运动学理论)进行了相应改进和完善,从而使仿生学滴水算法的效果得到了大幅度的提高,可以在花费较短的时间内保证目前所归纳的三种粘连字符(线性粘连、非线性粘连和粘连重合)的分割准确性和识别率。应用了以上理论及关键技术,成功设计和完成了针对航空气象地图的分层化OCR系统处理平台。对比目前常规的系统测试表明:该系统具有很强的信息分析和处理能力,不仅对于系统中的图文分离算法和图像分割算法之后的结果能够保证了信息的完整性和准确性,而且最终也能够较好的完成字符、线条的重组识别(数据识别率高达98%以上),完全达到实际工作的要求,很好地达到了本文研究的目的。
其他文献
随着通信技术的飞速发展,多媒体通信的出现对其传输速率,处理能力及编码技术提出了更高的要求。图像通信作为多媒体通信的重要组成部分而越来越受到关注。在这方面,国际上的一些
以表格形式详细列出系统及通信子系统、座席子系统和中继子系统的故障现象,以及可能产生的原因及处理方法。并对系统可再开发性做了说明。
本文讨论了传统交换网络在B-ISDN中的适用性问题,并对ATM技术产生与发展进行了分析。
此文简要介绍了WIN32下串口编程的一般技术,重点以RS-485总线串口为例,详细介绍了多串口编程的关键技术,并给出了可自动扩展串口的详细设计方案。
期刊
本文介绍了智能网的概念与结构,重点分析了No.7信令系统在智能网中的应用。
随着全球经济发展速度的放缓,特别是我国经济结构性转型的持续推进,企业之间的市场竞争日趋激烈,利润空间不断被压缩,因此降本增效成为企业提升利润空间的重要渠道,财务成本
文章概略地介绍了计算机病毒的起源和发展史,对计算机病毒的分类与特征进行了归纳,并针对网络时代病毒的新特点,提出了网络时代计算机病毒的防治策略,以及企业网中病毒防杀的应对
随着移动通信和3G业务的蓬勃发展,我国的3G时代也即将到来。3G系统可以在更大的覆盖区域内提供语音和数据业务,用户对高数据速率的需求可以通过部署分层结构来实现,如宏蜂窝、微
正交频分复用(OFDM)技术的一个主要缺点是有很高的峰均功率比(PAPR),目前已有许多用来降低OFDM信号峰均功率比的方法,部分传输序列(PTS)就是其中之一,此外,它还可以改善OFDM信号