基于编辑操作的自学习的识别后自理系统

来源 :航天工业总公司第二研究院 航天科工集团第二研究院 | 被引量 : 0次 | 上传用户:lihaidong2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文针对某些有一定规律的表格数据,设计了一个对西方语言和汉字(包括日文)都适用的识别后处理系统.充分地利用了字符识别算法的特点,针对识别结果中所产生的错误情况,设计出了基于编辑操作的自学习的识别后处理算法.它建立了一个自学习的数据库,为算法提供了一个自学习能力.算法的核心思想是在编辑距离的基本理论基础上,将插入和删除操作的成本设为常数,而将替换操作的成本,依据自学习库的学习结果动态地矫正,以使它更加适应各个字符识别算法的特点,从而提高识别率.除了设计出详尽的算法之外,该文还针对于该算法描述了整个系统的结构框架.为了充分利用所识别的文件信息,系统提供了一个信息库.它给字符识别系统传递关于源文件的信息,系统提供了一个信息库.它给字符识别系统传递关于源文件的信息,使得字识别系统更多地获取源文件的信息,增加识别的可信度.
其他文献
本文研究扩散方程单元中心型有限体积格式及守恒型并行差分格式并给出相关的理论分析.首先构造和分析了扭曲网格上的有限体积格式.在利用积分插值方法构造有限体积格式的过程
该文介绍了一个求解多维守恒律方程(组)的二阶显式有限元格式,并且特别讨论了格式在求解一维和二维气体力学方程组式的应用.同其它格式相比较,它具有计算简便,分辩 率高等优
近年来,非线性科学越来越受到重视,特征值问题作为数值代数的一个主要研究方向,仅仅研究普通(广义)特征值问题已经远远不能满足实际的需求.对很多物理问题的切合实际的刻画也
随着社会的发展和科学技术的进步,许多领域提出了大量的排队论问题.特别是近年来计算机和通讯网络的飞速发展,使得早基的经典排队模型在应用中远不足以反映客观实际,越来越多
1991年, Wei在文献([49])中第一次提出了二元域GF(2)上线性码的广义Hamming重量和重量分级的概念,基于其在密码学中的重要作用,这个课题得到了较为广泛的关注,1994年,当环Z上
地理信息系统有着广泛的应用潜力,它是与地理信息相关行业进行管理和决策的强有力的辅助工具.该文对地理信息系统做了一个综合的描述,并且对其中一些常用的算法做了一些探讨.
Littlewood-Paley理论是调和分析中非常重要的内容,该文研究了Heisenberg群H上的Littlewood-Paley理论.该文考虑了H上的径向函数对应的g-函数,并证明了当该径向函数满足适当
本文主要讨论一类非线性方程F(λ,u)=λu-G(u)=θ的分歧问题,这里F:R×X→X为非线性可微映射,X为Banach空间.  Krasnoselski的经典分歧定理[1]在G∈ C1(X,X)为具有变分结构的
该文将用谱方法(频率域方法)来讨论Timoshenko梁的边界反馈的镇定问题.在具有耦合的线性边界控制下,研究人员证明闭环系统是指数稳定的.该文共分为四节,中心内容是第三、四节
该文首先综述了多年来关于中心映射、交换映射及微商等加法映射的研究成果,然后讨论了两个微商共同中心作用在半素环R的左理想、Lie理想以及带有对合的半素环R的对称元素集合