中文手写文本行识别

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:xxzjlei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中文手写文本识别方法主要分为基于显式切分的方法和基于隐式切分的方法。虽然目前基于显式切分的方法占据主要地位,但是其中的语言模型和形状模型等各个模块有待改进。另一方面,基于隐式切分的递归神经网络识别框架可以克服显式切分识别系统过于依赖切分的缺陷,在拉丁语系文本识别中已经占据主导地位,但是在中文识别领域尚未显现优势。本文对两种不同的识别框架分别展开了深入的研究,贡献主要有以下几点:  将神经网络语言模型首次引入到基于过切分的中文手写字符串识别系统中。神经网络语言模型可以将词(字)从离散空间投影到一个连续空间中,并在该空间中对语言模型进行隐式的平滑以及序列概率的预测,从而可以建模高阶文法。实验中对神经网络语言模型在过切分识别系统中的作用进行了全面的评价,主要比较了前馈神经网络语言模型、递归神经网络语言模型和混合语言模型。结果表明,神经网络语言模型可以提升系统识别性能,混合递归神经网络语言模型可以得到最好的结果。  提出一种包含单字分类器、过切分以及几何模型在内的卷积神经网络形状模型用于过切分识别系统。其中,搭建了一个融入领域知识的15层卷积神经网络作为字符分类器;提出了一种基于学习的两步过切分方法,将传统的基于前景点可见性分析的方法与滑动窗卷积神经网络分类器相结合,使得召回率有了进一步的提升;并且将几何上下文模型从传统的分类器转换为基于卷积神经网络的模型。在中文手写文本行识别实验中,基于本模型的识别系统在标准数据集上得到了最高识别性能。  在基于递归神经网络的识别框架中,提出了一种可分离二维递归神经网络模块。与传统二维模块相比,该模块可以有效地提取多方向的信息,同时可以消耗更少的计算资源。基于这种二维模块,设计了更深的网络结构,并且改良了解码算法。实验结果表明,本方法的精度比之前的同类型方法有了显著的提升。
其他文献
该文以德国Amira公司的球杆实验系统装置(Laboratory Setup Ball and Beam)BW500为研究对象,这是一个典型的单输入多输出控制系统.由牛顿力学得出的该球杆系统的运动方程为一
随着科技进步,尤其是机械工业的发展,各种类型的大型工业设备广泛应用于人们的生产生活中,成为生产劳动中不可或缺的一分子。一般地,大型机械设备多为露天作业,工作环境非常
在计算机视觉研究中,图像的对应点匹配是一个基本问题,同时也是一个核心问题。图像对应点匹配算法主要分为三类,分别是稀疏匹配、稠密匹配和准稠密匹配。目前,对准稠密匹配方
该文在系统地总结和分析CSCD中协调的定义、目标及研究现状的基础上,对CSCD的协作管理中有关协调的几个关键技术和问题进行了研究:1.针对现有协同设计系统知识集中的特点,在
人体识别和跟踪在智能监控系统、高级人机交互、动画制作等方面有着广泛的应用,也是近年来计算机视觉研究领域中备受关注的前沿技术。对图像序列中的运动人体快速而准确的识
该文的主要贡献如下:1.提出了一中基于子结构分解的快速模拟植物生长的方法.利用该方法,我们计算了不同生理年龄的不同生长阶段的植物结构中的不同器官数量,并构造了相应的三
本文主要研究了某型弹道导弹自动驾驶仪的设计和仿真方法。为了解决导弹的姿态控制问题而采用了一种组合的、经典的、最优的方法来设计控制规则。经典的控制理论证明该方法对
机器人轨迹纠偏控制是指机器人在执行轨迹跟踪任务时,实时调节其末端位姿,减小轨迹跟踪误差的过程。机器人纠偏控制是实现机器人焊缝跟踪关键技术,在机器人焊接领域具有广泛的应
该文以单轴电动仿真转台为研究背景,对转台伺服控制系统进行了分析和设计.该研究工作采用了一种新的伺服控制系统优化设计方法. 首先,该文确定了系统采用转速和位置双闭环的
基于机器视觉瞄准自动控制系统的技术实现主要包括:信号获取、图像的预处理、特征选择和特征提取、瞄准定位与CCD实时测距、瞄准决策控制.信号获取阶段主要是将导弹象限字符