基于双向长短时记忆递归神经网络的联机手写数字公式字符识别

被引量 : 0次 | 上传用户:yzlang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手写是人类的基本社交能力,随着移动终端近年来的逐步普及,手写识别在现实生活中的意义也越来越明显。手写体文字识别的研究已进行了很长的一段时间,虽然技术十分成熟,但只局限在识别一维空间的序列上,其识别技术不适合处理二维空间上分布的数据,尤其是手写数学公式的识别。因为数学公式不仅包括复杂多样的符号信息,还包括符号间不同空间的结构关系。故本文针对联机手写数学公式的符号,使用隐性分割的模型对数学公式符号进行处理及识别,即对样本不进行字符级别的精确分割步骤,有很强的优越性。本文的主要工作及贡献有:1.基于双向长短时记忆递归神经网络模型(Bidirectional Long Short Term Memory)设计联机手写数学公式符号识别的系统,该系统不需要将输入数据进行符号级别的分割。并使用时域连接模型(Connectionist Temporal Classification,CTC)标签输出的无分割公式序列。2.对联机手写数学公式的输入数据的进行预处理及提取特征,预处理包括重采样与归一化。针对无分割的数学公式符号识别进行根据笔划的公式大小归一化。3.提出联机手写数学公式符号识别的整体识别方法,在训练过程中将多部件构成的复杂符号根据ASCII码表转化成单字符标签,减少了识别标签的不确定性,并由此将其他复杂符号也转化成单字符标签,统一标签类型。4.改进现有的基于编辑距离的标签错误率及归一化标签错误率计算方法,使评价标准更符合客观事实。本文设计的联机手写数学公式符号识别系统对于公式的符号识别有着良好的识别效果,不需要对公式进行切分处理,减少了一般公式识别方法中的工作量。实验验证多部件复杂符号整体识别的方法有效,比单独识别的准确率高很多。
其他文献
依据时序列分析界定的随机收敛和β收敛,本文研究了1952~2003年间我国东中西部地区和27个省份的相对实际人均产出增长动态。分析发现:一方面,中国东部地区随机收敛于其补偿差
文章以特殊教育学校教师为被试,考察了特殊教育学校教师教学效能感与工作满意度的关系。研究结果表明,特殊教育教师工作满意度的总体水平处于中等偏上,教学效能感整体水平较高。
音乐是以培养学生综合技能为宗旨的一门学科,也是高师院校学前教育专业课程中的一门重要学科.音乐教育有助于学生提升审美素养、塑造完美的人格.本文借鉴奥尔夫音乐教育理念,
以第四届投资者关系年会百强公司为基础样本,基于财务视角,将投资者关系管理对股票流动性、盈利能力、公司价值等相关财务指标的影响进行实证分析。研究发现,有效的投资者关系管
景德镇市纸箱厂系江西省外贸出口包装箱(盒)产品定点生产厂,1992年8月又与港商共同创办中外合作“江西德东彩印包装有限公司”.该厂创建于1969年,现有职工560余人,其中专业技
本文通过两个案例,对了审查实践中专利法第2条第2款所适用的审查尺度进行了思考,并给出几点倾向建议。
大道无形,同样的经文,不同的和尚会念出不同的效果。企业文化传播也是如此。在国家电网公司企业文化"五统一"的步调中,如何念好企业文化的"经",也需要有不同的念法。
<正>水中痕量汞的测定目前多采用冷原子吸收法。而借助原子吸收分光光度计的标尺扩展功能较一般测汞仪具有更好的灵敏度。本文利用废旧F732测汞仪的薄膜泵和石英管吸收池作为
随着信用消费概念逐渐走进人们的日常生活,个人信用风险评级需求也越来越迫切,我国商业银行个人信用风险评级仍然处于起步阶段。出于商业银行保密机制、客户隐私信息保护等原
近年来,广东省在政府购买研发设计服务、知识产权服务、检验检测服务、科技成果转化服务、科技咨询服务等科技服务方面先试先行,不断推进政府购买科技服务的实践。科技服务业