基于端到端可训练神经网络的手写化学方程式识别

来源 :华中师范大学 | 被引量 : 0次 | 上传用户：nola0724

【摘要】

：

随着互联网与人工智能的快速发展,教育信息化已经开始影响并改变传统教育方式,在线解答等人机交互的场景越来越普遍,手写识别问题成为了计算机视觉领域的一个研究方向。对于

【作者】

：

孔曼玉

【出处】

：

华中师范大学

【发表日期】

：

2004年期

【关键词】

：

手写化学方式识别卷积神经网络循环神经网络 CTC 词典

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着互联网与人工智能的快速发展,教育信息化已经开始影响并改变传统教育方式,在线解答等人机交互的场景越来越普遍,手写识别问题成为了计算机视觉领域的一个研究方向。对于人类来说识别手写字符是一件很简单的事,但这对于计算机而言非常复杂。近年来,深度卷积神经网络的发展给计算机视觉领域带来了革命性的变化,卷积神经网络和循环神经网络的结合在基于图像的序列识别问题中取得了巨大的成功,推动了手写识别领域的进展。目前针对手写识别方面的研究主要集中在英文字符、数字和汉字上,并已在这些领域取得好成绩,然而这些识别只局限于一维空间上,由于复杂的二维空间结构和长度原因,手写化学公式的识别仍然是一项艰巨的任务。解决该问题,一方面可以促进手写化学方程式识别的发展,另一方面可以应用于在线解答,例如作为教学辅助手段快速批改作业,实现化学方程式快速录入计算机等等。本文针对离线手写化学方程式识别主要做了以下工作:(1)基于电子笔录入的数据样本采集,由于目前没有公开的手写化学方程式数据集,因此我们手动收集了一个新的数据集,包括6586个手写化学方程式样本。(2)提出了基于端到端神经网络的离线手写化学方程式识别的训练方法,采用CNN+RNN+CTC模型,这是基于图像的序列标记任务中的最新方法之一。CNN+RNN有助于更好地图像表示,而CTC作为一种无需对齐的损失函数,省去了对数据对应位置进行标注的繁琐工作。实验证明这种模型在识别离线手写化学方程式任务中同样表现优秀,且能较好地学习到化学方程式中包含的空间信息。(3)在CNN+RNN+CTC模型的基础上进行优化,选用前缀束搜索作为CTC解码方式,并在解码过程中分别引入两种词典,它们分别包括447个和1990个不同前缀,通过代码在内存中初始化,识别过程占用内存小,速度快。词典的引入在一定程度上弥补了 CTC条件独立性带来的弊端,实验证明这种方法是有效的,模型识别的准确率得到进一步提升。(4)本文基于上述两种方法开展实验,选取其中七个具有代表性的实验详细介绍,最终在相同的网络配置与实验条件下对两种方法进行比较,未引入词典的模型达到了 85.43%的公式级准确率和92.30%的字符级准确率;引入词典的模型达到了 87.67%的公式级准确率和94.53%的字符级准确率。

其他文献

一般性社会信任与公共政策的实施效率

随着文化经济学的不断发展,一般性社会信任对公共政策的影响逐渐受到关注。在中国,老龄化程度不断加深,农村养老问题更为突出,新型农村社会养老保险是社会养老环节中关键的公

学位

一般性社会信任新农保公共政策

压电微定位平台率相关Hammerstein模型及神经网络滑模控制方法研究

随着航空航天工业、微电子技术、精密光学技术、精密机械加工技术等一系列高精尖学科的高速发展,以压电执行器为核心驱动元件,以柔性铰链为传动机构的精密微定位平台因具有工

学位

压电陶瓷微定位平台率相关迟滞非线性Hammerstein模型RBF神经网络滑模控制

微囊藻增殖和产毒过程中氮形态及NO3-/NH4+比的影响研究

城市景观水体受人类活动影响大,易发生富营养化,导致景观功能难以维持。藻类大量增殖是富营养化的重要表现,其中铜绿微囊藻（Microcystis aeruginosa）是典型的富营养化优势藻种,

学位

NO3--NNH4+-NNO3-/NH4+比藻密度MC-LR

用于折射率传感的一维光子晶体微环谐振器研究

光学传感技术是融合了多门重要学科的综合性技术,在疾病诊断、航空航天、生化防恐、环境监测等领域都发挥着重要作用。随着各类应用的发展,微型化、低成本、高灵敏度的光学传

学位

一维光子晶体微环谐振器品质因子色散特性传感灵敏度

40Cr钢窄深槽磨削区的热分配比分析

槽宽小于2mm,槽深大于5mm的窄深槽结构在实际生产中应用广泛,但实现其高精度加工一直是机械加工的难题。磨削温度通常会影响工件表面质量,当磨削温度较高时会造成工件表层各种形式的热损伤。电镀CBN砂轮缓进给深切磨削可以有效的降低磨削过程温度,并提高窄深槽加工效率和精度。本文通过理论推导、试验分析和有限元仿真等手段,对40Cr钢工件的窄深槽磨削区热分配情况进行了深入研究,主要研究内容如下:(1)对窄深

学位

窄深槽磨削电镀CBN砂轮接触弧长度磨削温度场热量分配

子集选择之帕累托优化方法的拓展研究

子集选择问题旨在从全集中挑选一个子集,使预先给定的评价指标达到最优。其在机器学习等领域有广泛应用,例如模型选择、特征选择、样本选择等任务都可归结为子集选择问题。子

学位

机器学习子集选择优化

钒酸钇基发光材料的制备及温度传感特性研究

目前稀土掺杂发光材料作为温度传感器被大量研究,能够实现准确的温度测量、提高测温灵敏度一直是众多科研工作者为之努力的方向。本文以钒酸钇（YVO4）作为基质,选择与Y3+离子半

学位

稀土离子钒酸钇热耦合能级Stark能级荧光强度比光学温度传感

新沂市基础教育城镇化特征及其动力机制研究

改革开放以来,伴随着城镇化的快速推进和人民生活水平的日渐提高,社会公众对基础教育、医疗卫生等基本公共服务设施给予了越来越多的关注。目前,基础教育城镇化已成为推动我

学位

基础教育教育城镇化新沂市

基于逆卷积神经网络的托克马克线积分信号反演成像的研究

托克马克中有一类诊断系统的实现依赖于沿着探测器视线方向线积分信号值的测量,这些线积分信号受制于托克马克窗口和诊断系统自身大小限制而数量稀疏,从这些稀疏的一维积分信

学位

等离子体断层重建反演问题逆卷积神经网络噪声鲁棒性图像生成

基于DNA自组装和链置换信号放大策略的蛋白质荧光传感研究

随着科学技术的飞速发展,人们的生活水平日渐提高,越来越重视自己的身体健康。在实际的生物学分析中,特别是在疾病的早期诊断、药物监测等方面,一些分子生物标志物发挥着重要

学位

信号放大策略荧光生物传感器链置换反应DNA自组装

基于端到端可训练神经网络的手写化学方程式识别

与本文相关的学术论文