数学公式识别的关键技术研究及其在自动判卷中的应用

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:simetl1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智慧教育的不断发展,自动判卷已经成为未来的一种趋势,而作为智慧教育的入口,OCR识别也越来越受到研究者们的重视。其中作为OCR识别系统中的手写体数学公式识别一直因为其复杂多样的二维结构,导致其研究进展缓慢。本文以数学公式的二维结构为着手点研究数学公式的识别,并进一步研究表达式一致性判别的相关问题,最终构建了一个初中数学填空题自动判卷系统。其主要研究内容如下:对于数学公式识别,本文采用编码器-解码器的框架构建了一个端到端的识别模型。为了不限制输入图像的大小,且在不同大小下可以更好地提取字符特征,本文提出了多尺度自动选择稠密网络作为编码器。针对数学公式中的复杂结构的问题,本文提出了可以关注到结构中相对空间位置关系的基于结构增强的注意力机制,而针对结构的嵌套使数学公式复杂的问题,本文提出了使用栈结构对含有结构信息的全局信息进行管理。最后本文建立了一个真实手写体数学公式数据集,用来增强模型在实际应用中的效果。本文提出的数学公式模型在CROHME2014的测试集上公式准确率达到了47.50%,在自建的真实数学公式数据集上的公式准确率达到了69.71%。针对数学填空题判卷中存在的书写形式的多样性问题,本文通过答案类型分类,将各种答案类型转换成判等问题和一致性判别问题。与此同时本文提出了基于符号计算的等价判别器和基于表达式树的表达式一致性判别器。基于上述数学公式识别模型和表达式一致性判别系统,本文构建了一个初中数学填空题自动判卷系统,系统最后在550道填空题的测试数据上进行了详细的实验,其中数学公式识别的准确率为89.09%,整体系统的判对率为90%。实验结果表明本文所使用的数学公式识别模型可以准确的识别出答案,而表达式一致性判别器不仅可以解决填空自动判卷的问题,也是将来初中数学步骤级判卷的核心模块。
其他文献
熔石英(非晶SiO2)硬度高,热膨胀系数低,耐高温,化学稳定性好,透紫外光和红外光。在惯性约束聚变(ICF)领域的大型高功率激光装置中,熔石英被大量用作光栅、透镜和窗口等光学元件。高功率激光装置的运行通量往往直接取决于光学元件的最大激光承受能力。然而,在高通量激光作用下,熔石英的表面缺陷易导致熔石英光学元件的激光诱导损伤,从而严重影响了光学元件的负载能力及光学系统的高通量稳定运行。随着光学元件的加
作为IT行业的重要发展趋势之一,云计算技术充分利用信息资源并提供优质服务。云计算服务在给用户带来便利的同时,也为用户隐私带来了潜在的风险。在云计算领域中,计算和数据分享被认为是最重要的两个服务。因此在云计算安全领域中,计算安全和数据分享安全被认为是最热点的两个方向。在量子计算机时代,基于格的全同态加密和属性基加密技术分别在计算安全和数据分享安全问题上发挥着重要作用。在云计算服务场景中,有时需同时考
目前,遥感影像在军事、农业、林业等领域得到了广泛应用。薄云在遥感影像中产生的模糊感,降低了遥感影像的质量,给地物分类、目标检测带来了严峻挑战。传统的去薄云算法并不能有效满足实际生产工作的需要。本论文以Landsat-8卫星陆地成像仪(Operational Land Imager,OLI)为实验对象,以云雾去除领域常用的大气散射模型为理论基础,构建物理驱动的去薄雾卷积神经网络;并根据遥感影像中薄云
随着互联网和信息技术的迅速发展,人们已经步入大数据时代,如何自动有效地对这些大数据进行分析处理是一件非常有价值且亟待解决的事情。图像标注技术就是一个具有挑战性的跨领域数据处理问题,它旨在自动地用准确且流利的自然语言来描述出图像的具体内容:它不仅需要识别输入图像中的显著物体,而且还需要使用人类语言来表达准确的信息。图像标注技术弥合了计算机视觉和自然语言处理这两个领域之间的鸿沟,可用于许多实际应用中,
语言评价是自然语言处理领域中备受关注的一个问题,机器翻译、文本摘要、文本复述、图像标注等领域的研究者都依赖于语言评价模型展开研究工作。语言评价模型能通过参考文本等资料,利用计算机自动化、低成本、快速地对文本生成模型的质量进行评估。研究者可以利用语言评价模型开展模型评价、模型选择工作,或是利用语言评价模型进行消融实验,对文本生成模型的细节进行深入分析。然而,目前常用的语言评价模型都存在着一定的问题,
将人工智能应用于教育领域,实现计算机对数学问题的智能解答,做出一款数学推理系统,一直是自动推理方向的热点问题。一些机构和学者们也尝试设计出一些基于知识库、推理引擎或者模式匹配的专家系统来实现数学题目智能求解;近些年来,机器学习技术也被应用到了数学推理系统的研究中。随着人工智能技术的快速发展,自动推理领域也不断在推陈出新。与此同时,知识图谱技术和深度学习技术发展迅速,其在知识推理上有着重大的优势,已
二次约束二次规划问题及其锥重组问题具有相同的最优值,且其锥重组问题是一个非负二次函数锥规划问题,所以如何有效的求解非负二次函数锥规划问题值得人们进行深入的研究。自然而然的,我们需要探讨非负二次函数锥的可计算性。本文列举了在一个椭球区域上的非负二次函数锥(cone of nonnegativequadratic functions),在一个椭球及一个线性不等式区域上的非负二次函数锥和在一个二阶锥区域
随着计算机相关技术的迅速发展,医疗领域开始广泛运用计算机相关技术来提高医疗服务水平,包括医疗信息管理、临床疾病辅助诊断等。此外,医疗信息化的快速发展,使得医疗信息系统中积累了大量的医疗数据。深度学习算法能从大量的数据中学习出数据的抽象特征,这些特征可以用作对目标进行分类和识别,其有效性已在很多实际应用中得到验证,其中不乏在医学方面的应用。如何将深度学习方法应用于医疗数据,建立分析模型,是当前医疗数
减员与增效,本来就是一对难以调和的矛盾,更何况是在业务繁忙、事无巨细的一线供电所。化解供电所被动减员与提质增效的矛盾,不仅仅考验着制度设计者的构建力,更考验着一线管理者的智慧力。供电所结构性缺员与老龄化问题积弊已久,特别是在农电员工“退休潮”汹涌而来的近两年,如何在现有条件下,重整供电所人财物资源,采取积极有效的管理措施化解被动减员与增效的矛盾,是绝大多数基层供电企业管理者面临的一道难题,也
期刊
本文是对图像复原中的去雾算法这个领域做了一系列的研究探索。简单来说,本文首先介绍了结合神经元注意机制(Neuron Attention,NA)的更迭去雾网络所使用到的一些关键算法与模块。其次介绍了关于双向长短期记忆网络(Bi-LSTM)的基本构架。最后介绍了关于神经元注意力机制的基本结构,以及其所采用的深度和点卷积的运算过程。NA模块是在通道注意力机制的基础之上发展而来的,可以通过模拟神经元之间的