手写体文字公式混合识别算法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:liyuan04981
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机技术近几年取得的成就和对相关领域带来的影响有目共睹。其中教育是不能避开的话题,随着对优质教育均衡发展的重视,教育应用软件的作用也日益突出,手写体数学文本识别便是其中的核心部分之一。但是由于数学公式中存在分式、指数和根式等二维结构给混合文本的检测和识别带来了挑战,导致该领域在很长一段时间内进展缓慢。为此,本文以真实场景下的数学混合文本为研究基础,致力于解决混合文本的检测和识别任务。论文主要工作如下:针对手写体数学文档的复杂版面布局,本文设计了基于特征瀑布的多尺度融合模块。深层神经网络提取到的低分辨率特征图具有帮助模型提高目标检测能力的高语义信息,而浅层神经网络提取到的特征图通常含有的是较多的几何信息。多尺度特征瀑布是通过将不同尺度上的图像进行相互融合,使得特征图都具有较为丰富的语义信息,以此提升模型对混合文本行的精准定位能力。针对手写体文字公式混合数据的识别,本文设计了阶段空间注意力模块。混合文本与普通的中文文档和场景文字不一样,混合文本中存在二维空间结构。该模块在训练的时候能有效地注意到文本行中二维结构的上下区域,提升神经网络对二维特征的表达能力。针对混合数据集缺乏的问题,本文通过收集整理真实场景下的学生手写文本,分别构建了用于数学手写体文字公式混合检测和识别的数据集,以此检验模型在真实环境下的测试效果。最后,基于上述工作将改进后的方法与其余模型做了实验对比分析,本文设计的模型在手写体文字公式混合检测数据集中,综合指标F1分数达到91.1%;在手写体文字公式混合识别数据集中,准确率达到83.33%。实验结果表明本文改进后的方法能够为自动判卷中的混合文本识别提供进一步的技术支持。
其他文献
译前准备是口译活动的重要环节,帮助口译员在口译过程中更好地理解原文,缓解认知压力,调整过程中的口译技巧和策略,进而对口译质量产生影响。在口译中,大家普遍认为有译前准备的情况下口译员表现更好,不少口译研究已证明译前准备能提高口译员的理解能力和预测能力,减少压力,并提高口译质量。国内对于译前准备的影响涉及口译结果和口译过程,但对于同传中听说时间差的实证研究较少,且关于译前准备对听说时间差的影响多涉及印
学位
近年来,量子计算不断取得突破,使基于数学计算复杂性的非对称密码体制面临严峻挑战。量子比特由于具有不可克隆和不确定性的物理特性,在作为信息载体时,能够有效检测窃听。量子密码将量子特性和现代密码学相结合,通过量子力学方法实现密码学应用,具有理论上无条件安全性,是抵御量子计算攻击的关键技术。量子安全直接通信(Quantum Secure Direct Communication,QSDC)是量子密码的重
学位
同声传译作为高度复杂的语际转换活动,译员需要在接收源语输入的同时完成目标语输出的任务,因而自我修正现象时有发生。尽管学界目前已进行丰富的自我修正实证性研究,但却鲜有针对同传学习者的相关跟踪性研究。因此,本跟踪性研究旨在聚焦英汉同传初学者在四个月的同传训练期间的自我修正现象,基于前人自我修正框架探索性地提出一种适用于英汉同传的自我修正分类框架,从而探究学习者在修正总量,修正类别,各类修正频次以及修正
学位
深度学习近年来在图片分类、图像生成、文本情绪分析等领域获得巨大成功。在深度学习中,深度卷积网络因为利用了权重共享和稀疏连接特性在机器视觉中有着广泛应用。尽管深度卷积网络有强大的拟合能力,但是网络的训练非常困难。在以前的文献中,利用残差连接改善了深度卷积网络训练困难的问题。受到残余连接与神经微分方程的启发,本文提出使用学习到的中间特征的拉格朗日多项式插值的形式,通过多次利用低级特征降低网络的估计误差
学位
电话口译指译员借助电话或手机提供的一种远程口译服务。电话口译的时间、空间限制较小,对口译员的能力要求相对较低,具有便利性高、成本较低等优势。同时非言语信息的缺失、口译话题的不确定性,这些因素也给电话口译员的工作带来了挑战。戈夫曼的参与框架理论认为,会话参与者通常会拥有一到多种不同的身份,从而形成参与框架。参与者角色可分为发声者、作者和责任者,发声者不改变原话内容和形式,也不为说话内容负责;作者通常
学位
报纸
作为影响力最深远、引入我国最早的口译理论,释义理论以及该理论的核心主张-脱离源语语言外壳假说无疑在指导口译教学与实践方面发挥了极大的作用,但即便如此,该理论仍存在诸多问题等待探讨。本研究从实际口译学习过程中遇到的问题出发,即汉英同传和英汉同传相比,学生普遍认为汉英同传难度更大,而且受母语形式的影响更大,英语词汇、句型积累的匮乏也导致他们在翻译时倾向于直译,很难做到摆脱源语形式,而这又和释义理论所主
学位
自我评价和同伴评价在语言学习中有利于学生反思,提升学生自主学习能力,但其准确性和可靠性仍存在争议。目前,口译研究已开始关注自评互评这一话题,但相较于写作和口语评估研究,口译的自评互评研究略显不足。且已有研究较少关注语言和口译能力与评估能力的关系。对此,本研究招募了十二位被试,探究口译和语言能力对学生评价能力的影响,拟为口译课程设计和自评互评在口译课堂的实践提供建议。研究为期一学期的历时研究(共三次
学位
无线自组织网络具有无中心、自组织的特点,最早应用于军事领域,后来扩展到灾区救援,临时通信等场景。作为无线自组织网络协议栈的关键组成部分,介质访问控制(Medium Access Control,MAC)层接入协议一直受到国内外学者的广泛研究。其中,带有冲突避免的载波监听多址访问接入(Carrier Sense Multiple Access with Collision Avoidance,CSM
学位
大数据时代各种各样的信息喷涌而出。为了适应大数据时代,提高人们检索资料的效率,自动文本摘要技术成为研究的热点。自动文本摘要技术旨在用短小、简洁、凝练的句子表达源文本内容,是减少资源查找时间的有效手段。深度学习的发展使得对自动摘要技术的研究从抽取式摘要过渡到生成式摘要。生成式摘要模型的主流范式是编码器-解码器结构。编码器融合源文本信息,解码器利用编码器的输出生成摘要。这种方式更加符合人工生成摘要的方
学位