印刷体文本公式混合识别中的关键技术研究及应用

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:cctvnba_2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文以中英文文本及数学表达式混合的扫描或拍照图像作为研究对象,提出了一个高效的印刷体文本公式混合识别算法,并设计和实现了一个相应的系统。主要研究内容如下:1.融合目标检测及传统方法的题块结构分析算法。对题块图像做预处理,并融合目标检测技术及传统图像处理方法,将题块图像中的文本行及题目配图准确地定位和切分出来。2.融合表达式向量的文本及数学公式混合图像内容检测算法。针对数学表达式与中英文文本混合识别困难的问题,本文结合分水岭算法、深度学习中的目标检测及场景文字检测方法等,将文本行中含有二维结构的数学表达式准确分离出来,并提出表达式向量概念,使用自然语言模型提取数学表达式的特征并对表达式做评价,进一步准确地分割文本行中的数学表达式与线性文本,从而分别处理不同的类型的图像,提高了识别的准确性。3.文本公式识别模型及对应的数据生成器。本文论述方法分别采用两个识别模型对线性中英文文本图像和含二维结构的数学表达式图像做文本识别。为了训练两个模型,设计并编写了对应的数据生成器,自动生成了大量数据,有效地训练了两个模型,使得模型在真实数据上也能取得较好地识别效果。基于上述的主要研究内容,本文设计和实现了一个印刷体文本公式混合识别系统,可以较好地识别数学题目类型的混合文本图像,同时也支持普通文档的识别,从而大幅提高数学试题录入的效率。本文最后在手工标注的100张图像的测试集上进行了测试,并与现有的商用混合识别引擎进行对比,结果证明我们的系统能达到接近甚至超过商用系统的效果,为下一步自动判卷及问题自动求解提供了高效便捷的数据支撑。
其他文献
随着传感器技术的快速发展,可穿戴设备已被运用到了许多研究领域。利用可穿戴设备监测体征信号能够客观分析个体的身心健康状况。心率作为人体的一项重要生理指标,可以评估心脏活动能力,疲劳程度,通过监测心率变化与语音记录或者呼吸等可以用来评估情绪,但医疗中多采用单导联或多导联设备监测心电图来计算心率,在日常生活中存在不便。光电容积脉搏波描述法(Photoplethysmography,PPG)是一种运用PP
近年来社会经济飞速发展,出行需求日益增长,干线飞机需求量越来越大,但目前我国干线飞机主要依赖进口,在全球新冷战场景下,干线飞机的自主设计、生产需求日益迫切。随着系统工程的不断发展,基于模型的系统工程(Model Based System Engineering,MBSE)在航空领域有了更多的应用,相较于传统开发方法,MBSE以模型代替文档,且符合适航标准,是更适合用于对民机系统进行设计的方法。状态
随着卷积网络的逐渐成熟,卷积神经网络的应用越来越广泛,随之而来的模型安全问题也越来越受到人们的关注。近年来,针对卷积网络的模型攻防研究课题也受到越来越多人的关注。其中最具有代表性的是对抗样本攻防。对抗样本是模型的外部威胁,即外部输入造成模型的功能上发生异常错误。而本文更关注的是对模型的内部的攻防场景。例如,模型窃取攻击,它针对的是模型内部的隐私安全,模型窃取者通过窃取模型的功能达到个人的经济利益或
基于匿名通信机制的网络通过对用户身份信息和通信关系进行隐藏,可以给用户提供一个信息安全的网络环境。但是,匿名网络提供的身份匿名性可以帮助犯罪分子进行违法犯罪活动,同时给网络空间安全管理带来了极大的麻烦。因此,对匿名网络流量和正常流量进行识别分类对网络空间的监管具有积极意义。本文使用不同的深度学习技术对匿名网络流量分类进行了研究,根据对匿名网络流量进行特征学习的思路不同,总共提出了三种分类方法,分别
新时代科技的发展尤其是互联网技术的普及使得教育教学的方式和环境都产生了翻天覆地的变化,其主要表现为知识传播形式的革新和信息量的暴增,网络教学系统层出不穷。截至目前,网络教学系统多采用基础B/S架构。然而由于依托于浏览器,这些系统难以针对用户特点和习惯实现个性化功能,只能以统一、公用的平台进行教育教学;另一方面,B/S架构的网络教学系统对课程运营者服务端有较高的性能要求,其开销也极大地限制了网络教学
随着近年来我国创新驱动发展战略的实施,航空航天作为国家的重点产业也在飞速发展着。复合材料在航空航天行业的生产中起着无可替代的作用,现有的复合材料管理方式以纸质材料和电子表格为主,这种方式不仅无法使材料管理人员实时掌握材料状态和用量,而且极易造成材料的浪费与报废,尤其是对于复合材料中的易变质材料。现代先进航天器与大飞机的生产对这部分易变质材料的管理提出了更高的要求,因此有必要探索新的管理方式。本文对
设计更改是设计单位根据客户、工程需要或者修订发现错误时对原设计文件进行调整,是制造企业科研生产经营活动中一项非常常见和重要的工作。随着企业不断发展壮大,数字化制造等技术的不断应用,产品创新和改善的频次越来越高,同时客户化定制、敏捷制造的流行,传统的纸质管理方式已越来越无法跟上转变的步伐,使公司在管理设计更改时浪费大量的人力物力。不少企业已建立起以PDM、ERP和MES等系统为基础的先进数字化管理体
为了满足航空数控产品高质量的要求,国外洛·马、波音、空客等行业巨头已开发集成的质量管理系统并投入现场使用,这些行业巨头借助于设计系统、制造资源系统、财务系统等,开展了全面的质量信息化管理。而目前在公司内部,作为质量控制的重要环节,质量数据统计、上报仍然依赖传统单机Excel的形式,检验数据离散的分布在生产制造流程的各个环节,部分记录仍以纸质载体为主,且最终统计结果数据存储于统计人员的本机上,无法与
中国电信某省分公司CRM系统为千万数量级用户提供了电信通信商品销售、售后、自助受理等信息化服务。随着移动互联网、手机及宽带业务发展,CRM系统应用的功能越来越丰富,业务的逻辑规则也越来越复杂。为了更加有效地解决业务高峰期服务响应缓慢、数据库连接数量激增等问题,CRM系统开始向着基于分布式服务的互联网架构进行转型。随着CRM 3.0的“云+平台+应用”的架构改造工作开展,系统原有的数据交互方式也不再
近年来,计算机视觉领域受到越来越广泛的关注。图像作为人类沟通的重要媒介之一,在现实世界中具有许多重要的应用场景,如图像识别、图像生成、图像翻译等等。其中,图像翻译为该领域的研究热点。类似于语言翻译,图像翻译是指将图像从一个域的特征转换为另一个域的特征。随着近几年深度学习技术的发展,图像翻译领域的研究除了起初的图像风格迁移、黑白照转换、图像超分辨率提高、人脸动漫化以外,还包括图像实例级转换。虽然现有