基于深度决策森林的手写体识别模型的研究与实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:ppt1000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能领域的深入发展,智慧城市、智慧教育等领域受到了广泛的关注。特别地,在智慧教育领域目前已经有许多关键的人工智能技术得到实际应用,包括计算机视觉、文本识别、语音识别等。文本信息是信息交流的重要载体之一,文本识别检测在智慧教育中起着至关重要的作用。在计算机互联网没有兴起的时代,学习只能通过纸质书籍和师长的口传身教。现如今,互联网已经成为了一个重要的学习渠道,出现了基于互联网的线上学习方式。然而,互联网传播的学习内容需要大量的人力工作,包括内容的录入及阅卷,如何运用文字识别技术提升教育的智能化水平是近几年的重要研究方向。特别地,针对高度结构化的数学公式的识别,是当前的研究热点,受到了广泛的关注。本文通过对摄像机获取数学题解题过程中的手写体文本数据进行处理并对其进行手写体识别。本文对数学题解题过程中的手写体文本识别进行研究,分别从顺序文本数据、复杂结构化数学公式两种文本类型出发,对脱机手写体识别进行研究。论文工作如下:针对顺序的文本数据,利用其有序性,将顺序文本进行拆分,对每个字符采用一种基于深度决策森林的单一字符手写体识别模型逐一识别。通过实验证明,引入了基于深度决策森林的模型在对手写体字符的识别准确率在专用数据集上达到了90.34%,相较普通卷积神经网络算法提升了2.56%。针对复杂的结构化数学公式,由于其存在着非顺序的二维结构,所以采用传统的单一字符识别模型无法准确识别。本文提出了一种基于深度决策森林的数学公式手写体识别模型对这种复杂的结构化数学公式进行整体识别。通过实验证明,引入了基于深度决策森林的模型在对结构化数学公式手写体的识别准确率在最新的公共数据集上达到了46.79%。针对数学题解题过程中包含一维顺序文本与二维结构化数学公式两种文本这一特点出发,结合单一字符识别模型与结构化公式识别模型,设计出针对决数学题解题过程的图像识别服务模块,并面向实际的项目需求,研发一套完整的作业批改系统,并验证系统的有效性。
其他文献
荧光关联谱方法是一项近年来发展很快的实验分析方法,它通过分析微小探测区域(一般小于1μm3)内少量发光粒子由于布朗运动产生的荧光涨落信号,得到粒子扩散系数和溶液浓度等物理参数值,进而获得粒子的结构和状态、所处的微观环境以及微观相互作用等信息。由于测量具有很高的灵敏度、测量时不破坏研究体系的平衡状态以及可以进行实时监测等优点,荧光关联谱技术在化学、医学和生命科学等领域逐渐显现出它广阔的应用前景。本论
太赫兹频段是介于可见光和微波之间的无线波段,具有通信和光学检测两方面的应用潜力,其高达数十GHz的可用带宽能应用于高速通信上。人们日益增长的物质文化需求对无线通信传输速率提出了更高的要求。在此背景下,太赫兹通信已经成为无线通信行业的研究热点。本文设计了一种零中频收发机物理层系统,论文主要涉及以下工作:第一,分析对比了典型的太赫兹变频调制方案。经过对比分析,零中频收发机凭借小体积、低成本等特点,被采
Endostatin (血管内皮抑素) 是一个20 kDa 的蛋白质,能有效阻止肿瘤血管生成,动物模型试验也表明endostatin能有效地抑制小鼠多种移植肿瘤生长,且无任何毒性。但是目前对于endostatin的分子机理,特别是其最基本的理化性质研究还很少。本论文主要针对以下三个方面进行研究。论文的第一部分工作是采用圆二色谱,荧光和核磁共振等物理手段来研究endostatin的酸变性过程。主要成
本文将主要针对如下三类实际的具有代表意义的离散事件动态系统, 从评价和寻优两个环节出发, 分析探讨问题的相关难点, 并给出切实有效的优化算法. 第一, 针对一类制造系统的资源优化问题, 该问题被模型化为具有fork-join结构的排队网络. 通过分析其均值型评价环节的难点, 我们推广了序优化方法, 即从单目标意义到多目标意义, 并由此进一步给出两阶段的DEDS多目标优化算法框架. 然后分析寻优环节
对于推荐系统来说,数据稀疏和用户冷启动问题是重要的挑战之一。面对数据稀疏问题,常见的解决方案是使用跨领域推荐方法,从目标领域之外的其他辅助领域收集数据提升目标领域数据的密度,但假如某些用户在目标领域有着丰富的交互数据,而在辅助领域数据匮乏,这种传统的跨领域推荐方法便不能提升辅助领域数据的密度。针对这个问题,在基于领域间重叠用户场景下,本论文提出了基于多任务学习技术之“十字绣”网络的多领域推荐方法,
本文从复杂性哲学的视角,就国内外对路径依赖概念和思想的有关研究文献进行大量调研的基础上,把路径依赖概念置于复杂性科学运动发展的大背景中进行考察,比较系统地论述了路径依赖概念产生的理论背景和社会经济背景;从科学哲学的角度,对路径依赖和其他复杂性术语:耗散结构、混沌、分岔、突变、模拟退火、复杂适应系统、适切性景观、自组织临界性、自组织进行了初步的辨析。在第三章,对路径依赖进行了案例分析。 在案例分析之
时间序列数据广泛存在于现实生活中,特别是在智能化城市,智能化工业以及大数据信息时代的大趋势下,大量的时间序列数据可以被轻松获取到,而如何将这些时序数据在现实场景中(如城市交通的监管与预测,工业中的数据分析与智能调度)加以有效利用一直是人们关注的重点。本文从城市交通流量和工业水电流量两种不同的时序数据出发,研究如何利用深度学习的方法对这两种时序数据进行有效分析与预测。现有的时间序列预测方法主要还是基
随着多核处理器的广泛应用以及并行编程技术的发展,面向多核处理器的并行实时任务调度与分析逐渐成为实时系统领域的重要研究方向。本文针对并行实时任务分组固定优先级调度(Partitioned Fixed-Priority,P-FP)的可调度性分析问题,基于有向无环图(Directed Acyclic Graph,DAG)任务模型对并行实时任务的抢占式(Preemptive)调度算法、实时锁协议,以及可调
随着电信网络的飞速发展和网络规模的扩大,人们对电信网络的稳定运行提出了非常高的要求。面对这种情况,电信网络运维人员必须要精准找到产生故障的根本原因并快速解决故障。虽然网络中的故障是以告警的形式呈现,但是由于网络中的设备与组件存在关联,一个设备产生故障会导致相关联的组件或设备也产生故障,从而引发告警风暴,增加了找到故障根源的难度。面对海量的告警数据,准确地分析定位告警根源是解决故障的关键所在,对于提
随着我国经济飞速发展,机动车数量也在急剧增加,这对汽车安全驾驶提出了更高要求。于是车载雷达应运而生,成为了很多公司与研究所争先恐后的热点项目,并且展现出了巨大的市场需求。而低噪声放大器(LNA)作为车载雷达接收链路的关键模块,对整个接收机系统的性能的影响至关重要。因此应用于车载雷达的工作频段的LNA的设计有着十分光明的前景。另一方面,第五代移动通信技术(5G)作为一项新兴技术,正在逐步加大基站建设