在线手写体数学公式的分割与识别算法研究

来源 :电子科技大学 | 被引量 : 2次 | 上传用户:fuyuanluyi13
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
模式识别研究的进程间接地推动了线上智能教育系统的发展。在针对数学学习的线上智能判卷这一应用中,由于答案有效的判分点往往在数学公式上,如何准确有效地识别出学生的手写答案是本文所要解决的重点问题。结合线上系统可以以题目为单位传输答案笔序流文件作为识别源文件的特性,项目先后研究了大量的机器学习算法用于完成识别系统的设计。研究中发现,对单字切分质量直接影响到了后续单字识别的准确性,而且用于单字识别的CNNs需要识别的文字类别越少识别效果越精确。所以提升单字切分的准确性以及尽可能地分离出手写体答案中的数学符号成为了降低对字段文字整体识别错误率的改进方案。系统需求的分割算法应具备如下两个功能:第一:将答题样本中的描述性语言与数学公式进行分离;第二:对被分离出的语段进行单字切分。对应新的需求,本文就两个思路提出了两种不同的切分法案:方案一量化了汉字笔画和数学符号笔画之间的差异,并使用规则对笔画进行分组,通过对笔画组的识别对组合打分并利用维特比算法思想选取最佳组合序列作为分组结果输出。针对汉字特性和数学符号特性的方案又有两种实现,分别是依照数学符号特性对笔画进行排除的实现方式和依照汉字特性对笔画进行候选的实现方式。方案二基于特征学习的分割方法遵照从宏观上对答案的汉字和数学公式进行分区的思想,在无监督的环境下训练用于抽取字段特征的卷积自编码网络,训练完成以后,分别抽取字段中数学公式和汉字的特征对SVM进行训练。该方案首先通过半自动的机器学习方法对字段进行划分,而后再利用普通段分割方法对不同区域进行单字切分。在保证字段分割准确性的基础上,对识别优化工作集中在研究如何实现并改进CNNs结构和训练方式进而提升单字识别正确率之上。实验表明,分别针对常用汉字和数学符号训练对应的识别引擎有利于降低相似符号间的识别错率,进而提升整体的识别效率。且通过规格判定和机器学习的组合算法对字符段进行中英文预切分是可行的,该方法在经过改进和调试可以实现并提升对手写体数学公式文本化的正确率。
其他文献
随着互联网技术的高速发展,在国际贸易领域内的各企业间存在着大量分布、自治、异构的数据源,阻碍了他们的信息交互。目前一些组织与机构试图通过形成一系列基于XML的电子商
当前,信息技术产业已从以计算设备为核心的计算时代进入到以存储设备为核心的存储时代,数据海量化成为了一种趋势。分布式存储以网络技术为基础,利用小型服务器甚至PC机来搭建存
对自然现象的真实模拟,由于能够增添虚拟现实真实感,更好地烘托环境气氛,因此历来是人们在影视特技、广告、游戏中一种视觉要求。气体属于流体研究范畴,为了逼真地模拟真实世
近些年来,随着网络的快速发展,传统网络的结构变得越来越臃肿,其弊端表现的越来越明显。一方面,传统网络设备的控制功能和报文转发功能是紧密集成的,这种方式极大地增加了网
AO幅面平台彩色扫描仪使用多CCD头进行图像采集并通过图像拼接来完成对大幅面原稿的扫描。多头拼接扫描的机械结构,对扫描精度的影响很大,而高精度的多CCD头拼接调校又是一件
在软件运行发生失效后,如何进行有效的故障定位是当今软件故障诊断领域的研究热点。虽然目前软件故障定位技术已有一定经验可以借鉴,但究竟如何做到将多种方法综合,以实现高
分布式数据存储以及处理技术的发展,使得可较为廉价的从海量数据中发掘潜在价值。当前数据挖掘基础技术取得长足进展,基本满足了在多种场景下的需求。但当前系统间集成度低,
在计算机的虚拟场景中,全局光照明很好的为用户提供了物体的各种重要信息。例如,物体大小,表面颜色,阴影部分以及物体相互之间的位置关系等,在很大程度上提高了计算机生成图像的真
随着网络、多媒体技术的快速发展,网络学习正逐渐成为重要的研究和应用领域,与之相适应的网络教育资源建设也日益受到人们的重视。但目前网络教育资源库大多处于孤立分散状态
大规模群体动画一直是虚拟现实技术研究的热点之一。群体动画技术广泛应用于游戏、电影动漫、建筑规划以及火灾等灾难现场模拟与辅助指挥。通过群体行为的真实模拟,可以辅助