基于卷积神经网络和度量学习的脱机手写汉字识别

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:babytoto
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
脱机手写汉字由于其字量大、类别多、字形结构复杂、存在相似字和变形问题等,一直是模式识别领域中的研究热点和难点之一。由于传统识别框架“预处理+特征提取+分类器”近年来没有取得较大进展,同时深度学习方法为计算机视觉领域注入了新的活力,越来越多的人尝试用深度学习方法进行脱机手写汉字的识别工作。目前,一些常用的卷积神经网络被广泛用于脱机手写汉字识别,如AlexNet、GoogLe Net等,并取得了较好的识别结果。但是卷积神经网络只采用了交叉熵作为损失函数,并没有考虑到输入样本之间的类内距和类间距信息。本文提出将卷积神经网络和度量学习模块相结合的网络用于脱机手写汉字识别,在实现样本分类的同时,增大分类的正确率。本文的主要工作包括:1、提出了将GoogLeNet网络、ResNet网络分别和Triplet Loss度量学习模块相结合,形成GoogLeNet+Triplet Loss和ResNet+Triplet Loss两个新的网络结构,并将这两个新网络用于脱机手写汉字识别,得到了90.07%和97.07%的识别结果。Triplet Loss度量学习模块要求输入图像必须是三元组样本对,其中包括属于同一类的两个样本和不同类的一个样本。实验结果表明,如果三元组选择不合理,将会严重影响网络的识别精度;只有选择合理的三元组样本对,Triplet Loss才能有效地减小输入样本的类内距离、扩大类间距离,提高最终的识别结果。2、提出了将GoogLeNet网络、ResNet网络分别和Center Loss度量学习模块相结合,形成GoogLeNet+Center Loss和ResNet+Center Loss两个新的网络结构。将这两个网络分别进行脱机手写汉字实验,得到96.18%和97.03%的识别结果。实验结果表明,Center Loss度量学习模块可以有效地提高手写汉字识别精度。同时,Center Loss模块省略了构造样本对的要求,降低了计算复杂度。3、提出了将ResNet网络和基于余弦距离的Center Loss相结合用于脱机手写汉字识别,该方法有效避免了传统的Center Loss采用欧氏距离进行计算时丢失输入特征向量之间的方向信息的问题。本文将ResNet网络和基于余弦距的Center Loss相结合用于手写汉字识别,进一步提高识别率,最终取得了97.24%的识别结果。
其他文献
<正>作为百事食品公司的一员,多力多滋在炫银与酷黑的包装下,将目标消费群体锁定为"80后"、"90后"、"玩酷一代",并在包装、口味、推广方式等方面强调其Cool的品牌体验
经典物理系统的波动特性与粒子特性相比,在实现信息处理上其运算效率有较大的优势。通过对一种经典耦合谐振子系统波动和能量特性的分析,实现了Grover量子无序搜索算法的过程,并
目的:探讨玻璃体切割术联合硅油填充术治疗视网膜脱离围手术期护理的效果。方法:对50例视网膜脱离患者行玻切联合硅油填充术后临床资料进行回顾性分析。结果:通过术后体位护理、
<正> 一、前言萤石分析,主要是测定氟化钙、氧化钙(碳酸钙及硫酸钙中的钙)。萤石中氧化钙的测定,是用10%醋酸溶液处理试样,这时碳酸钙和硫酸钙能完全被醋酸所分解,而氟化钙则
笔者1984年毕业于内蒙古民族师范学院数学系,自1984年参加教学工作以来一直探索适合蒙语授课学生特点的教学方法。到1987年,在教学实践上总结归纳出“五步教学方法”,即:“自学、
量子信息是量子力学与信息科学相融合的新兴交叉学科,可突破现有信息技术的物理极限,是后莫尔时代重要的新一代技术.量子计算可加快运算速度,量子因特网具备独特性能,量子密
女神崇拜是广西北部湾地区信俗的特征之一。究其历史成因,女神崇拜与原始宗教、人类渴望生命得到护佑的心理及统治者顺应民意的敕封推崇等因素有一定的关系。女神崇拜的现代
最近,新安县磁涧镇传出一条新闻:镇换届选举委员会决定,人代会不吃酒席吃烩菜。出席会议的代表对镇领导在大灾之年励行节约的做法由衷地感到高兴。过去,该镇召开人民代表大会
在中山大学-BP液化天然气系统仿真平台上,基于气液两相容积节点原理,针对某LNG接收站再冷凝系统建立了动态仿真模型。通过深入分析,发现在需启(停)外输泵组以满足外输负荷变动
创业教育是新形势下一种全新的教育理念,同时是一种新兴的教育实践活动,既是认知性教育,更是体验式教育。本文在社会学习理论视域下,对其三个核心理论进行分析,论述了构建创业教