基于相似度特征和深度学习的脱机手写汉字评价与身份验证研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:jijipanji
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手写汉字识别一直是模式识别领域的研究热点和难点,但目前算法的识别率有一定局限,书写潦草是影响算法效率的重要原因之一,工整度评价可以减少书写潦草对识别率的影响,但针对脱机手写汉字的工整度评价问题,目前并无确切的定量评价方法,评价标准也不统一。此外,手写汉字在一定程度上能够反映出书写者个体差异,但由于脱机手写汉字样本缺乏书写方向、书写力度等动态信息,导致基于手写汉字的身份验证难度大大增加。针对这些问题,本文利用多种相似度特征和神经网络分类识别算法,研究了脱机手写汉字的工整度评价方法,并基于相似度特征对书写者身份进行了识别验证。完成的主要工作如下:(1)针对本文测试需要,采集书写差异较大的测试者的手写汉字图像,建立工整度评价手写汉字测试集,并从中随机选取部分汉字构建身份验证汉字测试集。为了提高工整度评价和身份验证准确率,对手写汉字图像进行预处理,包括汉字图像剪裁、灰度化和二值化、滤波去噪、汉字图像标准化和汉字图像骨架提取等。(2)提取手写汉字图像与标准模板汉字图像之间的三种相似度特征,包括相关系数、Tversky指数和余弦相似度。其中用于余弦相似度计算所需的特征,分别采用了同心圆分割、纹理特征、网格特征和图像投影四种不同的方法进行提取。通过分析处理相似度特征完成了手写汉字工整度的定量评价,并将算法评价结果与人的评价结果进行比较。结果表明,基于相似度对手写汉字工整度进行评价的结果与人工评价一致。(3)以业务办理常用语“同意办理”为测试汉字,提取手写汉字的多种相似度特征,并与身份验证数据集中的汉字模板进行对比,利用BP神经网络分类器完成书写者的身份验证。结果表明,基于手写汉字相似度特征进行身份验证的准确率高于85%。同时,提出采用表征学习和度量学习的方法对手写汉字进行特征提取,采用Res Net-50网络提取了手写汉字特征图,并将特征图转化为2048维特征向量。通过SVM分类器对提取的特征进行分类,随着惩罚因子a的增大,识别准确率可以达到90%以上。本文利用相似度特征提出的脱机手写汉字工整度定量评价和身份验证方法,算法简单可靠,工整度评价结果与人工评价结果一致,书写者身份验证准确率高于85%。利用深度学习方法,基于脱机手写汉字进行身份验证的准确率高于90%。工整度评价方案能够有效提高汉字书写规范程度和识别准确率,提出的基于脱机手写汉字的身份验证方法,在业务办理常用语的小数据集上取得了较好的识别效果。
其他文献
随着移动设备的大量普及和5G网络新应用的迅猛发展,对大规模设备连接与计算处理能力的要求也随之增加,为了满足复杂应用程序的资源需求,移动云计算的概念应运而生。兼顾云任务服务质量和云系统能源消耗水平,在云端引入周期性半休眠模式和限制周期性半休眠模式,研究云计算节能策略及性能优化问题。首先,为了降低云系统的能源消耗水平,面向非实时网络应用,提出融合周期性半休眠模式的云计算节能策略。当部署在云端服务器上的
欧洲艺术对再现的追求成为了摄影术诞生的契机。十九世纪摄影术的诞生扣开了西方图像时代的大门,西方视觉艺术领域由此发生了重大变化:一方面,传统的写实绘画在现代艺术的格局中逐渐被边缘化,另一方面图像与绘画之间界限的打破使得视觉艺术的形式得到了长足拓展。然而中西方文化的异质性,导致中国与西方美术的发展迥异。当西方在进行现代艺术探索时,摄影术的传入却促进了中国民众的视觉转向以及写实审美观念的建立。甲午战败后
为了弄清哺乳动物早期胚胎体外发育阻滞的机制,人们不断地从胚胎内部以及外界环境中寻找原因。目前已经发现,损伤的细胞中含有较多的各类氧化物,包括过氧化氢以及其它自由基(例如过氧化物阴离子和氢氧根离子);在因细胞分裂阻断以及细胞功能丧失所引起的异常细胞中也含有这些活性氧类(ROS)物质。 本试验以昆明小鼠1-细胞期胚胎为实验对象,以CZB培养液为基础液在不同发育阶段添加外源性ROS,培养至桑椹胚、
自然灾害、意外事件和恐怖袭击频频出现在世界各地,灾害的持续性以及消防环境的恶劣性对消防员搜救带来了严峻考验。搜救机器人的出现,大大减少了施救人员的消防负担和伤亡情况。本文针对搜救机器人安全有效跨越多种地形障碍的要求,设计了一种基于Bricard连杆的可变形搜救机器人,对其进行运动学、动力学理论和仿真研究,并进行了样机研制,本文的主要研究内容如下:首先,从搜救任务的实际需求出发,提出可变形搜救机器人
在如今高速发展的今天,借着人工智能的东风,机器人产业也同时迎来了大爆发时期。各类机器人不断涌现,从日常生活中的扫地机器人到快递行业的物流机器人再到消防机器人等特种机器人,机器人正越来越引起人们的注意,同时也正发挥着越来越重要的作用。本文主要针对移动机器人关键技术路径规划与跟踪控制进行研究,具体内容如下:首先,针对移动机器人的环境建图进行阐述,介绍了常用的几种地图搭建方法,本文选用的为栅格地图,分析
在我国人口老龄化的背景下,因脑卒中而导致的下肢功能障碍的患者急剧增加。能够高效的为患者提供康复训练的下肢康复机器人已成为了研究热点。本文提出了一种能够为患者提供多关节训练的下肢康复机器人,并且提出了一种基于RGB-D相机的测量关节活动度的方法,为下肢康复机器人安全训练范围的设定提供了重要的依据。首先,本文对人体的下肢结构进行了分析,提出了下肢康复机器人的具体设计要求。然后对下肢康复机器人进行了机构
在ICSID仲裁中,《ICSID公约》第47条“建议”一词的使用,使得长久以来仲裁庭采取临时措施的拘束力一直处于争议状态。从法律解释的角度来讲,公约文本并未授予仲裁庭采取的临时措施以强制拘束力,通过分析仲裁实践中关于临时措施拘束力认定之论理,亦可发现其存在诸多缺陷且无法推翻公约文本关于临时措施拘束力的传统认定。然而不可忽视的是,基于仲裁实践的积极推动,临时措施具有拘束力的仲裁判例在实践中已然形成,
针对近红外光谱(NIRS)存在的吸收信号较弱、谱峰重叠、背景和噪声干扰等问题,借助有效的化学计量学算法建立高性能的定性和定量模型是NIRS分析技术的研究热点之一。卷积神经网络具有局部连接和权值共享的特性,能够高效处理大量光谱数据。本文提出串行融合和四元数并行融合光谱结合卷积神经网络的新方法,建立玉米成分含量预测定量模型和淀粉种类鉴别及成分预测的定性定量模型。主要研究内容如下:首先,针对国际公开玉米
近年来,光纤传感器逐渐应用于生产生活的各个领域。但在传感器测量过程中,待测量的交叉敏感会导致其测量的不精确。而通过改进光纤及其传感器结构可以实现多参量的测量,能够很好的改善交叉敏感问题,日益得到国内外学者的广泛关注。因此,本文提出的基于粗锥结构级联长周期光纤光栅(LPFG)的双包层光纤多参量传感器,通过解调波长漂移的系数灵敏度矩阵实现多参量的同时测量,具有重要的研究意义。本文总结并介绍了光纤多参量