基于生成对抗网络的脱机手写汉字识别

来源 :广东工业大学 | 被引量 : 2次 | 上传用户:wongbo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
将脱机手写汉字从图像中准确地识别并提取出来,可以大幅度减少汉字手稿整理所需要的人力物力。脱机手写汉字的识别一直是模式识别的难题。近年来,高速发展的深度学习网络在图像识别、图像生成、目标检测等领域取得了飞跃式的发展。使用深度卷积神经网络解决脱机手写汉字识别是一种很重要的途径。但是深度学习的应用需要大量的训练样本,尽管目前的脱机手写汉字的多分类样本集已经存在,但是检测识别样本集仍然非常不足。汉字类别过多,形态多变,文字的出现频率不同,很多字并不常见,即使见到,其字形往往单一,难以收集频率分布均匀的真实样本,所以难以通过人工标注现有文档的方式获取足量样本。针对这一现状,本文将生成对抗网络(GAN)应用在脱机手写汉字的生成上,获取到大量的脱机手写体汉字样本,进而人工合成足量的汉字检测识别样本,并设计脱机手写汉字检测识别算法进行检测和识别。本文提出了一套脱机手写汉字样本生成、汉字检测、汉字识别方法。首先,本文针对图像的特征提取和识别,提出了改进的Inception卷积神经网络结构并搭建了效果优异的Joint-Net卷积神经网络分类模型。然后,将Joint-Net卷积网络作为判别网络应用在WGAN-GP中,生成了脱机手写单字样本。使用生成的脱机手写汉字和现有的脱机手写汉字数据集人工合成了背景复杂的脱机手写汉检测识别样本。最后,以Joint-Net作为网络主干,设计了新颖的端到端的脱机手写汉字检测识别模型。实验部分,Joint-Net模型在脱机手写汉字数据集上进行了实验验证,采用随机梯度下降优化算法,CNN模型在测试集上达到了96.95%的平均准确率。而汉字检测和汉字识别算法的效果优异。实验结果表明,基于GAN生成样本的脱机手写汉字识别是一个好的解决方案。
其他文献
物联网和通信技术的蓬勃发展为车联网的兴起创造了机遇。车辆通过各种传感设备收集自身以及周围环境的大量数据信息,然后通过对数据的处理为用户提供各种车联网服务。但是随
随着无线通信技术的飞速发展,5G技术将在2020年完成标准制定并全面商用。作为5G的关键技术之一,大规模天线阵列(Massive multiple input multiple output,Massive MIMO)技术研究潜力巨大。无线媒质固有的开放性特征使无线网络信息传输深受窃听困扰。传统的无线安全对复杂的高层加密依赖性很高,而物理层安全作为底层安全技术,利用无线信道物理特性存在的固有差异能
《中日丛报》(Chinese and Japanese Repository)是由英国伦敦大学国王学院汉学教授詹姆斯·萨默斯(James Summers,1828—1891)于英国创办、1863—1865年发行于伦敦的综合性
新一代视频编码标准HEVC的提出,在编码模块引入更多新特性,较H.264/AVC降低一倍码率的同时,带来了计算复杂度的大幅度增加。基于现代多核处理器平台的并行计算成为高复杂度视频编码的有力解决方案,具有重要的研究意义和应用前景。本文针对HEVC视频编码复杂度高的问题,设计主要编码模块并行处理方案,提升编码运算效率;通过核调度策略将方案融合后应用到多路编码系统中,实现对多路视频的目标场景并行处理。论
当前我国各种类型的困境儿童数量庞大,其中留守儿童数量高达5800万,孤儿数量高达57万,事实无人抚养儿童数量多达61万。受各种内外部因素的影响和制约,困境儿童由于长期身心承
学位
本文基于目前绳索牵引机器人的研究成果,利用绳索牵引机器人制造成本低、工作空间大、惯性小易于组装和重构等优点,设计出一款平面绳索牵引多体机器人,该机器人可组成平面串联多杆机构。然后推导出绳牵引多体系统绳索分布方式,并将推导出的关系应用到本文所设计的平面绳索牵引多体机器人的两杆和三杆机构上,计算出其合理的牵绳方式。在本文所设计的平面绳索牵引多体机器人中包含结构模块、硬件模块和软件模块(优化模块)。结构
云环境的出现给社会带来巨大改变,为节约计算资源、拓宽存储方式提供思路。在云的帮助下,数据共享成为更便捷的获取信息的方法,在收集数据、分析数据等方面具有优势。在数据
现有的跳跃机器人大多只适用于陆地环境,无法在水中完成跳跃。为了满足对复杂水体环境下执行任务的需要,水上跳跃机器人得到了研究人员的关注。水上跳跃机器人在户外侦测、水
随着我国社会的发展,有关贫困家庭儿童的社会保障政策不断出台,在其生活所需的物质资源得到保障的基础上,对贫困家庭儿童的综合素质发展也开始重视。儿童处于认识了解社会的