基于卷积神经网络的汉字识别技术研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:hnfengzhong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着时代的发展,汉字字符的识别研究在文献数字化检索、邮政邮件分拣、银行支票处理、表格制作、基于手写的文本输入等相关领域有着广泛的应用前景而备受关注。传统研究方法主要通过“预处理+特征提取+分类器”的模式对汉字进行研究,但是由于字符识别本身存在着种类繁多、易混淆字符较多、结构复杂变化大等问题,字符识别的研究仍然存在着诸多的困难与不足之处,而卷积神经网络具有权值参数共享、特征提取能力强等优点,利用卷积神经网络技术可有效实现汉字的准确识别。本文主要对基于卷积神经网络的汉字识别技术进行研究,研究内容如下:(1).针对现有汉字数据库字符类别不全、字符特征变化少等问题,提出了一种基于字符编码的汉字字符数据库构建方法,可用于神经网络的训练与测试。该方法根据利用官方字库得到相应的所有字符信息,并利用字符编码输出相应的字符图片,为了扩增数据集,采用不同的字符编码输出得到不同的字体的字符图片,并且经过图像放缩、图像旋转、凸化变形、波纹扭曲方法对原始的字符图片处理得到汉字字符数据集。该方法能够实现脱机自行创建汉字字符数据库的目标,所创建的汉字字符数据库数据量大、字符类别覆盖全面、图像特征多样,具有良好的泛化能力。(2).针对现有神经网络特征提取能力差、计算量大等问题,提出了一种新的卷积神经网络架构,可用于汉字的识别。该网络由多个卷积层、池化层、批标准化层与Softmax回归层连接组成,并添加了 RMSprop优化器、数据扩增、批标准化等方式进行优化、提高了网络对汉字的识别准确率。同时针对网络过拟合问题,采用了正则化与Dropout方法,有效防止了网络过拟合。通过将其与经典的Alexnet、Lenet等神经网络模型进行实验对比,可以证明本文所提出的网络架构在汉字识别中提取特征能力强、识别准确率高。(3).针对现有神经网络优化方法复杂度高的问题采用了一种针对卷积神经网络的非对称卷积优化方法。该方法根据汉字识别过程中汉字的独特性质,不改变原有的神经网络架构,仅仅将部分卷积层与批标准化层以非对称卷积核构成的隐层进行了替换,利用非对称卷积核对于四邻域骨架信息的权值加强,去提取特征图像中的有效特征。通过与原网络模型进行实验对比,可以证明本方法在识别准确率、准确率方差上均优于原卷积网络模型,体现了非对称卷积核对卷积神经网络在汉字识别中的性能优化。
其他文献
<正>~~
为了评价船舶振动、噪声舒适度,提出基于烦恼率模型的评价方法。基于适应性理论,考虑船舶自然环境的复杂多变性,从生理、心理角度揭示人对振动等不舒适因素反应的不确定性。
为给航海模拟器建立实用可靠的船舶在波浪中运动的数学模型,基于二维线性势流理论,采用多系数保角变换法对每个船舶横剖面进行高精度拟合,计算各个横剖面的水动力系数和波浪
中华人民共和国的建立使人民获得了新生,“民以食为天”这个困扰中国几千年的问题,在今天有了一个精彩的答案。从建国时摆脱饥寒交迫到20世纪迈人小康,新中国仅用不到60年的时间
简&#183;奥斯汀和纳撒尼尔&#183;霍桑各自刻画了一个自私、虚伪、怯弱的人物——《爱玛》中的弗兰克和《红字》中的丁梅斯代尔,一个被人嗤笑,另一个却让人同情。本文从时代背
本文分析了中职教师专业知能的要素构成,编制了中职教师专业知能评价指标体系。并以广州市中职教师作为研究对象,调查分析了中职教师的专业知能现状。最后提出在信息化时代有
在强调技术预测、技术预见差异的基础上,对技术预见与经济可持续发展进行了有益探讨;提出技术预见与经济可持续发展应该重视职业化技术预见专家的培养和产业界的积极参与,目
目的 :探讨对接受腹腔镜手术的卵巢囊肿患者进行综合护理的效果。方法 :将2017年3月至2018年3月期间在遂宁市安居区人民医院接受腹腔镜手术的200例卵巢囊肿患者作为研究对象。
目的探讨团体辅导对护理专业实习生职业生涯规划的应用效果,为临床护理教学有效开展可行性的干预方案提供指导。方法本研究采用实验性研究。选取的研究对象为2019年34月在湖南省某三甲医院实习的护理专业学生。按照严格的纳入与排除标准确定研究对象为60例,按照抽签法随机分成两组,其中对照组30例,实验组30例。对照组进行常规岗前培训,内容包括医院简介、职业礼仪规范、护理核心制度、职业道德、职业防护和职业前景