深度学习及其在手写汉字识别中的应用研究

被引量 : 0次 | 上传用户:e5134
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手写汉字识别作为人机交互的重要部分,解决这一关键难题具有非常重要的实用价值。汉字识别由于类别数量巨大,字形结构复杂,同时存在大量字形相似的汉字,书写方式因人而异等,在模式识别领域一直是难点和研究热点。深度学习主要包含深信度网络(Deep Belief Network, DBNs)、卷积神经网络(Convolutional Neural Networks, CNNs)两类模型,具有自动获取样本概率分布或者学习样本特征的优势,可以避免手写汉字字形特征提取的难题,但同时又具有训练困难的难题,本文研究了深度学习理论,特别是卷积神经网络模型应用于手写汉字识别的方法,并且针对训练难题做了改进和尝试。通过研究脱机手写汉字识别系统识别率提升的瓶颈问题发现,手写汉字识别率低的原因主要在于相似手写汉字字形难以提取区分性特征。本文将CNNs模型用于10类别的相似手写汉字的识别,并提出了采用随机弹性形变的方法扩展汉字样本,提高了CNNs模型的泛化能力。通过与传统手写汉字识别方法对于相似汉字识别性能的对比实验表明,CNNs模型能够取得较高的识别率,避免了特征提取的难题;基于随机弹性形变的样本扩展能够有效提高用于手写汉字识别的CNNs模型的泛化能力。针对CNNs模型对于不同类别数目进行性能测试实验,绘制了CNNs模型对于不同类别数目的手写汉字识别问题的性能曲线,指出了增大CNNs的模型规模来解决手写汉字识别问题的方案。针对CNNs模型规模增大,导致训练困难的问题,提出了一种类别累加的模型学习方式,即首先利用小类别的样本对CNNs模型进行预训练,将学习得到的模型保留作为更多类别训练的初始模型,然后逐渐增加类别对模型进行训练。采用这种训练方式,能够使CNNs模型学习过程迅速收敛。针对500类别的手写汉字识别实验结果表明,CNNs模型的学习次数降低为原来方法的25%,同时识别错误率相对降低17%至40%,验证了本文方法的有效性。
其他文献
随着人们物质生活水平的提高以及生活方式的改变,心血管疾病病患越来越多,目前已成为人类“最强杀手”。血管支架植入是治疗和预防心血管疾病的重要手段。316L不锈钢支架是应用
从理论上讲,叛逆是永远存在而且必须存在的,没有叛逆就没有人类的发展。逆反心理人人都有,但青少年的逆反心理尤为严重。在现实条件下,在独生子女占多数的情况下,青少年的逆
伴随着社会经济的快速发展,社会、企业对人才需求的改变,以往传统的教学模式已经难以满足现今发展的需要,尤其是对具有极强实践性的中职计算机课程而言,更是如此。因此,加强
切实加强青少年廉洁教育是国家廉政建设的一个重要组成部分,也是促进青少年学生健康成长、培育和谐校园文化的需要。必须采取有效措施加强青少年廉洁意识、诚信意识、责任意
<正>现行人教版和鲁教版的高中语文教材都收录了班固的《苏武传》。人教版按照正史的编撰体例,节选了"前四史"的部分人物传记,力图让学生把握不同史书关于历史人物的塑造方法
用KOH为活化剂对碳纳米管(CNTs)进行活化;用浓硝酸为氧化剂对活化CNTs进行表面改性.通过TEM、BET和IR对经过活化和表面改性的CNTs进行了分析,并运用循环伏安和恒流充放电测试
获得驰名商标会给企业带来巨大的广告效应和经济利益,近些年来通过诉讼认定驰名商标的现象越来越多,经营者通过诉讼获得商标驰名的认定以达到扩大商品、服务的影响力的目的。
当今世界,文化与经济、政治相互交融,在综合国力竞争中的地位和作用日益突出。在中国,国家层面的文化发展战略是建设和谐文化,其主要任务是构建社会主义核心价值体系、建设中华民
紫外固化技术作为一项节能和环保型新技术,具有固化速度快、生产效率高、产物性能好等优点,受到了国内外的广泛重视。本文针对环氧树脂及其复合材料的紫外固化工艺及修补性能进
匈奴是我国古代历史上兴起较早的一个民族。从战国到魏晋南北朝时期,匈奴主要活跃于蒙古高原一带。战国末年匈奴在头曼单于的带领下逐渐崭露头角,其子冒顿单于时期匈奴政治制度