基于深度学习的汉字识别技术研究

来源 :江苏科技大学 | 被引量 : 6次 | 上传用户:heatsnow
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉字图像识别是模式识别研究与应用领域的一个重要分支,在经济贸易、智能交通、文字印刷等许多领域有着极其广泛的应用。因此,汉字识别方法的技术研究与开发越来越受到人们的重视,现今已经成为世界范围内热门研究的课题之一。随着深度学习在人工智能领域中的快速发展,深度学习中的卷积神经网络已经在模式识别中获得了优秀的识别性能。针对传统汉字识别受特征提取方法的限制,深度学习中的卷积神经网络便发挥了可以自动获取学习样本特征的优势,但是深度学习在训练样本时比较复杂所以难度较大。本文通过结合卷积神经网络以及传统模式识别在汉字识别的应用进行了相关的研究,论文主要研究工作如下:1)本文研究了传统汉字图像识别方法,使用支持向量机加决策树作为分类器,分别使用方向特征、Gabor特征以及弹性网格特征加上三种不同的数据集预处理方法进行试验。实验表明使用形态学转换的数据集预处理方法加上使用弹性网格特征,能够获得较好的识别准确率。2)为了解决形相似汉字的微小差异会在训练中丢失的问题,通过将注意力层与本文选定的AlexNet网络中的卷积层进行并联,以提高汉字图像中微小差异处的权重,达到提高该处注意力的目的,从而减少卷积层对于丢失信息的影响,提高识别效果。3)在实现汉字识别系统的过程中,对数据增强进行了研究,实验表明数据集通过合理的数据增强方法扩充后,能够有效地避免深度卷积神经网络的过拟合问题。4)结合了数据增强方法以及数据集预处理方法的研究结果,通过对不同结构的卷积神经网络进行试验。其中,使用数据增强+形态学转换+集成注意力层的AlexNet的方法识别汉字的准确率为99.87%,说明本文的方法在汉字识别上的应用是有效的。5)将传统图像识别中的特征提取与卷积神经网络结合,将弹性网格特征图作为卷积神经网络的输入,可以在减少卷积层的同时提升识别效果,从而优化了网络性能。
其他文献
采用分层分级抽样法,对甘肃省6个地区的中小学体育与健康课程进行了调查与分析,阐述了甘肃省中小学体育教师师资、《体育与健康教学大纲》的实施、影响体育开课率的因素以及教
户籍制度改革以来,我国流动人口不断增加,其中跨省流动人口对各省乃至全国的经济、社会和文化等方面都产生了重要影响,从经济增长的角度来看,人口流动与资源合理配置、激发社
【基金仓位测算之我见一】最近基金研究领域和媒体对基金仓位测算争议颇多。善意的关注和建议有助于行业的提高与健康发展,但有意无意地误导和误解则会在混淆视听的同时,给行
将配合物的价键理论、晶体场理论和分子轨道理论有机地结合在一起,提出了研究配合物结构的新理论-统一轨道场理论,应用该理论能更好的研究配合物的结构,更全面地解释、预测配合
基于现有理论,本文以三一重工、中联重科、山河智能三家工程机械类企业分别与其各自长期合作供应商的双边联盟合作关系为研究对象,重点研究了双边层次联盟能力的构成维度及其
浙江省体育局的机关报《体坛报》刊登了一个特别的求职广告——为15名浙江省优秀退役运动员找工作。其中游泳名将杨雨、女排运动员周润芝、男排运动员沈征宇赫然在列。
给出了一种多层向量空间模型,该模型将一篇文档的相关信息从逻辑上划分为多个相对独立的文本段,按照不同位置的文本段确定相应的索引项权重.然后提出了一种简明而有效的基于分级
对住院糖尿病合并败血症41例资料进行分析。结果:感染途径主要为泌尿道(14例)、呼吸道(14例)、胆道(6例)及皮肤(6例)。社区感染9例,院内感染32例。病原菌以革兰氏阴性菌多见,
通过使用常规流速仪(转子式)、RD1300型ADCP收集到的流量成果与RiverSurveyorM9走航式测量系统收集到的流量成果进行比对分析,确定M9的使用精度。通过系统集成,实现广东省境内最
以审判为中心的刑事诉讼制度改革更加强调证据裁判和直接言词原则,对侦查取证质量提出更高要求.公安机关近年来发现、获取、解读刑事证据的能力逐渐提高,取证的规范化程度也