【摘 要】
:
手写汉字识别是人机交互的一种重要形式,在票据处理、文件录入等领域具有很高的实用价值。但因汉字的字符数量众多、每个人书写风格各异等原因,手写汉字识别的准确率一直不高
论文部分内容阅读
手写汉字识别是人机交互的一种重要形式,在票据处理、文件录入等领域具有很高的实用价值。但因汉字的字符数量众多、每个人书写风格各异等原因,手写汉字识别的准确率一直不高。近年来,深度学习在图像识别、目标检测等领域取得了突破性的进展,逐渐成为了模式识别问题中常用的方法。本文基于深度学习的方法,综合利用特征提取技术对脱机手写汉字的识别进行了研究,使其识别准确率得到提升。主要的研究工作如下:(1)结合CASIA-HWDB1.1数据集的具体情况,基于Alex Net、VGGNet和Goog Le Net构建多个不同结构的卷积神经网络(CNN)模型,研究不同结构的CNN模型对脱机手写汉字的识别效果。实验结果表明,基于VGG-11结构的端到端CNN模型的识别准确率最高,能够达到94.5%。(2)在VGGNet结构的基础上,设计了多个不同深度的卷积神经网络模型,研究卷积神经网络的深度对识别准确率的影响。实验结果表明,在模型小于11层的情况下,模型结构越深,识别准确率越高。(3)提出了Gabor特征和HOG特征融合CNN模型的识别方法。虽然端到端的CNN模型能够取得不错的结果,但是作为一个黑盒子,CNN在接受原始图像输入的时候,会忽略一些特定领域的信息。本文利用传统图像处理领域的Gabor特征提取和HOG特征提取技术,综合改进对训练数据集进行特征提取,并将提取到的特征图与原训练数据集融合在一起作为CNN的训练数据。实验表明,Gabor特征图和HOG特征图对CNN模型的识别准确率分别提高了0.8%和0.6%。(4)对于CNN模型训练速度慢和不易收敛等问题,研究了基于迁移学习的微调技术和批量归一化算法对模型训练的加速效果,分析了不同Dropout概率对模型识别准确率的影响。最后选择实验结果较好的模型与参数,基于Tensor Flow框架实现一个对脱机手写汉字图像进行识别的测试系统。
其他文献
当前紧张的医患关系对医务人员提出新的要求,他们要医术精湛和医德高尚齐备。医德是医学人文的价值体现,职业精神是具有高尚医德的意识升华,因此,本文主要论述了医学人文视域下医
众所周知,分化的体细胞核重编程为全能性状态的效率非常低。尽管,已有大量试验证实核移植重构胚能够发育到囊胚期,但到足月阶段的比例却非常有限。对核重编程机制的进一步理解,将
糖脂代谢紊乱是诱发心血管疾病的重要因素,其发病率日益增长,目前临床上常采用多种西药进行联合治疗,长期使用患者会出现肝肾损害和停药后容易反弹等副作用,且无预防糖脂代谢
在两会新闻发布会上,商务部部长钟山表示,家政服务是当前服务消费的一个短板,在大中城市,雇保姆难、雇保姆贵、雇一个满意的保姆不容易。不难看出,这三个方面是连在一块的,供给不足
二维碳纳米材料(石墨烯),其独特的结构使得它拥有极大的比表面积、优异的导电性、导热性和机械性能。自发现以来,人们已经尝试将石墨烯应用到很多方面:化学传感器、超级电容器、锂离子电池等。本文以直立型石墨烯为研究对象,通过材料制备与表征,从电化学特性和电磁特性两个方面研究了其材料特性,探索了其在微量重金属离子检测和毫米波领域的潜在应用。主要研究内容:1.采用等离子体增强化学气相沉积法(PECVD)于石墨
《幼儿园教育指导纲要》指出:创造一个自由、宽松的语言交往环境,支持、鼓励、吸引幼儿与教师、同伴交谈,体验语言交流的乐趣;养成幼儿注意倾听的习惯,发展语言理解能力;鼓励
红豆杉属(Taxus)是当今世界上公认的濒临灭绝的一种野生珍稀植物,因含有高效抗癌物质紫杉醇(Paclitaxel)而倍受瞩目。紫杉醇现已被广泛用于治疗多种癌症并取得显著效果,也因此使红豆杉种群遭到严重的人为破坏。在现有阶段,由于野生资源的匮乏,人工培育红豆杉成为一个红豆杉作为中药资源发展的整体走势。山东省境内的红豆杉种植初具一定的规模和研究价值,但是目前有关研究较少。因此,本文以山东省威海市荣成
近年来,以汽车之家、瓜子二手车、易车网等为代表的汽车网络交易平台企业快速发展,其在资本市场中的影响也越来越大,融资、收购等资本运作日渐频繁,对其价值评估也成越来越受市场关注。与传统行业相比,由于其新颖性和独特性,汽车网络交易平台的运营模式、商业模式和影响因素以及价值评估方面有较大不同。因此,汽车网络交易平台价值的科学评估,对它们的重组并购和其它交易行为规范化发展意义重大。本文尝试对汽车网络交易平台
针对鲁棒模糊局部信息C-均值聚类分割算法易丢失图像细节的问题,提出一种改进的核空间直觉模糊C-均值聚类算法。将像素空间邻域信息和直觉指数引入到鲁棒模糊局部信息C-均值聚