基于BiRNN的学生手写文字识别系统设计与实现

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:n0131
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手写文字识别是计算机视觉、自然语言处理领域中的重要问题和研究热点问题之一。将学生手写文档数字化对未来的学生作业大数据分析、在线教育等领域有着重要的推进意义。传统光字符识别技术主要面向高质量印刷体文档图像,而在处理手写体文档时,会出现识别效果差的问题。本论文针对学生手写文字的特点和传统手写文字识别方法的局限性,探讨了基于深度学习的学生手写文字识别方法的优势。提出了基于图像数据的端到端学习方法,并训练得到循环卷积神经网络模型,取得了较高的准确率。基于本网络模型,开发设计了一套用于学生手写文档格式化录入的手写文字识别系统。本论文的研究工作主要包括以下四个方面。1、针对中文字符集中,不常用字较多的现象,设计了一种手写文字图像样本增广方法,以解决样本分布不均衡的问题。本论文首先统计并分析了训练样本中不均衡的种类,然后利用添加高斯噪声、添加椒盐噪声及伽马变换三种方法模拟字体变化及光照影响,对训练样本数量进行了增广。2、提出了一种改进的CNN网络模型。针对CNN网络特征提取时网络层数过深而导致的梯度消失问题,本论文使用了残差模型并改进了残差方式与激活函数,分析了改进后训练时间与测试准确度的效果,并对比了AlexNet、VGG16、GoogleNet和ResNet四种先进的CNN模型的测试结果,验证了CNN网络改进方式的有效性。3、本论文结合了双层RNN网络,利用文本前半部分信息与后半部分信息对当前字符进行预测。通过对比最新相关文献中的手写文字识别算法,验证了本论文所设计的手写文字识别网络模型的有效性,并在学生手写文字数据集上取得了良好的效果。4、设计并实现了一个基于BiRNN的学生手写文字识别系统。该系统利用Python语言的第三方库PyQt5设计开发。系统主要包括输入展示模块、识别导出模块、二次训练模块和用户管理模块。其中识别导出模块所采用的识别算法为本论文提出的优化后的BiRNN网络,并加载已在学生手写文字数据集上训练好的参数,用户也可以利用自己数据再次训练以更新参数模型。用户可以通过系统快速的获得手写文字识别结果,并为以后利用识别结果进行后续的学生作业大数据分析奠定了基础。
其他文献
作为互联网经济的重要来源,电商行业与仓储行业的发展突飞猛进,机器视觉已经成为仓储机器人研究的重要技术,提高了机器人的应对能力。传统的办法是直接基于三维点云匹配的方法,点云量大复杂,处理起来十分困难,算法既不简单也不准确。基于序列图像来识别与分割物体比较准确但缺少三维信息。因此,本论文构建了一套以RGB-D相机为主要传感器,将图像识别与三维点云数据提取相结合,以先分割物体后获取三维点云进行重建为基础
采矿及有色金属冶炼的飞速发展,产生大量采矿废石、尾矿及冶炼废渣等工业固体废物。这些废渣露天堆存或就地填埋占用大量田地,在雨水淋洗的作用下,易溶出砷和其他重金属等有
影像导航手术(Image-guided surgery,IGS)通过可视化增加手术视野,以减小组织损伤风险,提升病灶定位的准确性和靶向性。它需要在术前获取患者三维(three-Dimention,3D)图像,在术中获取患者二维(two-Dimention,2D)图像,三维医学图像可以提供空间位置信息,从而确定病灶位置规划手术过程,二维图像能够提供术中实时信息,以便对手术器械实时跟踪和调整空间位置。
油基钻井液钻井后油润湿滤饼、附着在套管和地层上的残留油难于清除、地层和水泥间的胶结强度低等问题对于钻、完井是一项巨大的挑战。针对目前可逆乳化钻井液存在的问题以及
无论是在经济高度发展的发达国家还是正处于转型经济期的发展中国家,中小企业都是各国经济发展中的关键力量,也是科技创新的重要来源。现阶段我国市场经济正处于新兴加转轨的
马铃薯兼具粮食和蔬菜的双重功效,营养丰富,被称为世界第五大经济作物。马铃薯收、贮、运过程中,绿皮、发芽、机械损伤、腐烂等缺陷严重影响马铃薯品质。采用快速无损检测方
传统刚度机器人由于可以实现精确控制而广泛应用于现代社会,但由于其缺乏主动变刚度而无法实现更安全的人机协作,因此越来越多的学者将新型智能材料集成应用于传统刚性机器人中以期望通过多模传感信息融合以及复杂的控制算法实现机器人关节的柔顺性。磁流变液(Magneto-Rheological Fluid,MRF)是一种新型智能材料,由于其在磁场作用下具有优良的磁流变液流变特性,因此在很多领域得到了越来越广泛的