基于迁移学习的数字序列识别算法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:suguangli1507
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为图像处理领域最受关注的研究问题之一,数字识别技术通过对图像中的数字进行检测、分析和识别,实现数字文本的数字化,是文本识别中的一种。数字识别技术在日常生活和工业生产的很多领域都有着广泛的应用。对于传统的机器学习方法,数字识别技术通常是先在图片中获取数字所在位置,然后分割出单字符,继而将这些单字符送入字符分类器中进行识别获得识别结果。随着计算机性能的提高,深度学习技术目前获得了越来越多的关注,利用深度学习技术来解决数字识别问题可以克服传统机器学习方法中的诸多弊端,比如分割字符中对数字粘连的分割困难,特征工程中寻找特征定义的困难等,甚至可以通过端到端的方法直接实现输入带数字的图片能直接输出识别结果这一理想过程。目前较为主流的端到端实现数字序列识别的技术主要有两个,一个是注意力机制,一个是CTC机制。但是深度学习往往需要大量的标记数据样本来进行模型的构建,如果数据样本量不足,往往会得到过拟合结果,难以保证识别结果的准确率。因此,采用迁移学习可以辅助深度学习构建数字识别模型。本论文在对数字识别的传统方法和深度学习进行充分调研的基础上,提出了一种基于CTC损失的深度学习模型,该模型能实现端到端的数字序列识别并在大规模数据集的数字序列图片上进行了实验,验证了该模型性能良好,并研究了通过迁移学习提升模型性能的可行性。之后在建立真实数据集基础上,通过大量实验证实了迁移学习能够提高模型的自适应能力,大大提升了该模型的泛化能力,使之能够广泛应用于不同的场景。
其他文献
目的:以原发性痛经(Primary Dysmenorrhea,PDM)作为本研究的研究载体,利用动脉自旋标记磁共振成像技术(Arterial Spin Labeling-Magnetic Resonance Imaging,ASL-MRI),通过观察PDM患者的静息态脑血流量,以期探讨针刺治疗PDM可能的部分中枢机制。方法:本研究纳入PDM患者和健康受试者各15例,1个月经周期基线观察后,PDM患
在现代通信系统中,特别是在移动通信网络中,基站天线是接收和发射电磁信号的重要设备,是移动通信接入系统的重要组成部分。材料非线性是导致天线无源互调(PIM)不良的重要因数,而基站天线内部的金属连接被认为是典型的材料非线性。天线PIM的优劣会显著影响通讯系统的通讯质量。各大天线厂商目前都致力于天线内部的去金属连接研究,于是塑料铆钉在基站天线内部的使用越来越普及,而摩擦型塑料铆钉的使用存在需要点胶水二次
随着我国经济的发展和城镇化步伐的加快,各地用于地方经济建设的资金需求不断增加,然而分税制改革的实施使得地方政府财权与事权不匹配,资金缺口增大,且受相关法律的限制地方
许多研究表明,近半个世纪以来,我国主要河流的河道径流呈下降趋势,且北方河流径流量下降尤为显著。学者们通过归因分析,认为降雨量的改变是影响河道径流量变化的主要因素。然而研究也表明,近半个世纪以来我国的年降雨量变化不大,因此还需要通过更细尺度的数据分析来揭示河道径流量下降的原因。目前国内对于径流年际变化规律的研究较多,而对于年内变化规律的研究较少,对于不同径流成分的研究也缺乏系统性。为了研究我国主要流
生态补偿是一种促进人与自然之间和谐的环境保护制度,生态补偿的目标是更好的保护环境,利用经济的手段从而来调节自然与各类不同利益关系之间的人的关系。本研究以生态补偿原
众包测试是一种新兴的软件测试方法,已经引起了学术界和工业界的广泛关注。在众包测试中,测试工人帮助软件管理者执行测试并提交测试报告,在这个过程中,软件管理者需要对提交
蛋白质通过与其他蛋白质的物理相互作用在生活的各个方面发挥着关键作用。蛋白质-蛋白质相互作用(Protein-Protein Interactions,PPIs)是许多生物学过程的分子基础,如信号转
由于受到传感器自身性能的限制,在面临快速、低曝光等环境下传统相机无法采集到质量较好的原始图像,因此传统视觉算法的性能在特殊环境下会受到严重的影响。事件相机作为一种
深度学习在面部活体检测领域已取得了较为显著的成果,然而在处理遮挡、光照、角度不当、AI换脸等复杂条件下的面部图片时,因难以预测数目较多的面部特征点集合,使得活体检测
睡眠分期研究一直是研究睡眠的一个重要方向,睡眠分期有助于了解睡眠结构,分析睡眠质量。而当前睡眠问题是一个极为普遍的社会现象,人工分期不仅效率低且准确性低,睡眠自动分