基于深度学习的模糊文字识别方法研究

来源 :浙江海洋大学 | 被引量 : 0次 | 上传用户:wuaiboer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的飞速发展及相关硬件设备的迭代更新,人工智能在人类的生活实践等诸多方面中得到了大量的应用。深度学习的提出,使得人工智能技术在计算机视觉领域得到了突破性的发展。文字文字识别任务在深度学习技术的影响下得到了极大的推动,而对于模糊文字图像的研究又成为了另一个重要具有挑战性的课题。将重点放在深度学习方法中文本文字识别的图像预处理阶段,文本识别阶段进行设计改进。为提高文本文字的识别准确率,利用传统图像处理方法和生成式对抗网络(GAN)技术对图像进行预处理以及超分辨率重建,模糊图像清晰化。利用卷积神经网络(CNN)技术和图像纠正算法对文字识别模型进行设计,提高识别精度,最终实现对文字图片的优化识别。在单图像超分辨率重建生成对抗网络(SRGAN)的基础上提出RDGAN的新型超分辨率重建网络。该网络改进残差模块引入残差密集模块(Residual Dense Block,RDB)多层次自适应地学习有效图像特征,移除原SRGAN所带有的批量归一化层(Batch Normalization,BN)的同时,添加总变差损失(total variation loss,TVLoss)以约束噪声,提升模型的训练速度和表达能力。在文字识别方面,基于现代的文字识别思想,设计了多目标矫正网络模块(multiobject rectification network,MORN)、深度残差块(Residual block,RB)模组和基于双向门控记忆单元(Gated Recurrent Unit,GRU)的深层循环网络为主干网络,嵌入连接时序分类损失(Connectionist Temporal Classification,CTC)为一体的融合模型。利用文字方位矫正、特殊卷积残差构造、深层Bi GRU设计,使模型在更复杂排布和语义信息下获得更优的识别能力。通过图像数据增广和合成数据的思想和方法,生成具有一定随机性的、不同干扰程度的伪场景文字数据集,并在原有数据集上进行扩充,使得训练得到的模型具有更优秀的鲁棒性和泛用性。将上述超分辨率重建模型和文字识别模型等方法用于模糊文字图像的识别实验中,训练并验证模型对图像识别的能力提升情况。
其他文献
自从“德国工业4.0”与“中国制造2025”战略对接以来,各行各业都以“数字信息化”为核心向着信息化领域发展,信息化渔业主要体现在对渔业生产流程的监测和管理。以目前市场流通的监测系统来说,大部分系统完成部署后缺乏对设备种类的有效延伸和扩展,缺乏系统间的灵活性和一定的扩展性。根据目前存在的问题进行系统设计,在系统部署完之后,可根据需求自由更换硬件终端功能的物联网监测系统。首先,基于“云网端”一体化服
学位
粒计算是数据挖掘和知识表示的一个重要方法,它在传统计算观念的基础上进行拓展延伸,使信息处理更具科学性和合理性,展现了独特的计算优势。而粗糙集理论对粒计算的研究与发展发挥了重要作用。经典的粗糙集理论主要研究完备、单粒度的信息表,即每个对象的单一属性只能取得唯一的值。但在实际应用中,通常需要处理多个尺度的数据集问题。其中如何选择最优尺度以便为最终决策保持确定性条件是目前多尺度信息表中亟待解决的问题。本
学位
温度回升是事关特高混凝土拱坝安全的核心科学问题。本文首先基于监测资料对以白鹤滩为代表的同类工程温度回升现象及影响进行分析归纳。明确该现象对结构的影响形式,进而通过真实边界条件下多场耦合仿真计算,模拟并预测白鹤滩拱坝施工、运行过程中的整体工作性态,探究相应温度回升影响机制,结论如下:(1)特高混凝土拱坝温度回升主要形成于一期冷却后7天内(温升值1~3℃)以及封拱灌浆后期(温升值大于3℃);(2)受一
学位
粒计算是问题求解中遇到有关信息粒的理论、方法、技术和工具的总称,也是当前人工智能领域的前沿热点之一。粗糙集理论从众多粒计算研究方法中脱颖而出,传统的粗糙集方法主要用于从对象具有唯一属性值的决策系统中提取规则。在现实的数据集中,对象在同一属性下通常会采取多个尺度进行度量,于是,如何根据数据集中对象的属性特征来选择最优尺度是一项亟待解决的问题。另一方面,人们对系统中数据进行知识获取,有时考虑全部数据,
学位
模糊推理是模糊集理论的重要研究内容之一,在人工智能、模糊控制、数据挖掘和专家系统等方面有着广泛的应用。众所周知,模糊推理是从多个模糊前提推得模糊结论的过程。包括CRI(compositional rule of inference)在内的众多模糊推理算法应用而生。于是衡量推理算法的有效性成为模糊推理的重要研究内容。为了衡量它们的有效性,学者们从逻辑和应用的角度提出了一些公理化标准,其中(MP)、(
学位
信息技术的发展与完善,使得人们在各个领域收集的数据爆发式增长,导致数据的内在联系更加复杂和诸多冗余信息的产生,并且实际数据常呈现不完备的特性。如何对这些不完备的现实数据进行属性约简(或称特征选择)已成为具有重要研究意义的问题。在已有的众多研究中,主要研究思想是对此类数据进行不确定性度量或补全处理。不确定性度量可以为数据的不完备性提供有效的度量指标,从而为属性约简奠定了基础。作为重要的数学分析工具之
学位
随着信息技术的飞速发展,文本数据的大量产生,对文本进行分类以便更高效处理文本数据已成为常态,其中对文本数据的情感分类更是在商家产品改进、政治选举等领域起到了重要作用。在文本分类决策问题中,常用的方法是对文本直接采取正面或负面的二支决策分类,但是由于文本情感的特殊性,对文本直接二分类往往导致分类结果准确率低、分类效果差的问题。本文以三支决策思想为背景,对不确定信息部分采取延迟决策。文中主要工作围绕文
学位
作为手机重要组成部分之一,手机垫片配件是否有质量问题也是影响手机质量的重要因素,能够对手机的零部件实现自动检测也是手机制造产业实现智能制造的关键。当前,手机垫片配件的检测方式主要是人工进行分拣,其微小的体积为人工分拣提升了难度,从而导致效率不高,高强度的工作也对工人的身体健康产生影响,伴随着现在用工荒的出现,人力成本的增加也成为企业发展的负担。本文针对手机垫片配件的缺陷和尺寸测量检测问题,基于机器
学位
随着有机聚合物光电探测器在军事、医学等领域的广泛应用,获取成本低且性能优异的有机聚合物光电探测器已成为当前的研究热点之一。ZnO因其宽带隙(3.37 eV)以及高激子结合能而广泛用于光催化、太阳能电池以及光电二极管。而ZnO NRs由于其结构特性可以增加器件的光散射能力而被广泛应用。有机聚合物光电器件作为一种监测光信号的光电器件,降低暗电流,减少薄膜缺陷是改善有机聚合物光电探测器的重要手段。为了改
学位
饱和粘土具有流变性、低渗透性等重要特性。在流变性方面,自太沙基固结理论提出以来,众多学者结合饱和粘土的粘弹性特征,提出了很多考虑固结流变特性的本构模型。然而,由于饱和粘土特殊的物理特性,这些经典流变模型有时也难以准确地描述土体的固结行为,往往需要引入较多的元件才能够取得良好的试验拟合结果。近些年来,随着分数阶微积分理论研究的深入发展,逐渐被应用到土体粘弹性流变模型的研究中。此外,在经典太沙基固结理
学位