基于深度学习的场景文字检测与识别研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:flyingmain
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然场景图像中的文字具有更加精确的语义信息,准确地从场景图像中提取和识别文字能够极大地增强计算机对图像内容的理解能力。计算机对自然场景图像中的文字进行检测和识别的工作已经成为文字识别领域乃至整个计算机视觉领域中最受关注的研究热点。因此,本文基于深度学习方法,对场景图像中的文字检测和识别进行了以下研究。首先,针对场景图像中背景复杂、视觉元素繁多及准确检测待识别文字问题,提出基于深度学习和YOLOv5的目标检测算法对图像中的文字进行检测与定位,并在多种类型的数据集上进行了文字检测实验。结果表明目标检测模型能够快速、准确地定位图像中不同类型的文字,为后续识别工作提供了基础。其次,对于图像背景易与文字混淆而影响识别的问题,构造了基于UNet的语义分割模型及嵌入注意力机制的Att-UNet模型,使用图像分割的方法检测并定位场景图像中文字。通过对图像添加人工噪声和干扰的方法构造像素级标注的数据集,缓解了数据集匮乏问题。语义分割的实验结果表明,分割方法不仅能够对文本行区域进行分割,还能够直接分割文字本身的形状,极大的增强后续识别所需的特征。最后,对于场景图像中文字排列差异和检测结果不一问题,分别对单字符、固定长度文本行和不定长度文本行的图像进行了基于深度神经网络的识别研究:基于改造分类模型实现了对单字符图像较高的识别准确率同时降低了参数量,并证明了解耦合模型的优势;基于多标签分类方法提出了一种端到端的固定长度文本行识别模型;基于CRNN模型和CTC损失实现了对不定长度文本行的端到端识别。端到端的文本行识别方法避免了传统文字切分方法造成的错误累积,有利于场景文字检测与识别任务整体准确率的提高。
其他文献
β-Ga2O3作为第三代半导体材料,拥有作为光电探测器所需要大的禁带宽度(在室温下的禁带宽度达到4.9e V),且截至边波长落在254nm左右,使其成为光电探测器的理想材料。β-Ga2O3材料存在着多种形态,如:体单晶、薄膜、纳米材料等,相比于薄膜和体材料,纳米材料拥有更好的结晶质量和量子尺寸效应等优异性能。纳米材料的尺寸越小其表现出的五种纳米效应就越显著,本论文采用化学气相沉积(CVD)法在低成
学位
<正>“一图读懂政府工作报告”是近年来各媒体报道两会时常用的一种形式。这种形式以图片简洁、内容直观、契合碎片化阅读习惯等传播优势,取得了很好的效果。2023年全国两会是在贯彻党的二十大精神开局之年召开的重要会议。政府工作报告以详尽的数据高度概括了过去五年来我国经济社会建设所取得的成就,描述了未来国家经济社会发展的宏伟蓝图。各大媒体对报告内容进行了多种形式的报道。
期刊
镁锂合金被称为“超轻合金”,将镁锂合金应用于航空航天,可以直接削减航天器的燃料燃烧以及运输成本。所以,本课题利用等离子体电解氧化(PEO)技术在LA103Z镁锂合金表面制备高吸收率高发射率的黑色陶瓷膜层。因为镁锂合金的耐腐蚀性能较差,故本研究也将提高其耐腐蚀性能。主要研究内容如下:(1)采用硅酸盐为基础电解液,CuSO4为添加剂,制备PEO膜层。PEO膜层主要由MgO和Mg2Si O4相组成。随着
学位
近年来,绿色环境能源收集的一个新的研究方向是水蒸发驱动的纳米发电机研究。影响水蒸发驱动纳米发电机性能因素的研究及材料体系开发对于水蒸发驱动的纳米发电机研究具有重要意义。以往的关于水蒸发驱动纳米发电机的性能的影响因素研究主要集中于环境湿度、环境温度、空气流速、蒸发面积等方面。然而关于蒸发驱动纳米发电机中纳米材料排布结构对于发电性能的影响却少有报道。本文利用球状二氧化硅(Si O2)纳米颗粒和片层状双
学位
报纸
硼是重要的非金属矿产资源,在化工、轻工、医药等行业有广泛应用。探究硼矿分布规律有着十分重要的科研与经济意义,而成矿物质来源是讨论矿床成因的首要问题之一。该区域的硼矿赋存于辽吉裂谷内,区域地质构造复杂,变质变形作用十分明显,成矿地质条件优越,是我国硼矿的主要分布地区。区内主要硼矿床为翁泉沟硼矿。在前人研究基础上,深入研究成矿物质来源、成矿流体来源,进而讨论区内硼矿成因。
期刊
恶劣天气下的图像恢复是计算机视觉领域的基本问题之一,其目的是消除天气因素对图像的退化,从而生成清晰的图像。鉴于目前所广泛使用的图像恢复方法主要针对单一天气情况,本文主要针对多种恶劣天气(雨、雾和依附雨滴)条件造成图像退化,使用单一网络对图像恢复进行研究。本文的主要研究内容和创新点如下:首先,研究一种基于注意力引导多分支的单幅图像去雨去雾方法。该方法遵循多路径和多分支模式,允许多个互连分支在不同尺度
学位
报纸
混合卤素钙钛矿太阳电池光伏性能及其的卓越,理论值超过大部分光电器件,这也正是其成为最有希望的光伏电池的下一代太阳能电池的原因之一。如今钙钛矿太阳能电池(PSCs)的研究取得了巨大的进步,现在认证PCE效率可达25%以上。PCE的增长得益于众多的优化策略。研究者不断探索各种工程方法来钝化钙钛矿时吸光材料,以减少钙钛矿体相以及界面的缺陷,优化钙钛矿吸收层与其他界面的结合。(1)氯化甲胺(MACl)作为
学位
目前,基于光纤布拉格光栅的腐蚀监测传感器多应用于钢筋、油气管道这些特殊的应用场合,并且监测的参数易受到其它因素的影响。为了解决现有的基于光纤布拉格光栅的腐蚀监测传感器存在通用性差和监测参数易受其它因素影响的问题,本文根据金属腐蚀后厚度变薄这一稳定关系进行了基于光纤布拉格光栅(FBG)腐蚀监测传感器的研究。该腐蚀监测传感器具有量程和灵敏度可调、测量精度高、监测结果准确可靠的特性,同时解决了FBG对温
学位