【摘 要】
:
文字,是人类记录思想的符号,是交流信息的工具。文字对人类日常生活的重要性不言而喻。场景文字是指自然场景图像中的文字,路标图像、广告牌图像和车牌图像都携带场景文字。识别自然场景图像中的文字有广泛的应用,如车牌识别、卡证识别和自动驾驶。在几十年前,文字识别的研究主要针对扫描文档文字,经过长期的研究积累,扫描文档文字识别方法日趋成熟。但是场景文字由于背景复杂、文字呈现形式多变、图像质量低等因素,仍面临很
【出 处】
:
中国科学院大学(中国科学院重庆绿色智能技术研究院)
论文部分内容阅读
文字,是人类记录思想的符号,是交流信息的工具。文字对人类日常生活的重要性不言而喻。场景文字是指自然场景图像中的文字,路标图像、广告牌图像和车牌图像都携带场景文字。识别自然场景图像中的文字有广泛的应用,如车牌识别、卡证识别和自动驾驶。在几十年前,文字识别的研究主要针对扫描文档文字,经过长期的研究积累,扫描文档文字识别方法日趋成熟。但是场景文字由于背景复杂、文字呈现形式多变、图像质量低等因素,仍面临很多挑战。其中,不规则场景文字因其字符排列不规则和字符旋转变化导致识别非常困难。近年来,基于注意力机制的方法为不规则场景文字识别提供了新思路。基于注意力机制的方法能够精准的定位字符区域的特征,具有很好的解决字符不规则排列问题的潜力。本文基于注意力机制的方法,对不规则场景文字识别展开一系列研究:(1).本文提出一种基于注意力机制并整合Gabor卷积神经网络来处理不规则文本的方法。Gabor卷积神经网络能够提取对于方向变化更鲁棒的特征,它通过将多方向的Gabor滤波器整合到卷积神经网络中得到。序列识别网络是一个基于注意力机制的“编码器-解码器”模型,它利用Gabor卷积神经网络输出的特征序列化的输出每个字符。在多个场景文本数据集上评估本文提出的模型的准确率,包括规则文本和不规则文本。大量的实验表明本文提出的方法在多个场景文本数据集上取得最优的识别性能。(2).本文提出一种优化注意力机制对齐性能的方法。该方法利用字符中心点位置的标注信息,引入对齐损失函数以优化注意力对齐性能。基于“注意力系数分布单峰,且峰值逼近于1”的先验信息,设计了交叉熵损失函数进行优化;基于“注意力系数分布呈正态分布”的先验信息,设计了搬土距离损失函数进行优化;这两种损失函数对于识别性能都有显著提高。(3).本文提出一种基于二维注意力机制的形变及多层车牌识别方法。该方法可处理多层车牌和透视形变的车牌。本文通过改进YOLOv3算法以提高车牌检测的性能,利用透视矫正网络对车牌进行矫正,采用二维注意力机制的方法以识别单层和多层车牌。为提高CPU设备上的推理速度,采用OpenVINO框架作为推理引擎,使用C++代码实现了一个可在CPU上实时运行的车牌识别软件。
其他文献
非线性系统在各个领域有着广泛的应用.现实中的各种研究对象的非线性本质,使得非线性系统的理论研究逐渐成为当今控制领域的焦点.本文研究了几类高阶非线性下三角系统的无源控制问题.首先对非线性下三角系统,系统的无源性以及无源控制问题进行介绍,并简要介绍本文的结构安排与各部分内容.其次研究具有一次幂并且带有不确定性的高阶非线性下三角系统的无源控制问题,得到了该系统的无源反馈控制律及其设计方法.针对不确定函数
多壁碳纳米管(MWCNTs)和重金属的复合生态毒性已受到广泛关注。作为水体中的常见污染物,表面活性剂可能会影响多壁碳纳米管和重金属的复合毒性。本文选取三种不同官能团多壁碳纳米管(短(S-MWCNTs)、短羟基(SC-MWCNTs)和短羧基(SO-MWCNTs)),两种表面活性剂SDBS和Tween 80,以Cd2+为重金属代表,通过细菌毒性实验研究表面活性剂对多壁碳纳米管和Cd2+对大肠杆菌的毒性
Pt基纳米晶是一类非常重要的电催化剂,其电催化性能与之形貌、组成、结构等因素之间有很强的相关性,因此,Pt基纳米晶的可控合成十分关键,是近些年的研究热点。控制单质Pt纳米
松材线虫(Bursaphelenchus xylophilus)是严重危害我国松林的林业有害生物,其致病的分子机理目前尚待深入研究。在松材线虫-松树互作体系中,克服松树体内产生的H2O2胁迫是松
品牌标识是品牌资产最重要的组成部分,会直接影响消费者对品牌以及对企业的看法和认知。品牌标识作为品牌形象的重要表现形式,已经成为吸引消费者青睐的重要品牌要素。诸多知名企业不吝巨资对品牌标识进行修改或者重新设计,但仍然有很多企业因为品牌标识的不合理导致了巨大的损失,不仅经济效益受损,品牌形象更是大打折扣。因此可见如何设计和选择一个合适的品牌标识对于企业来说至关重要,这关系到品牌和企业的长远发展。品牌标
本论文主要研究了利用2-联苯基异腈参与的自由基加成环化反应,高效合成菲啶类化合物。菲啶环是大部分抗癌药物成分的基础结构,它具有抗菌,抗结核,抗肿瘤等广泛的生物活性,在材料和药物应用方面用途广泛。因此菲啶骨架的合成具有重要意义,本文主要分为以下三个部分:首先,我们发展了一种由易于制备的2-联苯基异腈化合物和甲苯类化合物出发,简洁、高效构建6-苄基菲啶衍生物的方法。用二叔丁基过氧化物(DTBP)作为自
电机轴承在工业生产中扮演着重要角色,其运行可靠性直接关系企业安全生产及经济效益,对其进行故障诊断可给电机正常运行提供可靠保障。本文以电机轴承振动信号为研究对象,分
基于密度泛函理论的第一性原理计算是目前对凝聚态物质开展理论科学研究的重要方法。我们利用该方法对以GeSe为代表的二维四族一硫化合物开展了系统的理论研究。首先,我们把
本论文主要研究不可微函数的高阶弱孤立极小性.首先,通过下Hadamard高阶导数和下Hadamard高阶次微分,给出了高阶弱孤立极小性存在的必要条件.然后通过定义一个新的方向导数(H
喹啉骨架、甲酰胺类化合物广泛存在于自然界与药物分子中,是人类生活中必不可少的化合物。因其具有特殊的生理活性,在医药、农业等领域有无可替代的作用而受到广大化学工作者的关注。此外,甲酰胺是有机化学合成中重要的结构基元,可进一步转化为其他有用的化合物。因此,本文将围绕乙烯基喹啉衍生物的制备及新型N-甲酰化试剂——二氟溴乙酸乙酯的发现进行论述。本文分为三部分:(1)论述了乙烯基喹啉衍生物的合成及甲酰化试剂