基于深度学习的任意角度和尺度文字检测算法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:huishouzhong2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本作为信息交流的载体,是人类文明的重要标志,在自然场景的图像中广泛的存在,如车牌信息、道路指示牌等。文本相较自然场景图像中的其他内容而言,其具有更加准确丰富的信息以及更强的逻辑性。所以如何准确的定位自然图像中文本的位置,是提取、理解与分析信息的关键步骤。在过去的几年中,场景文本检测方法已经取得了很大的进步。但是大的几何差异(如:方向)是场景文本检测中的关键挑战。在本文中,首先进行实验研究了网络在检测场景文本时学习几何变化的能力,并发现网络只能处理有限的文本几何变化。然后,本文提出了一种新颖的具有多个分支的几何规范化模块,每个分支均由一个比例尺归一化单元和一个方向归一化单元组成,以通过至少一个分支将每个文本实例归一化为一个所需的规范几何范围。几何规范化模块是通用的,很容易插入到现有的基于卷积神经网络的文本检测器中,以构建端到端的几何规范化网络。此外,本文提出了一种几何感知训练方案,通过从统一的几何差异分布中采样和扩充文本实例来有效地训练几何规范化网络。最后,在ICDAR 2015和ICDAR 2017 MLT的流行测试集上,本文的方法使用单图片输入测试分别获得88.52和74.54的F-score,明显优于目前所有最新方法。
其他文献
保持接触网及其附属部件的良好工作状态是高速列车安全运行的基本保障。由于高铁运行过程中各种定位承力支座不断受到电气冲击和机械应力的多重影响,这大大增加了其部件损坏的机率,如果定位承力支座发生故障,会直接损坏接触网设备甚至导致高速列车的骤停和威胁到车厢内人员的人生安全。及时检测到接触网上存在的缺陷对保证铁路的安全运行至关重要,现有检测接触网缺陷的方法可分为:人工巡检、非接触式物理检测和非接触式图像技术
最近几年,目标检测算法模型层出不穷,取得了令人瞩目的进展,在工业领域和生活领域都找到了许许多多的适用场景。但现有的目标检测模型,大多数都是针对通用的自然场景下的图像目标来设计解决方案。对于航拍图像中的小目标来说,检测效果不是很理想,存在着巨大的挑战。因此,论文着手于航拍图像的实际场景,从浅层特征与深层特征融合,感受野增强,轻量级特征提取网络等角度来解决航拍图像小目标定位与分类的问题。主要工作如下:
飞机起降保障作业调度对于提升飞机出动能力至关重要,也是国内外舰船研究的重点问题。国外对于该问题研究得比较深入,且具有成熟的应用和系统,国内的相关研究起步较晚,但研究内容涉及局部作业流程调度、整体流程优化调度以及动态调度等多个方面。国内外相关研究多聚焦于静态调度,对于突发情况下的动态调度策略研究相对较少,而飞机起降保障作业动态调度则更符合实际的需求。本文基于改进NSGA-Ⅱ算法对飞机起降保障作业动态
实体关系抽取是信息抽取技术的重要组成部分,它可以从非结构化文本中抽取出重要的结构化信息,知识图谱、推荐系统、对话问答系统等都涉及到对实体关系抽取技术的运用。虽然传统的实体关系抽取技术发展很成熟,有各种模型方法被提出,但是依然存在一个问题,那就是模型的迁移性能不够。传统模型只能识别训练集中出现的关系类别,对于训练集之外的关系类别是无法识别的,而本文的主要目的就是为了解决上述问题,提升实体关系抽取模型
视频行为识别是近年来比较热门的研究领域,能够把视频中的行为识别出来将对社会产生深远的影响,可以在智能监控、视频检索、医疗健康、人机交互等方面发挥巨大的作用,但是,视频行为识别也受到了各种限制,影响了行为识别的准确率,还不能完全依赖视频行为识别技术来解决实现生活中的问题。为了提高视频行为识别的准确率,设计并实现了基于残差网络和长短期记忆网络结合的模型。视频中包含空间特征和时序特征,这两个信息是关于行
光纤布拉格光栅(FBG)传感器由于其体积小、质量轻、结构稳定、抗电磁干扰能力强等优点,被广泛运用于包括电力交通、人文气象、航天航空和建筑结构检测等领域。在准分布式传感应用中,光纤光栅通过多种复用方式组成传感器阵列,其解调技术既需要对单个光栅的位置和物理量变化信息进行测量,也应具备对光纤链路中的断点进行定位的能力,以便于系统的维护。为了满足上述的条件,本文结合混沌光源的相关特性,进行理论分析,提出针
通常,在语言学中为避免同一词语反复出现而导致句子结构过于臃肿累赘、语义不清晰等问题,常规方法是利用指代词替代已出现代词或名词以简化句子表述,但也由此带来了指代不明等问题,因此在自然语言处理领域,指代消解(Coreference Resolution)任务成为自然语言处理领域语义理解任务中一类关键研究问题,其主要任务是通过融合先验语言知识,以自动化的方式构建照应语与先行语间一一映射关系以避免语义理解
激光干涉仪空间探测器LISA(Laser Interferometer Space Antenna)是一个空间引力波探测任务,它将通过引力波来了解与研究宇宙,为开创引力波天文学建立基础。LISA计划要求每个航天器的检验质量TM(Test Mass)在引力波敏感自由度上的非引力加速度噪声在0.1m Hz到0.1Hz范围内低于3.0×10-15m/s2/Hz1/2。为了验证LISA中一些极具挑战的关键
随着工业机器人的广泛应用,对机器人运动控制中的关键环节--轨迹规划的性能提出了更高的要求。优良的机器人轨迹过渡技术可以改善轨迹运动的平滑性,提高运行效率和精度,对提高机器人的综合性能具有非常重要的作用。本文对工业机器人轨迹过渡技术进行了深入研究,主要研究内容有:针对工业机器人多运动段轨迹不满足G1连续性的问题,分析了由直线和圆弧插补组成的多运动段的平滑性,设计了不同运动类型过渡段构造方法以及多运动
随着科学技术的发展,工程领域中涉及到的一些函数优化问题越来越复杂,它们往往具有不可导、不连续、多峰值等特点,传统的数学方法已经很难得到理想的结果。函数最优化问题可以通过演化算法进行求解。其中,差分演化算法已经被证明是最强大的演化算法之一。然而,差分演化算法中一些参数的设置对性能有非常大的影响。为了解决这个缺陷,研究者们已经提出了很多不同的参数适应技术。不同的参数适应技术有着不同的特点,各自适用于不