融合双注意力机制和空洞卷积的场景文本检测算法研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:lsp110
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
场景文本检测是计算机视觉领域中一个非常重要的研究课题。场景文本作为一种重要的信息载体,其检测技术已经广泛应用于图像/视频理解、视觉搜索、产品识别、自动驾驶、目标定位等领域。因此,场景文本检测技术的研究受到了很多学者的广泛关注。早期针对场景文本检测的研究,大多都选择使用文本框回归进行检测,该方法检测效率较高,但局限于检测矩形文本。最近,很多学者选择使用基于像素级分割的网络来检测不规则文本,并取得了很多有效的成果,但仍然存在着一些亟待解决的问题。首先,该网络在提升文本检测精度的同时不能保证较高的检测速度,难以在实际场景中应用;其次,场景中经常出现文本模糊、变形以及复杂背景干扰等情形,可能会导致漏检或误检;最后,网络的卷积操作会导致空间信息的损失,分割操作缺乏上下文信息的引导,从而降低检测性能。本文针对上述问题,对如何构建更加高效和准确的场景文本检测模型进行研究,取得的主要成果如下:(1)提出了一种融合双注意力机制的双向特征金字塔网络,在确保检测速度的前提下,有效提高了文本检测的精度。首先,本文使用了一种加权双向特征金字塔网络来改进现有的特征金字塔网络。其中网络结构的改进使得模型能够多次应用多尺度特征融合并保持检测实时性;可分离卷积使得计算参数减少,有效提高检测效率;快速归一化方法可以学习不同层输入特征的重要性,有效提升特征的表示和分辨能力。然后针对分割操作缺乏上下文信息引导的局限性,通过两种注意力机制增加上下文关系以丰富空间信息,进一步提高模型的特征表示能力,进而提升检测精度。实验结果表明,融合双注意力机制的双向特征金字塔网络不仅能更好地检测出不同方向或旋转扭曲的不规则文本,也能更好地解决由于模糊、遮挡、光照等导致的难以检测的问题。在ICDAR2015数据集上,所提出的模型在保证检测速度的前提下比基准方法的F-measure值提升了1.09%。(2)提出了一种融合空洞卷积的分割网络。首先针对多层卷积操作会导致详细的空间信息被分离的问题,在分割网络中加入空洞卷积,可以在不丢失分辨率的情况下有效增大感受野。此外,使用混合空洞卷积,通过在不同层设置不同的空洞率来获取多尺度信息,减少空间信息损失。通过大量的参数优化实验,确定了模型的参数。实验结果表明,融合空洞卷积的分割网络的模型参数少,可以通过扩大感受野有效提升检测精度。使用轻量级骨干网络Resnet-18时,在ICDAR2015、Totaltext和TD500三个公开数据集上的F-measure值分别比基准算法提升了1.22%、1.19%和2.14%。
其他文献
室内定位是用户通过室内环境中的某种信号来确定当前时刻其处于室内环境中哪个位置的过程,这种需求随着移动设备的普及而日益增加。近年来,随着深度学习的发展,基于室内环境中WiFi信号发射器产生的指纹信息来进行室内定位成为了一种很有前途的方式。该方式根据预先采集的室内指纹信息进行模型训练,随后,在定位时直接将用户采集到的指纹信息输入模型来预测用户所处位置。但由于室内环境的多变性,为了保持定位精度,服务提供
基于计算机视觉的智能监测以其高精度、自动化和无接触等特点,被广泛应用于轨道交通领域,特别是速度快、天窗时间少的高速铁路视觉监测应用,要求对关键设施进行全天候实时监测,从监测图像中检测定位关键目标并进行智能分析处理,为铁路安全运营提供保障。但是随着高铁线路的日益增多,监测设备的更新换代,针对某一路线的检测模型难以兼顾多条线路的检测任务,重新标注新数据耗时耗力,因而研究具有更强适应性和迁移性的检测模型
随着机器人技术的发展,机器人的应用领域不断延伸,以侦察勘探、实战进攻等场景为代表的应用对机器人运动性能提出了更高的要求,如大驱动力、短时间爆发式提速等。为满足上述应用的需求,本文提出了一种以固体燃料为动力源的重复-循环式脉冲动力机,将固体燃料燃烧产生的巨大能量转化为脉冲动力机活塞推杆的动能,推动机器人运动,进而从动力源角度突破机器人传统驱动方式的限制,满足对短时间、高速度、高爆发的需求。目前脉冲动
全无机钙钛矿材料作为一种近些年来兴起的新型材料,拥有着高色纯度、高载流子迁移率、带隙可调、高光致发光量子产率等一系列优异的光学和电学性质。相比于有机-无机杂化钙钛矿材料,其稳定性得到了大幅的提高,具有更广阔的应用前景。但是全无机钙钛矿往往成膜性较差,所制备的薄膜有着大量的针孔与缺陷,这大大限制了材料的使用,同时也造成了发光器件漏电流过大而降低了器件的发光效率。另外在发光二极管中普遍采用聚3,4-乙
碳泡沫是一种由碳原子堆积形成骨架、具有多孔网络结构的轻质固态材料,具有耐高温、轻质、可剪裁设计的电气/热学传导性等,在复合材料、催化剂载体、航空航天、燃料电池、微电子、互联网技术等领域有着广阔的应用前景。本文以等静压石墨粉和蔗糖为主要原料配制具有良好良好分散性的料浆,通过加入发泡剂并进行机械搅拌的方法在料浆中产生细小均匀的气泡,分别采用明胶固化成形和凝胶注模成形工艺制备了碳泡沫坯体,再经高温碳化处
快递量和快递业务的不断增长给当前快递物流行业带来许多新的挑战,诸如企业间恶性竞争加剧、快递物流成本持续增加、快递投诉越来越频繁等问题严重制约了快递业的健康发展,快递业亟需创新配送模式和管理模式。共同配送通过将所有企业整合在一起,共建公共型快递二级分拨中心,共享车辆、设施和信息资源,并进行统一计划、组织、协调和配送,凭借集约化、规模化、智能化的运输,大大减少了快递运输途中人力、物力和财力的投入,不仅
中医理论和药理研究与现代先进计算机技术手段相结合的方案为中药药性理论提供了有力的科学支撑,帮助人们进一步地探究药性规律。中药药性理论包含四气五味、功能主治、归经和升降沉浮等,为临床合理用药提供了指导。植物药在中药中占有较大比重,由于植物生长环境、生长季节等不同,中药各有各的药性特征,这些特征可通过植物的形态学特征反映。现有研究表明植物药的科属亲缘、物象和药性之间可能存在联系,但是目前研究主要采用频
拟除虫菊酯类杀虫剂开发于上世纪70年代,是目前中国最常用的农药之一。研究发现拟除虫菊酯类杀虫剂与儿童脑瘤、白血病、青少年听力下降等疾病存在正相关性关系,并已证实在中国的水,沉积物和空气以及人群的尿液、母乳中均存在拟除虫菊酯类杀虫剂的残留,这已经引起了学术界和公众的关注。当前的研究对不同介质中拟除虫菊酯类杀虫剂的残留均有报道,但对该杀虫剂在海洋表层水的分布状况和风险缺乏研究。本研究主要以东海表层水为
读完沈从文先生的《边城》,总觉得像是渡了无数次的河,每次渡河的感觉都不尽相同。全文围绕着那条湘西小河展开,又在这条河上收尾。合上小说,我的心依旧在这河上漂,没有目的和终点。《边城》是一部乡村人物的过渡史。一切的转机都托付给了渡河这一具有象征意义的动作。翠翠从一个自然可爱、有着一对清明如水晶般眸子的女孩,变成了时常脸红、羞涩地跑上山去的青春少女。
期刊
随着信息化科技的快速发展,物联网技术应运而生,应用到各种场景中,实现万物互联、人机互通的智慧化建设,是当今和未来科技发展的重要趋势,无线通信作为信息化建设的关键技术,为物联网建设提供了解决方案。泛在电力物联网是物联网在电力场景应用的一部分,将电力系统各环节连接起来,通过无线通信技术实现具有全面状态感知的智慧系统。变电站作为电力系统中的核心,其无线网络覆盖必不可少,与普通场景不同,该场景中存在大量的