遥感图像中基于尺度生成网络的小目标检测方法研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:liongliong507
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测技术是计算机视觉中的核心技术,被广泛应用在智能视频监控、自动驾驶、航空监测等领域。同时,随着遥感技术的不断成熟,可获取的遥感数据量急剧增加。因此,遥感图像目标检测技术逐渐成为研究热点,其指的是设计一个目标检测器,可以高效地识别出遥感图像中的感兴趣目标且对其进行定位。然而,此领域始终面临着许多严峻的难题。首先,由于图像涵盖的物体广泛且杂乱,造成了检测时复杂背景干扰的问题。然后,图像中的小目标极多且密集,故缺乏充足的小目标信息以供识别。最后,目标尺度变化范围较大,常常包含仅占十几个像素的小车等小型目标,同时包含几百个像素的较大尺寸目标,如篮球场等。如何设计一个鲁棒的检测器可有效解决这些问题,亟待讨论。本文针对以上所述难点,提出了一种基于全局空间语义和局部上下文关系的遥感图像目标检测网络,采用基于深度学习的方法对遥感图像中目标检测问题进行了算法与模型的研究工作。主要研究工作如下所述:针对俯拍角度下的遥感图像背景复杂,严重干扰检测精度的问题以及传统做法难以提取全局特征的问题,本文提出了多尺度感知网络,通过在特征提取网络中构建多层级注意力网络,提取更多有用的全局上下文特征。通过使用注意力机制提取图像全局语义信息,使网络更加关注信息表达力强的目标区域,抑制复杂背景干扰。针对遥感图像中小目标常常聚簇且缺乏足够信息难以检测的问题,以及传统检测网络中经过多次下采样操作造成小目标信息丢失等问题,本文提出小目标信息增强网络。通过长短时记忆网络学习图像的空间局部区域之间的上下文关系,探索目标周围区域与目标本身的语义相关性,通过记忆周围区域有用特征为信息不足的目标提供辅助检测线索。针对遥感图像的多尺度目标检测问题,传统方法往往是通过人为地预先设定多组尺寸比例各不同的候选框作为筛选基准框,但此种方法会产生很多无用的冗余框,效率低下。因此,本文提出自适应区域框生成网络,通过利用待测图像丰富的语义特征信息引导网络产生无约束的中心位置和尺寸大小,生成尺度自适应的候选框。不仅可以有效检测尺度变换大的目标,同时对遥感领域不同数据集尺度变化有较强适应性。
其他文献
基于深度卷积神经网络(Deep Convolutional Neural Network,DCNN)的算法在计算机视觉领域拥有至关重要的地位,相比与传统算法,其针对图像分类、目标检测、实例分割等任务均具有更高的准确率,成为近年来学术和工业界的主要研究方向。然而,由于DCNN固有的高计算负载、高参数量的属性,针对功耗、存储限制较为严苛的场景,实现高吞吐率、低延时的推理运算仍然面临诸多挑战。本论文提出
行人重识别(Person Re-Identification,简称Re ID),是计算机视觉领域的热点研究方向,主要解决跨摄像头跨场景下行人的识别与检索,具有重要的研究意义和广泛的应用前景。该技术亦可作为人脸识别技术的重要补充,对无法获取清晰人脸的行人进行跨摄像头连续跟踪。本文以人体关节姿态的图表示为辅助特征,联合深度学习和图推理,重点研究并解决行人重识别特征提取不充分、小尺度行人识别精度低和关键
支持矩阵机作为支持向量机的推广,是人工智能中的重要技术,被广泛的应用在分类和预测的问题中,如文本分类、图像识别、医疗诊断等等.这些实际问题中的数据天然是矩阵形式,其结构特征提供了数据的重要信息,因而以矩阵为变量的支持矩阵机问题的研究至关重要.支持矩阵机模型很好的考虑到了矩阵数据内部具有的相关性,其研究的主要困难在于目标函数中秩函数、0/1损失函数的非凸非连续性.目前已有的研究集中在矩阵数据的向量化
随着短视频、直播、云会议等对实时性要求较高的应用不断涌现,最小化延迟成为网络研究的方向和目标。主动队列管理对于改善网络拥塞、控制数据流延迟有着重要作用。然而传统网络的转发设备受硬件限制不支持用户自定义队列管理算法,但随着可编程网络等新型网络架构的出现,在数据平面通过编程接口管理网络节点上的资源(存储器、处理器和分组队列等)得以实现,主动队列管理技术得到进一步的发展,研究数据平面的队列管理对于改善网
目前,医药流通行业受到国家医药改革相关政策的影响,面临着在医药终端下单至送货到位的有限时间内,医药物流中心如何完成大量拆零订单的拣选作业,即如何提高拣选效率的困境。通过在实际中的应用,基于搬运机器人的“货到人”拣选系统已被证明是解决拆零拣选困境的重要手段之一。本文主要针对基于搬运机器人的“货到人”拣选系统中的订单问题进行研究,主要研究内容如下:首先针对基于搬运机器人的“货到人”拣选系统中,搬运通道
随着计算机视觉的不断进步,视觉伺服技术被引入机械臂控制领域,成为机械臂控制领域研究的核心内容之一。机械臂在工作过程中通过摄像机获得图像信息,使得操作系统更加灵活,因此,机械臂视觉伺服控制系统具有非常重要的研究价值。本文以六自由度机械臂视觉伺服系统这种结构复杂的多入多出系统为研究对象,针对视觉模型参数和摄像机内部参数未知的问题,以多入多出紧格式无模型自适应控制算法为基础,对机械臂视觉伺服系统进行了研
移动机器人作为帮助人类拓展认知范围的一类重要辅助工具,在人们的生产生活中占有越来越重要的地位。多面体机器人是一种由空间多环闭链连杆机构构成的多面体形态机构。针对地面移动机器人运动的高地形适应性需求,本论文对四面体移动机构面对台阶障碍的越障过程进行了分析,提出两种越障步态,并对其展开理论分析与样机实验。首先,对四面体移动机构支链进行构型设计,根据构型设计对其进行自由度分析,并提出基于对称驱动的滚动步
随着城市人口不断增加,公共交通压力与日俱增,传统公共交通方式已经制约了运输效率的提升。现代无轨列车是一种新型的城市交通运输工具,是对现有交通运输方式的补充,既具有公路汽车运行灵活、基建成本低的优点,又具有城轨列车载运量大、编组灵活的特点,是城市交通运输未来发展趋势。现代无轨列车的各节车体通过液压铰接机构连接,具备多轴转向的功能,可以提高车辆复杂工况下的运行灵活性。但是与单体客车、单铰接客车相比,多
在移动互联网时代,爆炸式增长的在线内容使得人们深受信息过载问题的困扰。作为缓解信息过载的利器,推荐系统能够从用户-项目历史交互中挖掘用户的个性化偏好,以过滤掉用户不感兴趣的内容。众所周知,传统推荐模型通常面临着数据稀疏和冷启动等问题,因而近年来越来越多的研究关注于融合社交网络等辅助信息来对用户兴趣进行充分建模,以改进现有推荐算法。然而,本文通过研究发现,现有社交推荐算法还存在以下问题:社交域对用户
为了帮助像考古学家、历史学家、网络审查员这类人从文档中快速查找感兴趣的内容,使用深度学习等技术对文档(如手写历史文档)进行快速、实时、精确的关键字定位是相关人员所迫切需求的,其在历史文献查阅、视觉搜索、图像检索领域具有广泛的应用价值。然而由于手写历史文档图像数据集标注困难且费时费力,使得训练数据严重缺乏不足以满足深度学习模型训练的需求。此外,手写历史文档图像具有多样的写作风格、多变的视觉外观、不均