基于Anchor-Free的遥感图像目标检测算法研究

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:blueblood008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,不同发展阶段的目标检测算法层出不穷,不少学者越来越关注目标检测算法面向工业界的应用,尤其是算法对实际场景是否有足够的鲁棒性。遥感图像是航空器或航天器在高空采集的俯瞰航拍图像集,对地球资源调查与开发、国土整治、环境监测、以及全球性研究有着重要的实用性价值。遥感图像的目标检测对于计算机视觉和数字图像处理方向的很多任务都有很重要的应用价值,因此具有很高的研究意义。随着人工智能技术的迅速发展,基于深度学习的目标检测算法在检测效率和速度方面取得了巨大的优势和成果。考虑到目前流行的目标检测算法基于的anchor机制所需的NMS操作导致网络参数量大,训练时间增长,以及两阶段检测算法检测速度慢,实时检测消耗时间长等问题,本文选择使用基于Anchor-free的单阶段目标检测算法对遥感图像目标检测进行研究,主要工作分为三个部分。首先,本文采用了在检测精度和检测速度上均优于当前部分主流检测框架且基于Anchor-free机制的Center Net算法,在DOTA-v1.5遥感图像数据集上进行目标检测实验。为了提高网络对遥感数据集的适用性和检测效果,对Center Net网络进行改进。先对遥感数据集进行预处理,以适应Center Net网络,提高网络对遥感图像的检测有效性。针对Center Net网络的主干网络Hourglass-104参数量大,训练时间过长的情况,对Center Net算法的网络结构进行改进,提出了Center Net-DSC算法。在保持精度平衡的情况下,减少网络参数,提高网络的检测速度,平均检测时间减少了0.011s。然后,针对遥感图像具有观测面积大但目标实例相对较小,目标尺寸差异较大且分布不均匀等特点,本文提出了Center Net-DSC-Attention算法,在之前改进的基础上引入了注意力机制,在主干网络Hourglass-104中插入轻量级的注意力机制模块,加入注意力机制后的Center Net-DSC-Attention网络能很好地学习到遥感图像中的目标特征,强调实例信息,抑制背景信息,提高数据集中分布密集的小目标的检测精度。最后针对Center Net-DSC-Attention网络参数量大、网络模型体积占比大等问题,对模型进行压缩,减少模型中权重为0的多余枝节,在保持精度不下降的情况下,减少网络参数和模型体积。
其他文献
随着互联网的迅速发展,越来越多的用户喜欢在网上表达自己的观点和想法,这就积累了海量的文本数据。对这些文本数据进行情感分类,可以挖掘这些文本数据的潜在信息,从而可以帮助平台以及其他行业的发展。在情感分类的过程中,主要是对互联网中产生的文本数据进行分析并做出情感倾向判断。这一过程往往需要大量带标签的文本资源,但是由于不同语言之间的数据资源差异导致情感分类在不用语言之间发展不平衡。这一现状,促使了跨语言
学位
在市政道路建设施工中不可避免的设置大量的雨水井、污水井、燃气等类型的检查井,检查井的施工质量将直接影响了道路交通车辆行驶的舒适性和安全性。针对此,本文主要分析球墨铸铁可调式防沉降检查井盖安装技术,并从安装流程、工艺关键环节进行探究,并提出井圈周边加固施工工艺后,减少了井周路面开裂、下沉和破损,减少了井盖松动噪音扰民等病害,对城市管理在一定程度上起了积极的影响。
期刊
专利背景技术包含丰富的技术问题信息,能帮助我们快速了解当前技术的核心问题,在专利推荐方面具有重要价值。目前专利推荐主要是基于专利内容进行推荐,缺乏对技术问题具有针对性的推荐,且专利技术问题的相关研究甚少,无法展示专利多元化的问题信息。本文从专利背景技术中入手,采用先筛选后抽取的两步骤策略抽取出结构化的专利问题信息,并进一步利用问题信息结合专利标题表示专利特征向量,提出了一种基于多元问题信息的专利聚
学位
人体动作识别是分析视频中个体的动作和多人之间的互动行为。作为高级信息的骨架序列可以传达人类活动的紧凑信息,为描述人体动作提供有效的表示。图卷积网络(Graph Convolutional Network,GCN)通过将人体骨架构建为一个时空图,取得很好的分类结果。然而,大多数现有图卷积方法忽略了关节点之间的非物理依赖性,也没有充分考虑不同人体关节点和视频帧的重要程度。因此,对于基于骨架的人体动作识
学位
当今是全球一体化的时代,跨区域合作成为主流,是现阶段中国经济发展的重要特征。国家、省域、市域之间的依赖性与纽带不断强化,彼此相互合作,且相互竞争。基于此,形成的以政府间竞争为主要特征的区域治理模式和体制机制为区域协调发展战略提供了强劲的推动力,也为地方政府指引了一条纾解区域经济协调发展难题的有效路径。区域政府协同治理已取得骄人的成绩,但同时,也要清楚地了解到,我国区域发展差距依旧较大,难以适应新时
学位
本文主要介绍统计决策在风险型和不确定型两种类型决策问题下的决策方法。主要介绍在风险型决策问题下的分别以期望值、等概率、最大可能性为标准的决策方法,以及在不确定型决策问题下的“好中求好”“坏中求好”和α系数决策方法,并且对上述各种决策方法进行归类总结,阐述各种决策方法的内容和手段,并通过一些具体实例来反映实际中的应用。
期刊
目前,互联网上的三维模型不仅在数量等级方面以指数的方式迅猛增长,而且与二维图像相比三维模型组成的场景包含更加丰富逼真的视觉细节,使得三维模型这一信息载体在建筑设计、造型艺术、动画制作以及零件生产加工等方面发挥了重要的作用。在海量的模型数据库中高效准确地检索到用户所需模型,具有重要的研究价值。三维模型的检索算法主要可以概括为两类:基于模型特征和基于视图特征。基于模型特征的检索主要是从模型的三维数据角
学位
作为表征学习的一个重要领域,网络表征学习成为网络科学和数据挖掘领域的重要研究问题。经典的网络表征学习方法主要可以分为基于随机游走的方法、基于矩阵分解的方法和基于自编码器的深度学习算法三大类。其中,基于自编码器的深度学习算法虽然可以有效的发挥深度学习的强表示能力,但是存在两大严重问题。首先,该类算法的输入维度和所采用的深度自编码器的结构通常都与网络的规模严重耦合,因而无法高效的应用于大规模网络的表征
学位
《信息网络传播权保护条例》确立的“通知—删除”规则曾在网络服务提供者网络版权侵权认定中发挥过积极作用,但也存在适用场域限于著作权领域、适用的网络服务提供者类型较少、适用措施仅限于“移除、断开链接”等问题,难以适应规制网络知识产权侵权的现实需要。而旨在修正“通知—删除”规则的“通知—必要措施”规则在司法适用中也存在法律适用顺序、合格通知标准、必要措施的选择等问题。上述问题的解决对网络服务提供者在网络
学位
不论是在理论上,还是在司法实践中,违约精神损害赔偿制度一直以来都是倍受争议的话题。《民法典》第九百九十六的创新之举再次引起了理论与实务界对该制度的审慎思考与热烈讨论。确立违约精神损害赔偿制度是为了对人的精神权益给予更周密和更高程度的保护,实属实践之迫切需要。因而,本文以《民法典》第九百九十六的规定为中心展开论述,研究我国的违约精神损害赔偿制度。除引言和结语部分外,本文分为以下五个部分:第一部分介绍
学位