基于融合机制的航拍目标检测与识别

来源 :厦门大学 | 被引量 : 0次 | 上传用户：wo19881026

【摘要】

：

【作者】

：

丁瑶

【出处】

：

厦门大学

【发表日期】

：

2020年07期

【关键词】

：

航拍图像目标检测海面舰船

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

伴随着成像设备的更新换代和航拍技术的迅速发展,人们捕获了大量的高清航拍图像,随之而来的是新的检测任务,即如何有效、快速地检测并识别出航拍图像中的特定目标。航拍目标的检测和识别在军事、民用等领域发挥着至关重要的作用。然而,航拍图像具有如图像尺寸过大、小目标众多、目标尺度多样化、背景复杂、宽高比差异大、目标排列紧密等特点,给检测带来了困难,使得基于通用目标设计的深度检测模型对航拍目标的检测效果并不理想。本文收集和构建了多种航拍图像数据集,对多类别航拍目标的检测与识别以及舰船检测问题展开深入研究,有针对性地改进了检测模型,融合了图像的多线索信息。研究内容和主要贡献包括以下几个方面:第一,提出了基于多线索融合的特征金字塔网络的航拍目标检测与识别(Multi-Cue Fusion based Feature Pyramid Network,MCF-FPN)。针对航拍图像中小目标众多、目标尺度多样化的问题,本文充分利用图像的多尺度特征线索,引入特征金字塔网络,实现了对多类别航拍目标数据集DOTA中的多尺度目标的检测。通过瓶颈模块、可变形卷积模块等获取各个特征层上的语义信息,用于更好地检测和识别,减少复杂背景的干扰。此外,针对航拍目标排列紧密的问题,本文提出了类别敏感的soft-NMS算法,并利用图像金字塔的思想,通过多尺度测试策略将图像的多尺度信息作为线索进行融合,进一步提高每个类别目标的检测精度。实验结果表明,在DOTA数据集上,MCF-FPN可以有效提升DOTA中的每个类别的检测率,与当前基于特征金字塔网络(Feature Pyramid Network,FPN)的改进算法具有可比性。第二,提出了基于多尺度感受野的R-CNN网络的航拍目标检测与识别(Multi-scale Receptive Field based R-CNN,MRF R-CNN)。为了提升基于深度模型的目标检测算法对航拍目标的检测速度,本文将Light-Head R-CNN网络用于航拍目标的检测,并针对航拍目标尺度多样化的问题,设计和融合了具有不同感受野的特征图作为特征线索来提升网络的尺度不变性。本文将图像的多尺度信息作为线索,在测试时进一步融合,提升网络在DOTA数据集上的检测精度。实验结果表明,在DOTA数据集上,与当前基于R-FCN改进的目标检测算法相比,MRF R-CNN的检测精度更高,在小目标的检测效果上尤为显著,检测速度也更快。本文将模型在含小目标较多的航拍舰船数据集Kaggle上进行测试,进一步验证了模型的鲁棒性和泛化性。第三,提出了基于特征选择的Det.Net 59网络的海面舰船检测。为了快速而有效地检测和识别海面上的军舰和民船目标,本文将IIR_SC数据集作为研究对象,将Det.Net59网络用于海面军舰、民船的检测。通过在Det.Net59网络中引入特征注意力机制,针对性地选择和融合特征线索,并将感兴趣区域池化层替换为感兴趣区域对齐层,提升了模型对海面舰船的检测精度。实验结果表明,本文提出的轻快的模型能将检测速度提升到约每秒50帧的速度,达到实时。

其他文献

基于掏空动机视角的控股股东股权质押研究

随着全球经济和资本市场的蓬勃发展,股权质押作为一种新的融资方式越来越受到大股东的青睐,股权质押是指出质人以其所拥有的股权作为质押标的物而设立的质押,在质押过程中,股东在将股权价值变现的同时仍然保留了控制权,并因此受到了广大股东的欢迎。然而,股权质押并非是毫无缺陷的,不仅会使得控制权和现金流权分离,这种两权分离构成了掏空的诱因,并在能够使控股股东保有控制权的情况下方便的使用其他掏空手段进一步实施利益

学位

控股股东股权质押掏空

上海港船舶排放控制区效果及提升策略研究

近年来,船舶污染物的排放问题受到越来越多的关注。船舶排放是主要的大气污染源之一,船舶排放的大气污染物中,主要包括氮氧化物、硫氧化物和颗粒物等。设立船舶排放控制区(Em

学位

船舶排放控制区(ECA)燃油转换相关方博弈减速航行接用岸电

基于特征编码的三维检索技术研究

随着三维建模和三维扫描技术的不断成熟,三维模型的获取变得越来越容易。相对于平面的二维图像,立体的三维模型能够给人更直观的视觉感受,符合人类的认知习惯,被广泛地应用于

学位

三维检索特征编码距离学习

投资组合视角下的运动员经纪人行为影响因素

自我国改革开放以来,国民经济飞速发展,我国职业体育也随之迅速发展,职业体育作为体育经纪行业的根基与土壤,其良好的发展势态也标志着我国体育经纪行业进入了新的发展时期。

学位

运动员经纪人经纪人行为投资组合理论委托代理问题

基于多源数据融合的支持向量机模型

21世纪是大数据的时代,计算机技术飞速进步,数据的获取和储存都变得十分便利,数据的数量和形式都不可同日而语,很多部门每天都有巨大数量、不同形式的数据产生。大数据是由主体、来源和形式都不同的数据合并而成,不同数据集由于数据来源不同,彼此之间存在一定的差异性,但研究同一课题时,同样的解释变量和被解释变量在不同数据集之间又存在一定的关联。正是因为大数据具有数据来源差异性、高维性及稀疏性等特点,在对于多个

学位

多源数据整合分析支持向量机

小球藻病毒来源启动子活性分析及在苏氨酸生物合成中应用

对大肠杆菌等平台生物的代谢途径进行改造,积累有用代谢产物是现代发酵工程和合成生物学的核心内容。启动子是基因调控和代谢途径改造的重要调控元件,通过改变启动子的启动活性可以调控目的基因的转录水平以积累代谢产物。本实验室的前期工作用鸟枪法从小球藻病毒基因组随机片段中筛选到一组小球藻病毒强启动子N63,N37,N40;利用RT-qPCR检测了这些启动子控制下的报告基因转录文本丰度,用RACE-PCR确定了

学位

小球藻病毒启动子转录活性分析苏氨酸生物合成流式细胞术实时荧光定量PCR

可交换债券定价合理性研究

可交换债券的起源要追溯到上世纪70年代的美国,此后四十多年里,可交换债券在欧美、日本等发达地区已经得到了蓬勃的发展,形成了较为完整的体系,然而在我国,可交换债券仍然处

学位

可交换债券定价蒙特卡罗模拟

基于深度学习的网络文本情绪分类研究

随着网络的普及与发展,越来越多的使用者通过网络发表信息和交换个人意见,造成了网络中信息数据的爆炸式增长。由于网络的开放性和包容性,大量的信息充斥在网络环境中,实时监

学位

内容安全LSTM文本情绪分类特征融合深度学习自然语言处理

基于三维运动捕捉的人体步态特征及稳定性研究

中国已进入老龄化社会,老年人的健康护理问题越来越受到人们的重视。随着年龄的增加,下肢相关肌肉逐渐衰退,老年人跌倒情况时常发生。跌倒不仅会影响老年人的生活质量,还会增

学位

步行助力机器人零力矩点步行差异动势能交换率步态检测

两种球兰植物内生真菌多样性及系统发育比较研究

球兰属(Hoya R.Br.)为萝藦科(Asclepiadaceae)多年生常绿蔓性草本植物,具有很高的观赏价值和药用价值。中国是球兰属植物的主要分布区之一,主要分布于南方热带和亚热带地区。

学位

两种球兰内生真菌多样性系统发育比较

基于融合机制的航拍目标检测与识别

其他学术论文