基于深度学习的航拍图像小目标检测技术研究

来源 :兰州交通大学 | 被引量 : 0次 | 上传用户:djnm080910
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本中国无人机厂商所生产的各类产品正在满足越来越多的行业需求,如紧急救灾、警务安保、土地测绘、电力巡检、农业植保和交通监控等。这使得无人机的应用具有广阔的市场需求和未来前景,在将计算机视觉中的深度学习技术和无人机航拍技术相结合的智能系统中,对所得图像中的目标进行检测与识别是其中举足轻重的步骤。在常规场景目标检测任务中检测结果良好的模型在航拍图像检测中结果通常一般。因此针对航拍场景中检测对象的特性来构建相对应的检测模型具有很大的研究意义。本文从多个角度对现有模型进行分析,然后对所存在的问题进行改进,设计并实现了一阶段无锚点框检测模型,并且使得检测精度较基准模型有所提升。本文的主要工作包括以下几个方面:(1)本文提出了多尺度特征和预测融合网络来构建特征金字塔构,能够将高低特征层的通道信息充分利用,使得最终构建的特征金字塔的各层级特征图更具表征能力,提高目标检测精度。通过在Vis Drone2019数据集上进行消融实验,证明本文所提出的多尺度特征和预测融合网络能够使得检测精度有所提高,相比基准检测器精度提高了5.3%。(2)本文提出了一种基于亚像素卷积的上采样方法,它与反卷积大不相同,不会被棋盘伪影所影响,降低重新构建高分辨率特征的功能,这种上采样方法可以大大提升所构建特征金字塔的能力。通过在Vis Drone2019数据集上进行对比实验,证明本文提出的上采样方法能够有效提升检测精度,比反卷积方法AP值提高0.9%。(3)本文使用了一种无锚点框检测模型,不需要对锚点框的超参调整优化,模型调整参数的困难程度下降。与使用锚点框的检测模型相对比,本文设计的一阶段无锚点框检测模型可以大大提高检测精准度,并降低模型复杂度。实验结果表明,与基于锚点框的检测模型相比,本文提出的模型在Vis Drone2019、UAVDT和DIOR上检测精度分别提高1.8%、0.5%和0.7%。并且在英伟达GTX 1080Ti独立显卡上的推断速度达到11.7FPS,相比基于锚点框的检测模型提升1.1FPS。
其他文献
学位
随着工业化的快速发展,资源短缺成了制约人类社会发展的原因之一,海洋成为人类获取资源的重要途径。水下机器人是人类探索海洋的重要技术手段,机器视觉的发展是水下机器人作业的先决条件。海洋图像作为水下环境最直观的反映,清晰的海洋图像对水下作业至关重要。由于水下环境的高度复杂性,光传播过程中受到水介质吸收和散射,使得获取到的水下图像往往存在轮廓不清晰、对比度低以及颜色失真等诸多问题,严重影响了水下成像的质量
随着网络技术的高速发展,大数据、云计算等信息技术不断被提出,这些技术的实现都离不开海量的数据交互,这就要求通信网络要具有大容量高速率低时延的特点。扩展频谱资源可以实现大容量高速率的通信目标。毫米波频段(30GHz-300GHz)可用频谱资源丰富,合理开发利用可以解决目前频谱资源紧张的困境。论文围绕对毫米波的开发利用,聚焦于W波段(75-110GHz)毫米波的生成展开研究。(1)论文首先对毫米波的研
学位
随着信息化时代的到来,计算机视觉得以迅速发展,如今被广泛应用于人工智能、自动驾驶、医疗影像和军事检测等领域。然而,近年来大气污染逐渐加重,雾霾天气出现的频率越来越高,导致户外成像设备不能捕捉到高质量的清晰图像,无法正常运用于计算机视觉系统。所以,对雾天降质图像进行去雾处理已经成为研究学者们关注的热点问题。论文详细研究了有雾图像的形成机理,将大气光成像模型作为理论基础,详细介绍了暗通道先验去雾算法,
无线闭塞中心(Radio Block Center,RBC)是CTCS-3(Chinese Train Control System at level 3,中国列车运行控制系统应用等级3)级列控系统的地面核心设备,其高效、安全运行是高速列车安全运营的重要保障。目前,关于RBC风险评估的研究相对较少,且传统评估方法中指标权重受主观因素影响较大,这使得评估结果与实际情况存在一定的偏差。为了完善RBC的
学位
学位
目前,铁路综合数字移动通信系统(Global System for Mobile CommunicationsRailway,GSM-R)已经普遍应用到我国各大高铁建设中,比如京沪高铁以及本文项目背景银西高铁等。虽然GSM-R系统普遍应用在高铁建设之中,但如果网络节点搭建不合理,后期可能要对基站重新选址建造,极大地浪费建设成本。因此本文首先利用数据挖掘算法在不同的外界环境下构建无线场强覆盖预测模型
计算机视觉是人工智能领域中的一个热点方向,通过模拟生物视觉,对捕捉到的图像数据进行理解与识别,从而实现视觉任务的自动化,并被广泛应用到自动驾驶、医疗、安防监控等领域。然而,在不良天气状况下(如雾、霾天气),输入图像的质量会严重影响视觉任务的精度与表现。在雾、霾环境下,由于空气中存在大量的悬浮气溶胶颗粒,使得成像系统采集到的图像具有较低的可见度和对比度,进一步阻碍了计算机对图像信息的分析与提取能力。