端到端的单阶段水下目标检测算法研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:liongliong572
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,基于深度学习技术进行图像分析在计算机视觉领域备受瞩目,对水下图像中的目标检测技术在海洋资源的开发利用、推动海洋经济发展等方面都具有广阔的应用前景。然而,现阶段的水下目标检测仍然存在两个主要问题:(1)基于深度学习的目标检测算法大多以陆地场景图片为背景训练开发,在水下场景实际应用时,实测的检测性能离具体工程应用仍存在一定差距。(2)现阶段目标检测深度学习方法中,双阶段检测算法进行了两次回归和分类,计算量和模型的复杂度较高,难以直接在计算资源有限的水下嵌入式设备中应用,无法满足水下目标检测的实时性需求,单阶段检测算法的速度快但是精度偏低,难以做到检测精度与速度的平衡。针对当前深度学习算法在水下应用中存在的问题,本文基于单阶段的网络结构,提出一种端到端的单阶段水下目标检测算法,该算法对单阶段检测网络中的数据处理模块、特征融合模块、检测模块分别进行了针对性的改进,使之适用于水下目标检测,主要包括以下内容:(1)为了解决水下图像数据集中训练样本不充足的问题,本文提出了一种可扩展水下目标数据多样性的数据增强算法,并在训练水下图像的过程中,加入了该数据增强模块,使检测模型可应对复杂多变的水下场景,改善模型对训练样本数目的依赖性。在不引入额外的测试时间和计算资源成本的前提下,进一步提高检测的精度。(2)针对水下特殊的背景环境,对单阶段检测模型中的特征融合模块进行了改进。设计了多尺度膨胀卷积模块对提取到的图像特征进行归一化处理,弥补了原有结构对低分辨率水下目标特征的压缩过程中信息缺失严重的问题。并且通过交替上下采样的方式对相邻的特征组进行双向融合,改善了原结构中自顶向下的单向融合路径没有充分利用上下文语义信息的问题。(3)提出了一种可自主筛选任务相关有用信息的检测模块,对检测模块中两个分支(分类和回归)的网络结构进行了针对性的改进。通过在检测模块的各任务分支上部署双重注意力机制,使得网络能够根据不同的训练任务自主地从特征图中选择感兴趣的区域,提高网络对有用信息的关注能力。(4)通过融合上述针对单阶段模型各个模块的改进策略,本文设计了一套适用于水下图像的、支持端到端训练的单阶段目标检测算法框架。然后,通过在边缘计算设备——Jeston Xavier NX开发板上的部署和测试,证明了该算法在小型嵌入式设备上应用的可行性。最后,基于URPC水下数据集的实验结果表明,相较于现阶段主流的深度学习目标检测方法,本文所提出的端到端单阶段水下目标检测算法具有更高的检测精度和速度,在训练样本不足的情况下,仍然可以取得较好的检测效果。并且,在基于边缘计算的小型嵌入式设备上,验证了本文所提算法的实用性,为本文内容未来可能的实际工程应用奠定了坚实的基础。
其他文献
随着道路和高速公路上汽车数量的不断增加,道路上的人车碰撞事故不断发生,造成了大量的财产流失。研究人员和执法机构重视解决驾驶车辆和行人的道路安全问题,通过设定车速限制、车道行驶方向、人车分流等相关措施,来规范交通运行,提升道路运行的安全与运行效率。基于上述措施,本文提出了一种方案:通过摩擦纳米发电机和磁耦合无线传输系统,来统计人行道上的人流量,并且通过设计的双端值电容式传感器来实现识别人车的功能;此
学位
纳米氧化铁是锂离子电池和超级电容器的一种重要负极材料。然而氧化铁自身电导率低,且充放电过程中的体积效应会导致电极破坏,影响其倍率及循环性能。制备纳米氧化铁与石墨烯复合材料是一种重要的解决途径,然而已有的研究主要采用氧化石墨烯基底,不仅制备成本高,碳环的破环也使导电性能变差。超声法制备的多层石墨烯制备简单,表面碳结构完整,具有良好的导电性能,可以为纳米氧化铁提供良好的基底。然而其表面由于没有活性基因
学位
随机共振(Stochastic Resonance,SR)是一种奇特的非线性现象,利用噪声来增强信号,提高信噪比。这种将噪声视为有用成分来增强信号的特性,与现有噪声去除方法将噪声视为有害成分去除的思路不同,为信号去噪带来了新思路。随着CMOS/CCD图像传感器的广泛应用,信号依赖噪声已经成为了视觉信息噪声的重要形式之一。而现有随机共振的理论研究中,驱动非线性系统的噪声一般为高斯噪声或者与信号无关的
学位
氢燃料电池因能量转换率高,污染小的特点,使其成为替代传统燃油动力的最佳备选方案之一。因此,如何高效制备氢气在这项技术中尤为重要。电解水制氢方式节能环保成本低,目前已成为一种具有发展前景的制氢方式。然而,在实际应用中,提高制氢效率的电催化剂往往采用昂贵稀缺的贵金属材料(Pt、Pd等),高昂的成本限制了它们的大规模商业应用,因此设计和开发高效且稳定的非贵金属基电催化剂具有十分重要的现实意义。过渡金属镍
学位
自供能无线传感在太空探索、工业生产领域以及环境监测等领域有着十分广阔的应用场景。然而,目前大多数的自供能传感器都是通过收集能量,储存能量和能量管理等芯片模块的集成系统来实现的,收集的能量要在多个模块间进行转换,造成极大的能量浪费,能量收集效率极低,长时间的能量收集仅能够提供给系统工作极短的一段时间,无法实现传感信息的实时采集,而传感信息的实时性则是环境监测中十分重要的参数。在本研究中,我们提出了一
学位
触觉传感器可以检测压力、摩擦、滑移、温度和物体形状等信息,广泛应用于智能电子设备、医疗器械以及机器人工业领域。由于它不仅能够检测接触压力、相对滑移等信息,还能够提取所接触物体的形状、大小以及刚度信息,准确提取物体的物理特征,因此广泛应用于机械手或机器人皮肤,实现触觉感知功能。针对现有触觉传感器解耦困难、功能单一等缺陷,本论文设计了一种基于自身结构解耦的MEMS多维触觉传感器,能够实现三维力和二维力
学位
大量神经元经突触连接而形成复杂网络,其变化与人类情绪、运动、思考等认知活动息息相关。受限于神经成像技术,目前还只能在宏观尺度上进行无损非侵入式脑网络研究。其中脑功能连接能够直接反应脑区神经活动情况,在认知研究与神经疾病临床诊断中得到广泛应用,其构建及拓扑特性分析一直是脑科学领域的研究热点。不同生理或心理条件下,脑区间功能连接具有独特性,且是动态变化的。本论文针对正常老年人、轻度认知障碍患者、阿尔兹
学位
近年来,随着无线通信技术的飞速发展,射频收发机的应用场景越来越多。射频前端芯片是无线通信的基础,射频收发机的性能直接影响终端的通信质量。由于工艺和应用场景的不断变换,以及高频处严重的趋肤效应和寄生效应,设计高性能的射频收发机越来越困难,作为射频收发机的关键组成部分,高性能的混频器和压控振荡器具有十分重要的研究价值。论文首先介绍了国内外混频器和压控振荡器的研究现状并总结出论文的研究意义,然后是混频器
学位
为了追求低延时下的高传输速率,现第五代移动通信(5G)系统采用复杂多样的调制方式,且主要分布于Sub-6GHz和毫米波频段两大区域,从而对5G基站的综合性能提出了更严苛的要求。而功率放大器的能耗、线性度和响应时间等指标都对5G收发机具有决定性的影响,因此对射频功率放大器的结构尺寸、功率回退效率、带宽等输出性能进行深入研究的目的就是为了让它满足5G通信系统的设计需求。本文分别对功率放大器的小型化、高
学位
摩尔定律自提出以来,一直指引着半导体产业的发展,促使集成电路工作速度不断提高,然而互连线尺寸的缩小会导致互连电阻增大和其他寄生效应,互连线性能急剧恶化,碳纳米材料具有高迁移率和大动量弛豫时间等优良的电学性能,因此被用于片上互连研究,以减小片上互连时延。此外,芯片上各单元模块也都离不开螺旋电感器,因此探索基于碳纳米材料的片上螺旋电感具有重要意义。本文首先引用了传统金属和碳纳米材料分布式等效电路模型,
学位