基于深度学习的声呐图像目标检测算法研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:waxs8520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
水下目标检测作为诸多水下作业的先决条件之一,通过区分水下多类别目标的不同个体并准确定位,为观测者对水下探测的深入研究提供保障。而声呐图像目标检测作为水下目标检测的关键任务,具有高频,高分辨力,多波束及实时性强的特点,在工业及军事等诸多领域均有着广泛的应用价值。因此面向声呐图像的目标检测任务对于水下探测具有重要意义。
  然而传统目标检测算法无法满足声呐图像目标检测任务对处理效率、性能及智能化等方面所提出的要求。本文引入基于卷积神经网络的深度学习技术以满足高性能检测的需求。但现有的深度学习目标检测方法未考虑声呐图像自身的物理特性及缺陷,面临着两大问题:其一是声呐图像质量受噪声干扰严重,但目标检测模型缺乏噪声鲁棒性;其二是可获取的声呐图像数据稀少,且不同环境条件下获取的声呐图像物理特征具有较大差异。
  基于上述两大问题,本文分别从模型结构改进及数据集扩充两个角度进行探究,开展了以下三方面的研究工作:
  1、针对声呐图像目标检测任务中,现有模型在结构上的缺陷,通过分析声呐图像的噪声形成方式及特点,设计了基于对抗学习的噪声对抗网络及噪声模块。具体地,首先分析基准模型在声呐图像目标检测任务下的缺陷,其次分析了声呐图像生成过程中的噪声特性,即以海底混响作为主要外部影响,产生幅度服从瑞利分布的噪声。进而设计符合声呐图像物理特性的噪声对抗网络及噪声模块,将样本的高维特征作为输入,按照无监督方式生成噪声参数并生成符合声呐图像物理特性的噪声,利用瑞利分布对应的乘性噪声模型与原始特征相结合生成对抗样本,并作为决策项参与网络训练。实验结果表明,噪声对抗网络与噪声模块的引入有效提升了目标检测网络对声呐图像的检测准确性及噪声鲁棒性。
  2、针对声呐图像目标检测任务中数据量不足的问题,通过分析声呐图像的成像过程,设计了基于编码-解码的多尺度生成对抗网络,以改善声呐图像样本数量稀少的现状。具体地,首先分析声呐图像的生成过程及反演模型,进而根据反演模型设计了符合声呐图像物理特性的生成对抗网络。通过在生成对抗网络中引入声呐图像的先验信息并进行编码及解码操作,结合生成网络中各层级不同尺度的特征,生成符合声呐图像特点的样本。实验表明,本文方法生成的样本在两种判别指标上高于基准方法;将生成样本引入数据集可有效提升声呐图像目标检测的准确性。
  3、同样针对声呐图像目标检测任务中数据量不足的现状,通过分析声呐成像的反射模型,设计了基于朗伯体反射模型的声呐图像对抗攻击方法,为目标检测数据集扩充提供另外一种思路。具体地,利用朗伯体表面反射模型的特性,将原始声呐图像通过反射模型参数化为三组海底特征值的表示形式,并利用反射模型全程可微的特性,使得原始样本在梯度方向上进行变化从而生成对抗样本,进而使得卷积网络对于该样本产生误分类结果。将生成的对抗样本作为原始训练集的补充,进一步提升了目标检测任务的准确性。
  最终本文总结了上述工作的特点及不足,归纳出有待深入探究的研究方向及问题。
其他文献
协同众包是指需要多人共同合作完成复杂任务的众包。由于工人需要相互协作才能完成任务,因此工人之间的协同代价是影响团队合作效率和质量的重要因素。与以往团队形成问题中基于社会网络通信成本计算协同代价模型不同的是,本文基于工人对互相之间协同情况的反馈计算工人之间的协同代价。所以,本文首先基于工人反馈研究复杂任务被分解后的协同众包团队形成问题,然后在该研究的基础上,本文针对工人的不诚实性和工人的信誉因素对问
学位
图像超分辨率技术是指通过软件算法来提高图像的空间分辨率并恢复更高频率的细节信息,从而获得更丰富的图像内容。如今,图像超分辨率技术在视频处理领域获得了更多的关注,视频超分辨率成为研究热点。得益于硬件成本低、部署难度小等优势,视频超分辨率技术可以嵌入在录制、传输、播放、应用等各个阶段,对于提高成像质量、降低传输带宽、改善视觉体验、优化智能应用等方面均可起到突出作用,具有极高的应用价值。本文主要关注视频
学位
近年来,实值神经网络(Real Neural Network,Real NN)在学术界和工业界受到广泛关注,网络的构造、推广及其合理的解释是当前人工智能应用基础理论研究的重要研究内容。作为深度学习的经典学习模型,实值卷积神经网络(Real Convolutional Neural Network,Real CNN)在语音识别、图像处理、医学辅助诊断等领域均取得了显著成果,但是它的网络结构中通常不考
近些年来各行各业高速发展,对人才的选择日趋重要,人才选择最重要的是人才评估。尽管当前招聘形式种类多样,但人才评估依赖于学历证明的情况并没有发生改变,这导致学历造假现象层出不穷。此外,各大企业招聘人才需大量笔试、面试,导致招聘效率低下,且应试型考试能够考前突击,从而取得很好成绩,并不能真实评估人才水平。基于学习经历大数据(以下简称学历数据)生成学生画像,进而实现客观人才评估的方法,近年来受到了很大关
学位
近年来,随着智能设备的普及,移动应用得到迅速的发展。这些应用往往依赖于基于位置的服务,通过使用用户的坐标位置或者语义/逻辑位置为用户提供个性化服务内容。基于位置服务的应用对用户位置信息的访问带来了严重的隐私隐患,为了使用户在获得基于位置服务的同时保障其隐私不受侵犯,研究者们针对位置隐私定义以及隐私与功能之间的最优化权衡展开了研究。  现有的隐私定义主要基于信息论和差分隐私这两个概念,且主要针对用户
学位
随着网络信息技术的不断发展,互联网已经成为国民经济和社会发展的重要基础设施,各类业务与应用对网络基础设施的可扩展性和健壮性要求达到了新的高度。IETF提出的新一代网络管理协议 NETCONF,以及用于描述网络配置和状态数据的 YANG 模型,可以降低人工运维成本,使网络运维趋于自动化。  然而由于业务现实等因素,各家厂商和标准化组织构建的YANG模型存在异构性,不同来源的YANG模型在语义上难以统
学位
近年来,传统数据中心网络的性能已经无法满足分布式应用日益增长的网络需求,新型的低延迟数据中心网络应运而生。低延迟数据中心网络的核心技术是RDMA,即远程直接内存访问技术。RDMA本质上是将协议栈卸载到硬件中,实现了内核旁路技术,避免了传统网络中数据从用户态到内核态的拷贝开销,同时省去了内核处理的开销,为数据中心分布式应用提供了低延时和高带宽的性能优势。RDMA 与数据中心应用的结合使得传统的基于T
学位
X射线数字化放射成像(DR,Digital Radiography)使得医生在无创条件下,能够初步掌握关于病人病情和病灶的基本信息,在众多疾病的医学临床检查和诊断中扮演着不可替代的重要角色。为了降低电离辐射可能带来的致癌风险,低剂量成像是目前临床应用的必然趋势。然而降低辐射剂量将引入大量噪声,导致成像结果严重退化。近年来,随着硬件技术的发展和深度学习理论日渐成熟,基于卷积神经网络的图像噪声抑制研究
学位
近年来,随着证书的普及,学历造假、隐私泄露等事件层出不穷。已有的解决方案大多是基于传统的中心化数据库存储技术,会造成数据丢失、泄露且难以恢复的情况,存在一定的弊端。即便能够保证数据可信,但单凭学历证书也并不能完全代表一个人的能力。  区块链技术的提出为解决上述问题提供了新的思路。学程链是一个基于区块链的学历鉴证平台,它通过将学生全周期的学习经历数据、数字身份存储于区块链上,保证学生数据安全且不可篡
肾癌是人类最常见的十大癌症之一,在治疗肾癌以及肾脏的另一些良性肿瘤方面,外科手术是最佳选择。其中,保留肾单位手术(Nephron Sparing Surgery,NSS)是治疗肾肿瘤的一种有效方法。NSS手术前需要进行计算机断层扫描增强造影(Computed Tomographic Angiography,CTA)确定位置、大小等信息,为此需要在 CTA 图像中进行肾脏定位,并对手术相关组织边缘进
学位