基于深度学习的水上场景识别

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:llyljl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
无人船具有安全性高、高效灵活、可以节约人力物力等优势,是一种新型的平台,具有很大的发展潜力,近年来受到了各个国家的关注。无人船在港口挂靠期间,需要根据所处场景控制船体航行状态,因此水上场景识别技术是无人船智能化发展的重要保障。尽管可以利用现有的基于深度学习的场景识别方法,从海量的视觉数据中学习到不同的模式,训练出具有泛化能力的模型对水上场景图像进行识别,然而针对水上场景图像存在的包含特征丰富、标志物较为突出等特点,将深度学习应用于水上场景识别任务仍存在诸多难点。针对水上场景识别技术进行研究不仅具有现实意义,而且具有理论价值。本文的主要研究工作如下:(1)建立水上场景数据集,根据水上场景数据集规模较小的特点,对VGG19网络结构进行改进,减少卷积层和全连接层的参数量,并在卷积层后进行了批归一化操作。通过实验比较分析在VGG19网络中加入批归一化层对模型识别精度和收敛速度的影响。使用改进后的VGG19网络结构对水上场景图像进行识别,运用Grad CAM技术对识别结果进行可视化,进一步分析卷积神经网络的内部工作原理,并针对水上场景图像特点进行分析,确定后续的网络改进思路。(2)通过对小尺寸卷积核和非对称卷积核的灵活应用,针对传统的Inception结构进行特征提取多样化和结构轻量化的改进,运用Inception提取多尺度特征的思想对传统的残差结构进行改进。在改进Inception结构和改进残差结构的基础上设计出一种深度可变的新型卷积神经网络,并将网络中的卷积操作分解成逐通道卷积和逐点卷积,以进一步实现模型的轻量化。针对该新型网络结构分析比较不同网络深度对水上场景识别准确率和模型参数量的影响,并探讨在网络中加入不同注意力模块对模型性能的影响。(3)针对双线性模型进行改进,增加输入数据的来源,提出一种结合局部特征和全局特征的水上场景识别模型。通过Edge Boxes算法提取水上场景图像中包含局部特征的区域,利用Ro I Pooling截取出局部特征区域与主干网络的输出特征图相对应的部分,得到局部特征图。通过对主干网络的输出特征图进行下采样,得到与局部特征尺寸一致的全局特征。最后使用双线性池化对局部特征和全局特征进行融合。
其他文献
光载微波干涉光纤传感技术利用光载波的微波包络在微波域中发生干涉,其在光学领域不受光波幅度串扰、偏振变化、模间干涉的影响,同时,微波因波长远远长于光波,其干涉仪的稳定性远远强于光学干涉仪,而且能更快地实现毫米量级以下的空间分辨率,得到微波光子学领域的重视。然而在当前技术水平下的电子系统中存在着各种难以消除的电子噪声,导致微波干涉条纹的频率经常波动,增加了测量的不确定性,通过软件或硬件的方式减少这种影
学位
随着我国经济与公路基础设施建设的持续快速发展,公路货运量和客运量保持高增长态势,公路安全成了保障全国经济发展的重要一环。保障公路安全离不开路面破损检测。传统的人工走查的检测方式成本高、检测时间长、受视觉主观性影响,并且可能危害检测人员的生命安全。因此,路面破损自动化检测方法的研究具有重要意义。目前,国内外的路面破损检测方法中,多数局限于对裂缝破损的检测,少数能检测多种破损,但检测精度不高。本文针对
学位
光纤布拉格光栅(Fiber Bragg Grating,FBG)是当前光纤传感领域中发展和研究潜力最大的光纤类传感器之一。对FBG大规模组网,通过波长漂移和位置信息,可以实现对复杂工况的分布式传感监测。在现有的技术中,基于干涉和时分复用的FBG波长解调系统具有大容量、解调速率高的优势,但由于使用的宽谱光源一般需要添加带通滤波器滤除底噪,而光源信号的相对强度噪声随带宽的下降而上升,导致系统的信噪比较
学位
在包括强度、波长、频率、偏振态等多种光纤传感调制形式当中,基于光学干涉的相位调制型光纤分布式声学传感(Distributed Acoustic Sensing,DAS)技术具有极高的灵敏度和广阔的应用前景。然而,在现有的光纤DAS系统中,普遍采用单波长或者合成波长进行光干涉测量和相位解调,其局限性在于相邻采样点之间的相位变化不能超π,否则必须提升解调系统采样率,这会极大地加重大容量长距离DAS阵列
学位
关系抽取作为自然语言处理中的重要研究领域之一,旨在发现半结构化与非结构化文本中存在的关系类别信息,在知识图谱的构建、问答系统的搭建和信息检索的优化等多个场景中都有着广阔的应用前景。远程监督研究以现有知识库的三元组信息对标待处理文本,减少人力资源投入的同时亦可获得较好的分类效果,是目前主流的关系抽取手段。然而受其基于的假设影响,生成的训练语料中不可避免地引入了标签噪声,如何减少训练过程中噪声数据对关
学位
声源定位在军事和民用领域具有广泛的应用和无可替代的价值,采用麦克风的声源定位技术是最主要的定位方法之一,但麦克风不具备遥感能力,不能抗电磁和射频干扰。光纤光栅分布式声学传感(Distributed Acoustic Sensing based on Fiber Bragg Grating,FBG-DAS)技术因为具有灵敏度高、体积小、抗电磁干扰和分布式远距离传感等优势,在某些领域已经替代传统麦克风
学位
碳化硅(Silicon Carbide,Si C)优异的物理化学性质使其可以在高温高压等极端环境下工作,被认为是最有前景的第三代半导体材料之一。但是Si C是间接带隙半导体,发光效率低,发光难度大,限制了其在光领域的应用。本文针对这一点,利用光子晶体结构和量子限域效应,设计了三层结构的二维光子晶体的Si C纳米薄膜,使用磁控溅射法制备了荧光Si C薄膜,增强了Si C的光致发光性能。(1)使用扫描
学位
图像重着色是图像处理的一个流行领域,被广泛地应用于美术、电影、色盲可视化等领域中,其关键是要根据用户的意愿,将图像中的某一部分的颜色自然生动的变成另一种颜色。基于调色板的图像重着色算法是近年来实现图像重着色的最热门的算法,但其在对复杂光照下的自然图像重着色时,实验结果产生了颜色失真,溢出以及光照信息变化等问题。针对上述问题,本文将自然图像重着色任务分为调色板提取和图像重着色两部分进行了研究,主要研
学位
脑卒中存在着高复发率、高死亡率和高致残率的问题,脑机接口(Brain Computer Interface,BCI)技术作为一种新的信息交流方式,能够有效应用于脑卒中领域的医疗康复。脑卒中患者通过运动想象(Motor Imagery,MI)脑电(Electroencephalography,EEG)信号可以完成对外部设备的直接控制,该过程具有自发性和积极性,有助于诱导患者进行大脑神经回路重塑,从而
学位
在当前的公钥密码体制中,对用户私钥保护的主要措施有专用密码硬件、可信执行环境、软token验证、秘密共享等等,其中专用密码硬件安全性高,但成本过高且不易携带;可信执行环境与软token验证成本相对较低,但容易受到黑客攻击。秘密共享对于用户私钥的秘密采取分开保存的方法,只有获取所有的秘密份额才能破解用户私钥,具有成本低、灵活性好、安全性高等优点。SM9是国家密码管理局发布的基于双线性对映射的公开密码
学位