基于卷积神经网络的水下图像增强及目标检测算法研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:superzf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类向海洋进军步伐的加快,人们日益习惯借助水下机器人(ROV)替代人工完成水下作业任务,例如水下搜寻与排查,水下领航以及海洋养殖捕捞等,但是水下图像存在色偏、模糊、背景复杂、目标生物尺寸变化大等问题,且ROV计算量有限难以部署大型模型,基于上述问题,本文主要围绕水下图像清晰化处理,水下目标检测,以及目标检测模型轻量化的技术难点开展研究:(1)水下图像清晰化处理。针对水下图像存在色偏、模糊、背景复杂等问题,本文利用水下成像与雾天成像的相似性,基于残差除雾的网络的思想,提出将残差结构用于水下图像去噪音处理。为有效的学习更多特征信息,首先,提出基于U-Net网络架构的编码器-解码器,并利用多尺度跨区域连接的方式提取特征信息。其次,使用级联残差组合模块与RFB-Net增强网络对不同尺度特征信息的提取能力,促进网络收敛。最后,用图像融合方法对输出的图像进行色彩与对比度的调整,输出接近真实色彩和对比度的图像。(2)平衡水下目标检测精度与速度。鉴于水下目标检测网络对精度与速度有了更高需求,本文提出以YOLOv5作为基础网络进行改进。改进网络检测层,将网络改为4尺度检测结构,改善小目标漏检的问题。然后,引入坐标注意力,使用多支路聚合的方式,将特征信息进行融合,提升坐标预测精度。最后,修改网络的边框回归函数,训练中使用CIOU计算边框损失,在目标检测的测试过程中,使用DIOU-NMS(非极大值抑制函数)筛选预测框。(3)目标检测轻量化。为实现水下目标检测网络轻量化,使用深度可分离卷积替换标准卷积降低网络计算量,提出了一种目标检测模型的轻量化方法。首先,借鉴Shuffle-Net网络结构,将YOLOv5网络模型的Backbone主干网络进行替换。其次,为提升小比例样本的检测精度,使用Mosaic-Mixup对数据进行预处理,增加样本所占比例。
其他文献
当今社会生产生活中,众多领域都将计算机视觉技术运用到了实际当中,如视频监控、机器人探测以及无人机侦察等。目前已有大量工作对正常照度目标检测技术进行了研究,但对低照度图像目标检测的研究却很少。在整体光照不足或局部光照不均的场景下捕获的图像普遍存在照度偏低、对比度不足和细节信息严重丢失等问题。这些问题致使低照度图像无法包含足够的信息量,同时低照度图像捕获条件相对苛刻,且目标标注难度较大,需要耗费大量的
学位
本文主要以课堂实践案例“探秘二分法”为例,界定和探讨了深度学习视域下的高中信息技术学科项目化学习,并从特点、目标、内容、过程、评价等方面逐一进行了剖析。
期刊
<正>该模式不再是简单地开设专区,而是从系统、从支付角度进行改革,解决药店集采药品进价高、进货难、无处方等问题,药店将深度参与集采。国家组织药品集中采购虽已走过三年历程,但目前基层定点医药机构集采药品、国家谈判药品配备率低,无法满足基层群众购药需求。为打通集采药品和国家谈判药品落地的“最后一公里”堵点,5月中旬,江苏省医疗保障局发布《2022年度江苏医保民生实事项目》,列举了12条惠民便民措施。其
期刊
肺癌是一种发病率高且死亡率高的恶性疾病。作为肺癌的一种早期症状,肺结节的出现预示着肺部细胞正在逐渐发生癌变。肺结节一般为椭圆形或不规则球形,不同大小、形状、密度分布、生长速度的肺结节对应着不同的肺癌发病率,因此,针对肺癌的早期诊断,肺结节检测是一种有效的方法。利用计算机进行肺结节检测方法的设计与优化一直是各领域专家学者不断探索的方向,它能够缓解因医生人工分辨而带来的医疗资源紧张的问题。随着深度学习
学位
从目前大同发掘出土的元代墓葬及壁画来看,以水墨山水特征为主的元代壁画与题材多样的辽金壁画呈现出完全不同的表现风格。大同地区墨色系壁画的流行与当时的绘画风格、宗教思想以及高压政权下的士人情感寄托有着必然的联系。墨色系壁画的出现与兴盛是汉族人士对世俗社会不公待遇的无声抵抗,也是他们表达内心愤懑情感的重要方式。
期刊
图匹配旨在建立两个图之间的结点映射关系,是一个经典的NP难组合问题。近几年,大量的研究者开始借助深度学习技术来构建端到端的可训练架构,以此对图匹配问题进行求解。这一端到端的管道架构被称为深度图匹配模型,其包含两个重要模块,图表示学习模块和图匹配问题求解器。然而,在目前深度图匹配模型研究中,存在着两个待解决的重要问题。第一,主流的深度图匹配模型通常对图匹配问题进行连续松弛,以使得模型可以基于梯度下降
学位
基于核心素养视域下“深度学习”的内涵、意义以及初中化学学科“深度学习”与“发展核心素养”的关系,以“知识问题挑战性与驱动性、情境创设愤悱化与生成化、问题解决自主化与迁移化”的理念设计了“化学实验测定与探究”课例。阐释了以真实情境为主线、聚焦活动、方法指引、素养观照与评价导向五线融合的深度学习教学模式。
期刊
在当今大数据时代,数据高速无限产生,如何处理和存储海量数据成为一个巨大的挑战。数据源源不断地产生以及高速的特点,使得人类专家不能快速准确地给所有样本都打上标记。人工标记样本的代价十分昂贵且不切实际。因此,在真实的数据流环境中,往往只有少量标记样本和大量无标记样本,只使用标记样本训练得到的模型泛化能力低下,而且会浪费无标记样本的结构信息。同时,在数据流环境下,数据分布经常会发生变化,即在真实的数据流
学位
食作为旅游六要素之一,在旅游活动中占有重要地位。信息技术快速发展为旅游业带来新的发展机遇,在线餐饮平台已经成为游客获取信息和表达观点的重要途径,在这过程中产生了大量评论文本。用户直接从海量数据中获取有效信息有很大难度,利用情感分析技术能够自动抽取评论文本中所蕴含的观点。通过对评论文本进行方面挖掘以及情感分析可以得到不同方面的情绪表达,为游客在陌生的旅游环境提供丰富的决策参考信息。本文基于餐饮评论文
学位
在PPP项目中,政府和社会资本建立了伙伴关系,为实现风险共担、收益共享,双方针对股权比例分配和特许经营定价展开博弈。基于此背景,本文研究了在完全理性和考虑公平偏好两种情形下的博弈模型,既丰富了PPP股权结构博弈模型的理论研究,也为PPP项目双方的决策提供了管理学启示。本文首先,通过广泛的文献调研,梳理和总结了国内外学者对于PPP项目融资、股权结构及公平偏好的研究现状,表明将决策者的行为偏好引入股权
学位