基于Mask R-CNN的水下生物目标识别研究

来源 :广西大学 | 被引量 : 0次 | 上传用户:wangji239
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
精准的水下目标识别能力是水下机器人高效作业的保证。但是,在复杂多变的水下环境,设备采集到的图像普遍存在光照不均、对比度低、蓝绿色调、画面模糊等一系列问题。此外,受限于水下拍摄所需要的大量人力和物力,水下数据采集难度大,高质量的水下生物数据集极其缺乏,并且生物类别不够丰富,这给水下机器人基于光视觉的目标识别研究带来了很大的挑战。针对水下生物图像样本不足和图像质量差的问题,本文以海星、海胆、海参三类水下生物识别为例,提出了一种结合图像增强和Mask R-CNN框架在小数据集情况下实现水下生物目标检测和实例分割的方法。本文完成的主要研究工作如下:1)自建数据集及数据集增广。针对高质量的水下生物图像的缺乏以及其带来的深度模型过拟合问题:首先,通过人工打标签建立了包含84张图片、501个生物的初始数据集;然后,使用包括GAN(generative adversarial networks)在内的图像增广方法将数据集扩充到430张图片,包含2262个生物,为模型训练中的迁移训练、冻结训练创造条件,克服小样本情况下的过拟合现象。2)水下图像的增强技术。为解决水下图像质量差对目标识别的不利影响,从提高目标识别率的角度提出了一种改进的MSRCR(multi-scale Retinex with color restoration)图像增强算法。该方法不但大幅地提高了水下图像的观感,而且使水下图像的色彩分布更加均衡,有益于提高Mask R-CNN对水下生物的识别率。此外,还将该方法和暗通道先验、MSRCR、限制对比度直方图均衡等图像增强方法对比,从主观的视觉观感到传统的评价指标(信息熵、清晰度、对比度)和提高Mask R-CNN框架的识别率方面,验证了所提图像增强算法的有效性和先进性。3)基于Mask R-CNN的多目标多类别目标识别研究。首先,针对所使用的水下生物图像中待辨识的生物个体绝大多数是小目标的情况,对标准的Mask R-CNN框架做了适当的微调,并通过迁移学习和冻结训练,在经过图像增强后的数据集上进行多目标、多类别水下生物目标检测和实例分割,取得了98.20%的准确率、95.34%的召回率和95.09%的m AP(mean average precision)值。然后,再与YOLOv3(You only look once)、SSD(Single Shot Detector)和一种基于SIFT(Scale-invariant feature transform)的目标检测方法对比,进一步验证了本文所提出方法的有效性。通过对比图像增强前后的水下生物目标识别结果,以及本文提出的基于Mask R-CNN的目标识别模型和其它模型的识别结果,可以验证所提方法的有效性和优越性。同时,也说明了在小样本、水下场景下,合适的图像增强算法可以提升Mask R-CNN的性能,并且这种提升和客观图像质量评估的结果成正比。本文的研究成果为水下机器人的光学视觉系统提供了重要参考,在海洋生物资源调查、水下捕捞和海洋工事建造等方面具有广阔的应用前景。
其他文献
证券错误交易在实践中频频发生,对证券市场的定价功能与交易秩序造成破坏,提升了市场风险,损害投资者利益,但我国法律并未明确对其进行规制。证券交易本质为契约缔结的过程,在法律关系方面,证券错误交易与证券交易并未有显著区别。本文通过运用错误一元论、二元论的理论分别对错误交易进行分析,明确两种错误理论在错误交易层面能够归集至同一问题,即何种错误可得救济。设立证券错误交易撤销权是公平与效率的权衡统一,是公共
紫外光存在于地球上的各个角落,紫外检测技术也被广泛应用于人类的生产生活中,如化学分析、环境分析、生物分析、火焰报警、紫外干扰、紫外通信等诸多方面。随着科技的进步,
慢性肾脏病(Chronic kidney disease,CKD)的定义为估算肾小球滤过率(Estimated glomerular filtration rate,eGFR)持续
IgA肾病(IgA Nephropathy,IgAN)于1968年由法国学者Berger和Hinglais首次提出1,现已成为全球范围内最为常见的肾小球疾病之一2,也是我国最常见的原发性肾小球肾炎。IgAN是终末
人脸吸引力是近年来认知心理学、社会心理学、美容学、计算机科学等领域的热门话题,它对人们的社会生活有着重要影响。尽管关于人脸吸引力的研究已有许多方法,但是学者们主要
随着通信技术的日益成熟,现代社会对数据安全的重视程度也日益加深,在现代网络空间中传输的数据,出于对传输信息保密性的需要,在大量的应用场景当中,都依赖于数据加密。用于加密的数据通常是随机的、不可预测的信息。正因如此,数据加密的安全性,很大程度上,依赖于其加密序列的随机性与不可预测性,有效测量一个随机序列的随机性,具有重要的价值。随着近年来量子计算领域的蓬勃发展,传统人工算法生成的随机数地位逐渐受到量
数字化时代,在组播通信运用于多个领域的同时,组播通信的安全性也带来了许多技术挑战。数据加密传输是保证组播通信内容的机密性的有效途径,组播密钥分发作为组播数据加密传输中的重要一环,成为当前研究热点。在此研究背景下,如何构造一套完善的组播密钥分发协议是一个有趣的课题。组播密钥是加密组播通信内容的密钥。在成员不断加入和退出的通信组中,只有实现了组播密钥的安全地分发及更新,才能避免通信内容的泄露。本文主要
随着现代社会飞速发展,人们在物质日益得到满足的同时,生活节奏也变得更快,人们面临更大的生活压力,从而导致睡眠问题更加普遍。人们希望居家环境下可以监测自己的睡眠状况,
近年来,物理层安全技术引起相关学者的注意,而着眼信息隐藏的射频水印受到最多关注。信息隐蔽技术一直是一个热门的研究课题,而且数字水印已经成为信息隐藏的重要组成部分。本文则将研究的对象转移到射频信号上,主要研究射频信号中的隐蔽信息传输技术,我们称之为物理层水印或者射频水印。脏纸信道是受到两个加性噪声干扰的信道,其中一个加性噪声为发送端已知,另一个对于发送端与接收端均是未知的。称发送端已知的加性噪声为载
随着互联网、云计算的发展,传统的网络架构已经无法满足企业用户对于网络灵活性的需求。软件定义网络(SDN)作为一种新型的网络架构得到了广泛的关注。软件定义网络将传统网络的数据平面以及控制平面分离,实现了两个平面的独立演进,提高了网络的可编程性。软件定义网络往往采用逻辑上集中式的控制平面,通过控制网络与数据平面(交换机)相连。数据平面专注于数据的快速转发,控制平面按照业务逻辑,通过控制协议来向数据平面