基于深度学习的水下鱼类识别

来源 :北方工业大学 | 被引量 : 0次 | 上传用户:airingyuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
水下鱼类识别在合理开发渔业资源,维持生态平衡等方面有大量的应用需求,开展水下鱼类识别的研究具有广阔前景。然而受限于鱼类数据集规模通常较小、鱼类特征复杂等因素,使用既有鱼类识别方法获得的结果往往存在识别精度不高、检测速度慢的问题。为解决上述鱼类识别挑战,本文对比分析了目标检测算法的网络架构,基于深度学习技术设计了两种方法,并通过对比实验验证了模型的有效性。本文的主要研究内容如下:针对如何提升水下鱼类识别精度的问题,本文提出了基于改进的Mask RCNN的水下鱼类识别算法。首先描述了鱼类识别准确度的影响因素,给出了实验动机及算法适切性分析,然后在Mask R-CNN算法的基础上进行改进,先在区域生成阶段定位图像特征区域并采用特征金字塔网络接收高层语义信息,之后采用Soft NMS(Soft Non-Maximum Suppression)算法、级联结构等方法解决候选框的误检漏检、正负样本矛盾等问题,最后在Fish4Knowledge数据集上设计对比实验,结果表明,本文所提算法与Faster R-CNN、DNN+、DCGAN和CNN-SENet相比将识别精度分别提高了4.7%、2.3%、4.3%和1.5%。除识别精度外,鱼类识别研究还需关注模型检测速度。针对如何提高水下鱼类模型检测速度的问题,本文实现了一种基于YOLOv4的单阶段水下鱼类识别算法。首先分析了YOLOv4算法的适切性及网络架构,然后采用Mosaic数据增强、路径聚合网络(Path Aggregation Network,PANet)、Mish激活函数及Drop Block方法解决数据集预处理、特征提取、梯度爆炸及模型过拟合问题,并采用迁移学习方法调用权重以加速模型训练,最后在Brackish Underwater Dataset数据集上设计对比实验。结果表明,基于YOLOv4算法的鱼类识别模型与Retina Net、Efficient Det、YOLOv3算法相比将检测速度分别提高了24fps、27fps和8fps。为进一步验证和展示实验模型的效果,本文在图形用户界面中对鱼类视频进行检测。
其他文献
生物传感技术是当今社会的前沿科学技术,是集电子、生物、医疗、化学、物理、材料等多学科于一体的交叉综合性学科。生物传感器在环境监测、医疗健康、食品安全等各个领域都得到了高度重视及广泛应用。氮化镓的宽带隙和强化学硬度确保在高温、酸、碱等恶劣环境中可以稳定存在;同时AlGaN/GaN异质结通过极化效应形成高浓度、高迁移率的二维电子气(2DEG),2DEG的浓度对AlGaN/GaN异质结表面异常敏感,这种
目前行人检测技术已经被广泛应用在生活中的各种场景,其目的为对视频或图像中的行人进行分类与定位任务。但由于应用场景中干扰因素较多:主要为环境因素与人为因素。环境因素:跨场景的差异性,视频监控设备的水平高度与安装角度差异问题,白昼与黑夜的光线问题,天气的变化等因素。人为因素:行人的聚集特性,行人的外形差异。以上这些因素都是导致行人检测算法表现不佳的原因,而最突出的问题还是行人的聚集特性,伴随着行人的密
国内外研究发现将生物体非光滑表面织构形态应用于现代制造工艺中,能提升材料减摩耐磨性能。在刀具切削领域,选择合适形貌及参数的微织构制备于刀具表面,可以提升刀具切削性能,减缓刀具磨损。本文基于现有的刀具表面微织构研究成果,将微织构应用于超硬材料刀具,采用有限元仿真和车削实验的方法,综合研究微织构形貌及参数对刀具切削性能的影响,分析刀具表面微织构的减摩抗粘机理。本文主要研究内容如下:建立不同形貌的超硬材
铁路事业的飞速发展带来了日益繁密的铁路网络,列车的安全运行也显得尤为重要。列车在行车的过程中,偶尔会由于异物侵入铁路周界而被迫停运甚至引发巨大事故,这对人民的生命和财产安全造成了极大的威胁。因此,如何实现快速有效的铁路异物侵限检测、防止铁路交通事故的发生成为了研究热点。研究者们将深度学习和计算机视觉理论应用于铁路异物侵限检测,取得了丰富的研究成果。但该领域成果大多针对于白天RGB图像所得到,针对夜
近年来,教育行业涌现出一批旨在培养中小学生创造能力的校外教育机构。大多是照搬国外现成的机器人产品,再或是将国外已有的理论成果引进国内市场。优点是在国内传统教育模式中开辟了一条独特的道路。但大多理论薄弱,内容浅显,盈利至上。不难发现,现有关注中学生创新思维发展的相关文献甚少。并且在有限的相关文献中,大部分是基于教育学理论的角度着手,探讨如何通过提升教师能力或教育氛围的方法来促进我国素质教育,真切实际
在空间环境中,液态合金处于热力学亚稳态,这非常有助于研究深过冷熔体的材料结构和热物理性质。受限于成本技术等原因,研究者通过构建静电悬浮结合落管装置模拟空间环境,同时使用高速摄像机捕捉深过冷熔体的下落图像,以研究其熔凝过程。但由于图像获取设备曝光时间等硬件限制,拍摄到的深过冷熔体图像分辨率较低,不利于进一步研究其热物性和凝固界面等性质。使用超分辨重建等软件设计方式可以更准确重构图像轮廓信息,有效提升
缺陷的产生是光刻工艺中不可避免的,主要包括光刻材料的物理特性和工艺因素引入的各种缺陷,以及随着特征尺寸不断缩小而使实设计与制造不完全匹配引入的成像缺陷等,在一定程度制约着芯片制造业的发展。目前随着集成电路进入亚纳米技术节点,可识别的最小缺陷越来越精细,这给光学和电子束缺陷检测系统带来了挑战。缺陷是芯片良率的主要影响因素之一,本研究涉及的缺陷包括固体残留、坍塌、水渍污染。这些缺陷特征跨度大,对设备的
激光雷达能够采集场景的3D点云数据,可快速、准确的得到被测量物体的深度及重建目标物体的几何模型,而光学相机可对场景采集具有丰富细节的高清晰度2D可见光图像数据。激光点云与可见光图像的融合能够结合二者的优势,使只能表现物体轮廓的3D点云数据具有真实的颜色,大大提升可视性,在三维场景重建、环境交互等领域中发挥了重大作用,从而促进云景观、娱乐交互、自动驾驶以及无人设备等领域的发展。为了标定设备以及提高精
城市化进程的不断加快,使得城市用地越来越紧张,且随着大量工业化建筑的急剧增加,生态系统被破坏,环境恶化,能源短缺,城市公共空间缺失等问题随之出现,人类面临着严峻的生存危机。在此背景下,人们把追求生态环境效益作为城市设计的主要目标,巧妙的利用和顺应自然环境、与大自然密切联系着的覆土建筑逐渐成为推动生态建设的一股中坚力量。覆土建筑从古代的穴居到近代的窑洞,再到当代的公共建筑,其适用范围越来越大。因此,
通过分析唇部动态识别出说话者的表达内容是唇语识别的基本目的,其在人机交互领域是广受关注的研究项目。由于传统唇语识别模型具有速度慢,训练难度大的特点,在基于不同场景的唇语识别技术上需要大量的人工设计与经验性处理。所以本文选择基于深度学习建立唇语识别模型,但是在资源紧凑的设备上,大部分性能优异的卷积神经网络都无法展示自己的高效识别能力。因此,卷积神经网络的压缩与加速成为众多学者的热门研究课题,经过网络