【摘 要】
:
鱼类图像识别是监测鱼类种群与研究渔业资源的重要基础,然而图像中的鱼类目标在背景、形态、大小等方面都存在着较大的差异,这使鱼类图像识别面临着诸多的挑战。随着深度学习技术的发展,该领域中的卷积神经网络模型具备良好的图像特征提取能力和优异的泛化性能,这为鱼类图像识别提供了新的解决思路。本文从鱼类图像分类和鱼类目标检测两个方面开展鱼类图像识别工作的研究,通过对相关卷积神经网络模型进行研究及改进,以达到更好
论文部分内容阅读
鱼类图像识别是监测鱼类种群与研究渔业资源的重要基础,然而图像中的鱼类目标在背景、形态、大小等方面都存在着较大的差异,这使鱼类图像识别面临着诸多的挑战。随着深度学习技术的发展,该领域中的卷积神经网络模型具备良好的图像特征提取能力和优异的泛化性能,这为鱼类图像识别提供了新的解决思路。本文从鱼类图像分类和鱼类目标检测两个方面开展鱼类图像识别工作的研究,通过对相关卷积神经网络模型进行研究及改进,以达到更好地解决鱼类图像识别问题的目的。首先,对ResNet18残差卷积神经网络进行分析和研究,将网络残差结构中的下采样方式改进为最大值池化,并在残差结构中融合通道注意力模块,又将网络中部分标准卷积替换为深度可分离卷积,将得到的ResNet18-Fish网络应用于鱼类图像分类。其次,对YOLOv3网络进行分析和研究,结合迁移学习的思想,使用YOLOv3网络在COCO数据集上的预训练模型对该网络在小型鱼类图像数据集上的训练过程进行优化,在此基础上利用数据增强算法对训练时输入到网络中的图像进行扩充,并在网络训练过程中采用早停策略节约训练成本,将改进后的YOLOv3网络用于鱼类目标检测。最后,通过在相应的数据集上进行实验,验证ResNet18-Fish网络和改进后的YOLOv3网络在鱼类图像识别问题上的有效性和可行性。
其他文献
压缩感知提供了一种新型信息处理方式,它充分利用信号的稀疏性,以远低于Nyquist的采样率进行随机采样以获取离散样本,然后通过重构算法实现对原始信号的良好恢复。压缩感知主要包括三个方面的内容,其中重构算法的设计是压缩感知成功恢复信号的关键。近似消息传递算法的特点是计算复杂度低,重构精度高,是一种高效的重构算法。该文应用近似消息传递算法对图像进行压缩感知重构,具体工作如下:首先,针对基于K-mean
随着我国逐渐步入老龄化社会,心血管疾病患者持续增加,使得心脏监护系统需求也在不断提高。如何利用计算机辅助技术对心律失常进行精准检测和分类是心血管疾病诊断中的研究热点之一。在进行心律失常识别时,传统上是心脏病专家依据患者的心电图来进行观察和分析,这样的方式容易产生漏检和客观性的结论,因此本文考虑采用机器学习和深度学习分类算法,对心律失常进行了以下研究:首先,针对在单个心跳的患者内的心律失常分类问题,
随着我国经济和信息科技的发展,汽车的普及率大大提高,然而另一方面各种交通事故也随之而来。为了应对交通事故的频繁发生,高级驾驶辅助系统(TSR)便应运而生,它可以帮助驾驶员做出正确的驾驶操作,从而有效地避免交通事故的发生。在TSR中,对交通标志的准确识别是一个核心问题,具有重大研究意义。为了进一步提高交通标志识别的准确率和计算效率,本文的主要工作如下:首先,为了解决交通标志识别算法中GTSRB数据集
小目标检测是目标检测任务中一个具有挑战性的分支,其目的是对图像中的小像素目标进行分类和定位。随着深度学习的发展,基于卷积神经网络的小目标检测算法取得了巨大的进步,但由于检测的环境复杂、信息量少以及分辨率低等问题,小目标检测算法还有待发展。该文围绕基于深度学习的小目标检测算法进行分析和研究,具体研究内容如下:首先,为了提升小目标检测的性能,该文提出基于金字塔卷积与注意力机制的小目标检测方法。该方法将
文本生成图像问题是图像生成方向的一个重要分支,给定一个文本描述,可以生成符合文本描述的图像。文本生成图像的方法主要是基于生成对抗网络的,目前的一些方法经常出现模式崩塌问题,生成的结果缺乏多样性。本文为了提高生成图像的质量做了以下工作:首先,为了解决训练过程比较自由缺乏约束的问题,本文提出了语义分类器生成对抗网络。将文本预处理后得到文本向量,与随机噪声连接在一起输入到生成器中,通过卷积层生成图像。然
双线性广义近似消息传递算法是广义近似消息传递算法的拓展,是一种具有高性能的迭代阈值算法。本文主要就双线性广义近似消息传递算法的研究及其应用进行了以下几方面的研究工作:首先,研究了一种基于双线性广义近似消息传递低秩矩阵填充的图像去噪算法。该算法利用自然图像中非局部相似块形成的矩阵具有低秩性这一性质,将匹配图像块的去噪问题转化为低秩矩阵填充问题。实验结果表明,该算法能够有效去除图像中的混合噪声,与经典
石油作为当今世界工业第一能源要素,被称为“工业的血液”。石油资源关系到国家能源安全,对社会发展起着至关重要的作用。我国正处于经济发展期,对石油的需求量与日俱增,但是我国石油储量有限,许多老油田已全面进入开发中后期,开发难度增大,需要完善开采技术来挖掘剩余油潜力。注水是补充油田能量的重要技术手段,为解决油田开发后期测调工作量大、注水合格率下降快等问题,发展了智能分层注水工艺。基于智能分层注水工艺现状
近年来,扭转作为监测应力及内部状况的一个重要参数,受到了国内外研究学者的广泛关注。其中,与电学和磁学扭转传感器相比,光纤扭转传感器具有结构简单、易于制备、灵敏度高以及抗电磁干扰能力强等优点,被广泛应用到户外安全检测以及桥梁监测等领域之中。本文在分析总结不同结构的七芯光纤传感器国内外研究现状的基础上,采用七芯光纤作为传感单元,制备了两种不同结构的七芯光纤微腔结构传感器,并在顺时针及逆时针两方面对其扭
单幅图像去雾任务作为计算机视觉任务领域中的重要组成部分,在目标跟踪、无人驾驶等视觉任务中都承担着重要的作用。因此,在多样的计算机视觉任务中,如何在单幅图像中高效地获取更好的去雾效果成为单幅图像去雾任务中的关键问题,同时也是计算机视觉领域中一个亟待解决的难题。通过深入分析国内外单幅图像去雾方法的研究现状,同时结合深度学习思想及计算机视觉的相关知识,对如何在单幅图像中高效地获取更好的去雾效果进行了深入
近年来,疾病诊断相关组(Diagnosis Related Groups,DRGs)在不同地区的医疗服务提供者评价和医疗支付方式应用中分组效果不理想。机器学习方法是研究分类问题的重要方法之一,与传统的DRGs分组方法相比具有较大的优势。因此本文采用基于机器学习的分类算法对本地化DRGs分组和分组预测进行研究。首先,针对现有的DRGs在不同地区的应用中部分病例无法入组的问题,提出面向本地化的DRGs