基于深度学习的鱼类检测与识别技术研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:cnaxnn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
全世界范围内海洋渔业资源总量连年减少,海洋鱼类保护和管理工作备受关注。为了合理地、可持续地开发海洋渔业资源,设计出高效准确的鱼类检测识别系统意义重大。传统的鱼类检测识别方法主要依赖人工设计的特征,但通常这些特征是不具有通用性的,并且人工特征的设计需要专家级别的经验。为解决上述问题,本文针对船载电子监控场景中的鱼类识别任务提出了基于深度学习的检测识别方案,主要工作包含以下两个方面:首先,本文提出了一种基于多尺度特征融合的鱼类检测实时方案,具体工作内容可概述如下三点:首先,本文在SSD检测算法的基础上设计了多尺度特征融合模块,使得网络深层包含上下文高级语义信息的特征和浅层包含目标更多细节信息的高分辨率特征有效融合,在网络内部构建多尺度特征金字塔,以此有效提高了鱼类目标检测效果(特别是小目标的改善尤为明显)。其次,本文在预测层的各个特征图上针对性地设计了不同尺度和不同数量的先验框,合理分配了计算资源的同时很好地解决了鱼类目标小所带来的检测问题。最后,针对困难样本的误检率高和检测精度不佳的问题,本文通过结合交叉熵损失函数和焦点损失函数的优点,使得训练过程中的难易样本都得到充分训练,从而使学习到的模型更加鲁棒。实验表明本文提出的基于多尺度特征融合的鱼类检测算法在精度和效率都取得了较好的效果,m AP达到了83.08%,处理效率为每张样本24.54ms。其次,为了进一步提高鱼类识别的准确率,本文提出了一种两阶段鱼类识别方案。该方案包含两部分:区域建议模块和图像识别模块,针对一张图像,区域建议模块给出目标候选区域,然后将所有候选区域利用图像识别模块进行分类识别。区域建议模块主要借鉴Faster R-CNN算法中的RPN模块。在图像识别模块的设计中,首先针对鱼类识别问题设计了特有的Inception模块,然后结合Inception模块和ResNet网络设计了图像识别网络(Inception-ResNet)。实验表明,本文设计的两阶段鱼类识别方案可以提高鱼类识别准确率,top-1达到91.48%。综上所述,本文提出的基于多尺度特征融合的鱼类检测方案能达到较好的检测效果,同时可以满足实时处理样本;两阶段鱼类识别方案能够进一步提高鱼类识别准确率。
其他文献
近年来,无人驾驶成为了人们耳熟能详的词汇,无人驾驶的研究最早可追溯到上世纪中期,随着技术的发展,二十一世纪之后逐渐走入了大众的视野,近年来,更是迎来了广阔的发展,无人驾驶的落地也成为了各个研究单位竞相实现的目标。自动驾驶中,环境感知的稳定性是保证车辆正常行驶安全的前提之一。为了测试研发过程中设计算法的可行性和稳定性,需要进行大量的场景测试过程。但实际场景测试的高成本和针对特殊驾驶时刻而测试的高危险
在党中央强调高校加强思想政治教育工作的大背景下,高校思想政治教育越来越受到重视。当前高校中的思政课教师与辅导员为提升思政教育育人效果而尽自己最大努力,取得了不错的效果,高校学生的思想政治素养有所提升。但是另一方面,也发现了一些问题,高校学生思想政治教育效果依然些许不尽人意,其中一个重要原因就是高校辅导员与思政课教师在育人过程中,仍处于“各自为战”的阶段。虽然取得一定效果,但是并没有使学生达到真正的
随着中国制造业的发展,自动化设备在制造业内大量应用,压缩空气作为重要的二次能源,其应用范围日益扩大。本文将LCD面板工厂的空压机控制系统作为研究对象,重点研究了空压机的工艺流程及控制策略,结合厂内已有设备设计了一套优化控制方案,旨在提高空压机系统稳定性,减少电能浪费。通过对空压机原理及LCD工厂压缩空气供应流程、使用场景进行详细分析,发现工厂空压机系统存在供应压力波动大、能源浪费的问题。为了解决上
特征选择是数据降维的方法之一,在机器学习中具有去除数据集冗余特征,降低计算时间开销的作用。过滤式特征选择是特征选择方法中的一种,传统的过滤式特征选择方法注重于选出有利于分类器分类的特征,却缺乏对安全问题的考虑。近几年的研究表明,传统过滤式特征选择方法选出特征后,已选特征的数据子集提供给分类器使用时,攻击者能轻易地逃避分类器的检测。为解决此问题,目前现有方法FAFS对此提出了对抗过滤式特征选择模型,
创意文化产业是当前我国重点发展的产业集群,并已经纳入“十三五”规划之中,预计2020年创意文化产业GDP贡献比例将达到5.0%,成为我国新的经济支柱型产业。创意文化产业作为一种新的战略性新兴产业,具有高技术、高附加值和高融合性的特点。发展创意文化产业不仅可以创造新的经济增长点,还可以有效的促进产融结合以及结构的优化。目前黑龙江省正处于经济发展方式由粗放型向节约型的转变,由重点发展重工业向轻工业倾斜
随着大数据技术的不断发展,数据共享变得更为普遍,共享的数据量也随之剧增。大数据共享和交易的普及,在给工作和生活带来便利的同时,不可避免地给大数据的版权保护带来了新的调整,比如数据库在上下级分发和售卖后可能存在二次分发和二次售卖的情况。因此如何在数据库泄露后,实现其版权保护并追溯泄露源成为信息安全研究的一个重点问题。鲁棒数据库水印作为一种行之有效的大数据版权保护技术,得到了广泛研究,但该技术不可避免
近年来,由于石油价格的不断攀升以及汽车排放污染物带来的严重环保问题,使得节能减排成为全球的新课题,为电动汽车发展迎来了最佳时机。未来城市交通将以电动汽车为主,无论是混合动力汽车还是纯电动汽车都需要公用充电设施外插电源充电。然而,随着电动汽车规模化发展,大量电动汽车在充电时的无序充电将会对电网、充电设施和用户产生不可忽视的影响,电动汽车如何快速高效充电有着重要的研究意义和实用价值。本文在电动汽车,基
广西汽车制造业经过近五十年的发展,在产、销量等方面取得了瞩目的成就。广西成为我国重要的汽车生产基地,汽车制造业亦成为广西的支柱性产业之一。然而在发展过程中,亦显现
三维ISAR成像算法可得到目标的三维ISAR散射点集,相较于二维图像,能反映目标的真实尺寸及形状,从而为目标参数提取及目标识别提供必要的信息支持。但受限于雷达分辨率,单视角的三维ISAR散射点集包含较少的目标特征及信息,难以有效提取目标的各项参数。而不同视角的点集间具有互补性,配准后可得到更完整的点集数据,但不同视角的点集间也存在大量的非重合区域,造成三维ISAR散射点集配准相较于二维图像配准更加
催化脱羧加成是模拟自然生物合成反应途径的碳-碳键形成最有效的方法之一。β-酮酸可以作为酮烯酸类化合物的理想替代物,在反应结束后释放出微量的二氧化碳,因此它与其它有机化合物的脱羧转化,已经被认为是一种高效、绿色的方法来获得羰官能团的分子。由于β-酮酸在酸性、碱性或者加热的条件下容易分解成相对应的酮类化合物,所以如何实现β-酮酸在温和的反应条件下高效率转化、高化学选择、高立体选择成为主要研究对象。我们