基于稠密卷积神经网络的贝类图像分类识别研究

来源 :鲁东大学 | 被引量 : 0次 | 上传用户:P214909697
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
我国的贝类水产养殖产业蓬勃发展,现如今不仅在沿海的各大城市,包括很多的内陆各大城市对与贝类养殖产品的需求也在不断的增长,但是贝类种类繁多且不乏非常相似的贝类,很多情况下人们希望认识更多的贝类却又难以准确辨认。虽然机器视觉技术应用领域和范围已经非常广泛,但是将其应用于贝类的分类和识别领域的研究还比较少,相关贝类图像数据也较难获得,因此我们构建了贝类图像数据库并将其用于贝类图像的分类识别任务中。为了提高形貌特征相似的不同品类的贝类图像识别准确性并尽可能降低模型复杂度,在稠密卷积神经网络中引入多尺度特征,提出一种改进的多尺度感知稠密卷积神经网络的方法,并提出新的权重比例池化规则来进行进一步约束,为了更好地提高模型的分类效果,本文在上述基础上添加了中心损失函数约束,并进一步的对网络进行几何中心剪枝优化并进行分类精度补偿,从而实现了相似品类的贝类图像分类识别。实验结果表明,本文方法能够实现高准确度的贝类图像识别,有效减小了所需训练参数数量,收敛速度快,鲁棒性强,抗干扰能力强,尤其针对形貌特征相似的不同品类的贝类图像的分类识别效果显著。具体工作和创新点如下:(1)鉴于目前国内尚未存在相关贝类图像数据库,目前相关研究贝类类别较少的问题,本文构建了包含9个类别共33988张图像的贝类图像数据库,其中包含形貌特征差别较大的扁玉螺、脉红螺、皮氏蛾螺,以及形貌特征差别较小的其他六种贝类,它们分别是薄片镜蛤和日本镜蛤、大竹蛏和长竹蛏、毛蚶和魁蚶;为了进一步扩充本贝类图像数据库,本文利用基于DCGAN的数据增强方法对原始贝类图像数据库进行了扩增,建立了贝壳图像数据库,并且将该数据库应用在接下来的贝壳分类中。(2)鉴于贝类图像生长时间和环境的特殊性,即同一类别贝类存在一定差异,和不同类贝类又存在差异微小的情况,本文引入了多尺度的思想。在稠密卷积神经网络的基础上构建了多尺度感知卷积模块,首先将卷积特征分组,然后在不同的卷积通道中进行操作,并对上述卷积特征利用级联的方式进行多尺度感知,在此基础上又提出了新的权重比例池化规则,将提取的特征按照大小赋予不同的权重比例,避免了最大池化规则舍弃过多特征以及平均池化规则中正负特征抵消的情况,从而使得提取的特征更加全面,增强池化过程的抗干扰性,提高了形貌特征相似的贝类识别准确率。(3)为了进一步提高形貌特征相近的贝类图像识别准确性,并尽可能降低模型复杂度,文章在多尺度感知的稠密卷积神经网络中添加中心损失函数进行约束,不仅考虑了类内距离,同时也考虑了类间距离,提高了分类准确性和效果。由于训练的分类数据量较大,为了缩短训练时间,减小计算量以及提高速率,本文又引入了几何中心剪枝算法进行优化;为了降低模型复杂度,且兼顾图像分类的准确性,文章改变了网络模型的训练方式,将该方法作为剪枝后的精度恢复方法,其不仅能够不破坏原有网络模型架构,有效去除冗余特征,而且又能够实现更多特征的线性组合,并配合稠密卷积神经网络的稠密连接特性,将有效特征传递到更深的层,使得最终形成的网络结构具有一定的灵活性,并且尽可能多地保留了重要特征,去除次要特征,从而提升了图像分类的准确性。实验结果表明,本文方法能够实现高准确度的贝类图像识别,有效减小了所需训练参数数量,收敛速度快,鲁棒性强,尤其针对形貌特征相似的不同品类的贝类图像的分类识别效果显著。
其他文献
乏燃料后处理是充分利用铀资源,保障核能可持续发展,保护环境的关键技术之一,通过乏燃料后处理,可以显著减少放射性废物体积和毒性。其中熔盐液态金属的还原萃取和电解精炼被
行星齿轮箱相对于定轴传动具有传动比大,体积小,工作平稳,承载能力大等优点,而其通常工作在低速、重载、阵风等恶劣环境下,齿轮易出现脱落、点蚀、裂纹等故障。另一方面,行星
涡盘零件是漩涡压缩机的核心构件,具有较为复杂的形状结构,难以通过塑性加工大批量生产。由于漩涡压缩机特殊的工作方式,涡盘零件的轻量化有效提高漩涡压缩机体的机械效率。
近年来,脑科学研究受到前所未有的重视,人的大脑进行着情绪等高级活动,因此通过人的脑电图(Electroencephalogram,EEG)信号来探索情绪识别具有重要的科学价值。但是情绪识别
近年来,国内矿业的发展经历了低潮时期,但是随着国内矿业市场回暖,矿产资源的使用需求增加,矿产资源单价上调,矿业发展呈现出新的生机。爆破技术在矿山生产中起着非常重要的
碳化硅颗粒增强铝硅基复合材料不仅高强、抗磨损、低膨胀、导电导热性出色,还兼具良好的铸造性能,在汽车制造、军事技术、航空工业及微电子封装领域应用前景广阔。在高压的条
在蓝牙技术联盟正式宣布蓝牙技术开始全面支持Mesh网状网络并制定了蓝牙Mesh的标准协议SIG Mesh后,基于SIG Mesh的面向多种应用解决方案正在井喷。由于SIG Mesh可以实现多对
非相干大规模多天线系统不需要瞬时信道状态信息(Channel State Information,CSI)进行调制解调的特性,能够有效地提高系统容量、降低系统延时和适应快变信道环境。移动蜂窝网
由于光学元件景深的限制,很难捕获到一张图像中所有的清晰目标,只有距离相机特定位置的目标才能被清晰聚焦,在聚焦平面之前或之后的目标将失去聚焦变得模糊。为解决这一问题
人脸识别技术是一种依靠人的脸部特征信息来进行身份识别的生物识别技术,由于其直观、可靠和稳定等优点,在身份认证场景、证件验证场景和人脸检索场景等多个场景下都有广泛的