基于深度学习的蝴蝶图像分割和识别研究

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:liangting123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然界生物的多样性对保持生态平衡,促进人与自然和谐发展具有重要意义。昆虫是地球上种群数量最庞大的一类生物,而蝴蝶作为其中的一员与人类的生产、生活息息相关。自然界中的蝴蝶往往具有复杂的颜色和纹理特征,使用人工识别的方法错误率较高,且效率低下。因此,针对蝴蝶图像的自动识别方法在许多场景中具有十分重要的应用价值,如蝴蝶种群保护、农作物病虫害防治、边境检疫等。根据应用需求的不同,针对蝴蝶图像的研究可分为蝴蝶图像分割和蝴蝶图像分类两个任务。在蝴蝶图像分割任务中,难点在于如何从复杂的环境背景中分割出正确率较高的蝴蝶目标。在蝴蝶图像分类任务中,难点在于有效区分类间差异和类内差异。为此,本文使用深度学习技术对蝴蝶图像分割和分类两个方面展开研究。论文主要工作包括:(1)针对当前蝴蝶图像分析中缺乏分割图像的问题,提出一种基于Mask RCNN的蝴蝶分割方法。由于缺少现成的蝴蝶分割标注,首先从现有的蝴蝶数据集中构建一个小型的蝴蝶分割数据集,通过人工标注的方法得到数据集的分割标签。然后在经典的Mask RCNN实例分割算法上进行迁移训练,通过训练好的Mask RCNN分割整个蝴蝶数据集,得到分割后的蝴蝶数据集。该数据集包含4353张蝴蝶分割图像,可以为后续的蝴蝶图像分析提供数据支撑。(2)针对Mask RCNN算法分割结果中存在的过分割和欠分割的问题,提出一种结合多种图像分割算法的精细化分割方法。首先通过SLIC超像素方法对Mask RCNN算法分割后的掩码边缘进行扩展延伸,并通过形态学方法处理得到分割三元图,最后结合三元图使用改进的Grab Cut算法对原图进行二次分割。实验显示,在蝴蝶图像测试集上与Mask RCNN相比分割精度提高2%左右。(3)针对蝴蝶图像分类任务中类内差异性较大,类间差异性较小的问题,提出了一种分层注意力双线性池化方法,并结合数据增强方法对蝴蝶图像识别精度进行提高。通过将HBP方法中的三个投影矩阵替换为具有注意力机制的选择性核卷积的方式,来定位蝴蝶图像中具有区分度的局部特征,并通过二次乘积的方式对局部特征进一步加强。最后使用Mix up数据增强方法提高模型的泛化能力,在蝴蝶数据集上识别精度达到了96.01%。
其他文献
随着过程生产装置规模的扩大和工艺要求的提高,应用DCS控制系统对生产过程进行管理控制,极大提高了生产效率和系统可靠性,成为过程工业的必然选择。本文在研究腈纶工艺流程的
未来代替能源最有效的技术之一是利用光催化和电催化技术将太阳能和化学能转化为电能,而高效催化剂的设计合成是关键技术之一。研究发现,大多数过渡金属(例如Co、Ni、Fe、Cu)复
近年来,在单幅图像的超分辨率(Super Resolution,SR)重建算法中,基于稀疏表示的图像超分辨率算法由于其重建图像的视觉效果较好,得到了广大学者和研究人员的关注。但是该方法
合理科学适用的绩效考核有助于评价员工价值,提升员工能力,激发员工工作积极性和主动性,有助于提升企业整体效率,调控内部资源,优化内部运营流程,减少各类费用支出,降低企业
全控型开关器件的诞生,使电力电子技术得到了飞速的发展。但随着非线性电力电子装置的大量使用,给电网注入了大量谐波电流。此外无功电流和三相不平衡电流也让电网电能质量面
随着露天煤矿开采装备水平的快速提高,我国露天煤矿产业得到了迅速的发展,露天煤矿在规模、工艺、技术和管理方面不断进步,已经成为产量位居世界第二的采煤强国。但相对露天
陆上地震台站记录的地脉动信号(~0.05-0.5 Hz,一般以~0.12 Hz为界,分为单频和倍频两类)主要源自海浪活动。台风期间,剧烈的海气交互作用激化海浪活动,促使地脉动信号显著增强
机床卡盘作为保证机械加工精度的核心功能部件,在现代制造业中具有基础性地位。近年来,随着制造业多品种加工对精度的要求日益提高,机床卡盘的淘汰率不断增加,废弃机床卡盘造
板球系统本身具有高阶、不确定性、非线性等动力学特性,是控制理论研究的典型验证对象。本文针对板球系统开展基于交互式ESO的反演算法控制研究,针对其系统结构和动力学特性,
2001年12月,国务院第50次常务会议通过《中国公民出国旅游管理办法》,自此,中国出境旅游人数稳步上升。与此同时,媒体中对于中国游客行为的讨论也逐渐增多。为减少中国游客的