论文部分内容阅读
随着社会发展进步,人们越来越重视保护生态平衡、维护生物多样性。对各类物种的准确和一致性的识别需求也日渐增长。昆虫的种类在各类动物中最为丰富。作为种类最丰富的昆虫之一,蝴蝶在全世界有将近两万种。蝴蝶具有复杂的颜色、纹理和图案,人工识别难度较高且十分耗时。因此,针对自动识别蝴蝶种类的研究受到越来越多的关注。计算机处理图像数据的能力依赖其硬件技术。这些年硬件技术发展迅速,使得计算机处理图像数据的能力快速上升。基于此,图像识别相关技术也不断取得新的突破。计算机视觉任务中,深度学习凭借良好的特征学习能力取得了很多成果。它通过非线性映射来提取原始数据低层特征,并且将其组合成抽象的高层特征表示。由此得到从高维原始数据中抽取的低维有效特征,并依据抽取的特征进行分类,达到识别样本类别的目的。自编码深度学习可以通过自动学习网络参数来提取样本有效特征,从而取代传统的手工提取特征。深度学习在分析处理大规模数据方面具有优势,是一种有效的机器学习方法和数据处理工具,在目标检测领域得到广泛应用。因此,我们将深度学习应用于蝴蝶种类自动识别问题中,以期自动定位蝴蝶在图像中的位置、抽取蝴蝶特征,并且对其进行分类或聚类,提高蝴蝶种类识别效率。以往的蝴蝶自动识别研究大多基于蝴蝶的标本照片数据,涉及的蝴蝶种类和照片数量都较小,且大多使用人工设计的方法来提取蝴蝶分类特征。基于生态环境中拍摄的蝴蝶照片进行蝴蝶种类自动识别是对现有蝴蝶种类识别的挑战,因为生态环境中的蝴蝶照片,蝴蝶的分类特征将会被严重遮挡。因此,本研究基于深度学习方法研究生态环境照片中的蝴蝶种类自动识别,包括生态照片中的蝴蝶位置定位及其种类识别。生态环境中的蝴蝶照片中的蝴蝶种类标注难度极大,需要专业人员鉴定蝴蝶种类,甚至对专业人员都是非常大的挑战。因此,本论文借助深度学习对特征的强大学习能力,采取有监督和半监督两种方式实现蝴蝶种类鉴定,论文的主要工作和贡献如下:1.对比使用基于深度学习的Faster R-CNN和Mask R-CNN目标检测算法,定位和识别生态照片中蝴蝶的位置和种类。通过添加对应种类的蝴蝶标本照片构造蝴蝶训练集,并使用旋转图片、添加噪声等方式扩充训练集。由此解决小规模数据集下,同一大物种下小物种的细粒度分类问题。使用目标检测算法的常用评价准则mAP来查看蝴蝶定位和识别的效果。实验结果显示,Mask R-CNN算法可以在蝴蝶物种自动识别问题中取得更好的效果。2.由于蝴蝶数据集标注的难度较大,需要专业人员标注种类,且耗时较长。本研究探索在人工标注蝴蝶数据不足情况下生态照片中蝴蝶种类自动识别问题。使用目标检测算法检测出生态照片中的蝴蝶位置,然后采用半监督思想识别蝴蝶种类。提出以密度峰值聚类算法改进DCEC深度聚类的DCEC_DPC算法,采用DCEC_DPC与深度聚类算法DeepCluster对检测出来的蝴蝶进行种类划分。