基于深度学习的双模态特征融合鸟类物种识别算法

来源 :北京林业大学 | 被引量 : 0次 | 上传用户:yywachself
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
鸟类物种多样性调查是了解鸟类群落结构和作用的重要内容之一。鸟类鸣声属于鸟类重要的生物学特征之一,具有较高的辨识度,在鸟类物种分类和行为学研究中得到广泛应用。近几年,新提出的利用自动录音设备和识别软件,通过鸣声识别实现鸟类调查的方法因高效率、非损伤、低干扰、大范围的监测优势具有巨大的应用前景。本文面向鸟类统计分析的需求,针对自然环境下基于鸣声的鸟类物种识别存在随机干扰噪声降低识别效果、手动提取鸟鸣声差异特征困难以及识别模型识别效率低等问题,在鸟类鸣声的处理、物种识别及应用三方面展开研究,本文主要工作如下:1.提出一种基于迁移学习的鸟类物种识别方法。鉴于深度学习技术对数据量要求较高且鸟类数据来源有限,提出一种基于特征和模型迁移学习的物种分类方法,对自然环境中音频信号的进行预处理,利用时频分析法得到去噪后音频信号的语图,经数据增强技术扩充后建立语图图像样本库;通过卷积神经网络(Convolution Neural Network,CNN)自动提取语图高层次特征并完成分类,为其它鸟类项目的应用提供了研究基础。2.提出了基于双模态特征融合的鸟类物种分类算法。本文结合卷积神经网络和长短时记忆网络(Long Short-Term Memory,LSTM)的结构,建立一种更具有泛化能力的卷积-长短时记忆神经网络(Convolution Long Short-Term Memory,CLSTM)网络模型,优化网络结构包括输入的预处理,学习速率,防止过拟合,梯度消失等问题,融合卷积网络提取的语图特征和长短时记忆结构提取的鸣声时序序列特征,自适应完成基于鸣叫或者鸣唱的物种识别。实现了鸣声分类算法的优化,提高了识别效果。3.设计了基于MVC(Model View Controller)架构的移动端嵌入式鸟类识别系统。本文利用Eclipse开发工具开发了一套面向实际采集鸣声信号的鸟类识别软件,客户端APP集合了数据模块、View图像模块、控制模块等功能。本文开发的人机交互界面具有较高的识别性能,完善了基于安卓的鸟类个体的自动识别任务,推动鸟类资源调查和监测的自动化。为了验证本文提出的算法的有效性,利用鸟类公开数据集Xeno-canto和北京市松山国家级自然保护区采集的18种鸟类音频分别进行算法和应用实验验证,并与传统的算法及模型进行对比,实验结果表明,本文方法在识别准确率、精确率、召回率、F1值等性能评价指标上均有较大提升。实现了基于鸣声的鸟类物种自动分类与统计,该成果也可以推广到其他鸟类数量的自动统计中,具有重要的理论意义和工程应用价值。
其他文献
根据读者的要求,为便于互相学习及加深理解物流知识,从本期起辟《物流小辞典》专栏,请各位读者将自己学习物流中所了解到的名词、用语写成词条投到本刊.以便采集汇编。读者们如对
集装箱运输业务中环节较多,难免产生一些问题,其中退载问题显得尤为突出。在集装箱运输中,退载是很棘手的,又是时常发生的问题。由退载而引发的货损给货主造成了经济损失,也给目前
摘要:配制不同浓度的萘乙酸(NAA)处理富贵竹插条,观察根原体的形成,并做出分析。  关键词:萘乙酸;富贵竹;浓度;根原体  中图分类号:G632.0?摇 文献标志码:A ?摇文章编号:1674-9324(2014)17-0173-03  高中生物必修模块3——《稳态与环境》(人教版)中安排了“探索生长素类似物促进插条生根的最适浓度”的探究活动,让学生将所学的知识用于实践,以培养学生多方面的能力。
初中生是一群从幼稚走向成熟的孩子,他们重感情,重独立,因此在进行班级管理时,班主任应顺应学生的心理,从他们的情感出发处理班级事务,包括班级管理理念的形成、班委的组建,以及具体
迹象是绘画的基本元素,痕迹是残存的迹象,是迹象的呈现形式。绘画艺术是一个因迹成象的过程。不同的艺术形式有不同的艺术特征,侧重点也存在差异,油画家讲究造型与色彩,版画家注重调子和“版味”,雕塑家则注重空间和体块关系。迹象在艺术创作中无处不在,丝网版画的创作充满了偶然性版画家通过对物像的观察,总结感受,将物像归纳总结为具体的艺术形象,经过反复对比修改最后呈现在画面上,这些艺术形式从迹象论的角度出发,都
思想政治教育是提升学生综合素质、促进学生全面发展的重要途径。体校要不断开拓创新教育模式,借助不同途径传 播新时期中国社会主义思想,提升学生的政治素养、价值取向和认
由于战场环境日益复杂,低空区域的地物杂波干扰较多,雷达主动式发射电磁波的工作模式极易受到杂波、电子诱饵和气象环境的干扰,在低空空域存在探测盲区,无法获取目标量测的真
2016年被称为“虚拟现实元年”,各个领域投身到其中的研究者呈井喷式增长。早在2012年,教育部在《教育信息化十年发展规划纲要(2010~2020年)》中明确提出要将增加虚拟仿真教学
在英语学习中,词汇和语法被视为构建语言知识的核心元素。词汇的作用在语言学习过程中举足轻重,许多研究语言的专家和学者都认为词汇问题是语言学习的核心问题。因此,在高中英语学习中,词汇学习和词汇量的扩大既是重点,也是难点。而元认知策略的提出为英语词汇学习的研究提供了一个新的视角。国内外的一些研究表明,元认知策略在高中英语词汇学习中的运用,有利于提高学生的学习计划性、自我监控能力和自我评价能力,对提高英语