多标记迁移学习算法研究以及在鸟声识别中的应用

来源 :南京农业大学 | 被引量 : 0次 | 上传用户:cattlecattle
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
迁移学习是针对跨领域学习问题提出的一类机器学习方法。迁移学习在彼此不同但又相关联的两个领域之间挖掘领域共享的潜在特征和结构,使得样本数据所包含的知识可以在领域之间实现迁移和复用。早期的迁移学习算法假设每个实例只与一个类别标记相关,而在图像、文本、视频等分类问题中,实例通常都会被同时标注多个类别标记。因此,近年来一些研究开始关注多标记数据的迁移学习方法,又称多标记迁移学习(Multi-Label Transfer Learning)。多标记迁移学习通过将多标记数据转化为单标记数据,或者改进已有的单标记迁移学习算法,解决多标记数据的迁移学习问题。当前的多标记迁移学习研究都是基于特征迁移方法,通过构造源领域与目标领域的公共特征表示,将源领域中多标记样本的特征分布和标记关系迁移到目标领域中。却少有研究关注领域间特征分布和标记关系的差异对迁移后的模型造成的影响。因此,本文围绕多标记迁移学习,针对领域间样本的特征分布差异和标记关系差异展开研究。本文设计了一个具有领域自适应性的多标记迁移学习算法,以及一个基于局部标记关系的多标记迁移学习算法,并将前者应用到多物种鸟声识别问题中,提出了一种基于特征迁移的多物种鸟声识别方法。论文的主要贡献包括:(1)针对领域间特征分布差异问题,设计基于最大均值差异的多标记迁移学习算法(M-MLTL)目前已有的多标记迁移学习算法忽视了源领域与目标领域数据的特征分布可能存在差异,此时源领域数据的特征无法被目标领域充分利用。本文针对该问题提出一个具有领域自适应性的特征迁移算法。算法通过构造一个理想的特征映射函数将源领域和目标领域样本投影到共享的潜在特征子空间中,并引入最大均值差异(Maximum MeanDiscrepancy,MMD)度量子空间内的领域特征分布差异,确保子空间内的样本特征分布相似,从而避免了特征分布差异造成的分类模型不适应。算法在2个图像分类数据集上的对比实验结果表明,新算法在五项指标上的综合表现排名第一,可见新算法相较于已有同类算法有更高的分类精度;另一方面,当样本数量大于700后,随着样本数量的增加新算法的计算时间不再增加,可见新算法在大样本分类问题中有更高的计算效率。(2)针对领域间标记关系差异问题,提出多标记迁移学习中的局部标记关系理论,并设计基于局部标记关系的多标记迁移学习算法(MTLOC)现有多标记迁移学习假设源领域的标记关系对目标领域是全局有效的,然而源领域与目标领域的标记关系存在差异,源领域中标记关系并不全适合于目标领域。因此,本文将基于局部标记关系的多标记学习算法(Multi-Label learning using LOcal Correlation,ML-LOC)推广到迁移问题中,提出一种基于局部标记关系的多标记迁移学习算法。通过最小化加权损失函数,挖掘源领域与目标领域共享的标记关系,并将其作为辅助特征,提高分类模型在目标领域上的分类精度。算法在2个图像分类数据集上的对比实验结果表明,并且随着局部标记关系个数的增加,算法各项指标的表现有明显提升,可见在多标记迁移学习问题中局部标记关系能够提升算法精度;新算法在各项指标上的表现都超过基于全局标记关系的迁移学习算法,可见新算法比基于全局标记关系算法有更高的分类精度。(3)提出一种基于特征迁移的多物种鸟声识别方法(FT-RMBS),为多物种鸟声识别应用中训练样本不足的问题提供了一种解决方案针对多物种鸟声识别中多物种鸟声样本不足的问题,尝试采用单物种鸟声样本训练多物种鸟声识别模型,提出一种基于特征迁移的多物种鸟声识别方法,该方法采用M-MLTL算法将单物种鸟声和多物种鸟声的原始音频特征映射为同分布的潜在音频特征,再基于单物种鸟声的潜在音频特征训练多物种鸟声识别模型。对比算法在自然形成的多物种鸟声数据集上的识别效果,新算法在4项全局评价指标上都取得了较好的识别效果,可见新算法相较于未采用特征迁移的鸟声识别算法有更高的识别率。算法在人工构造的多物种鸟声数据集上对比试验表明,基于特征迁移的识别算法正确识别率相较于对比算法最高提升了 20%,可见新算法在多物种鸟声识别问题中更有优势。
其他文献
最近几年,图像显著性检测是计算机视觉领域研究的热点。图像显著性检测的目的是能够将图像中感兴趣的目标区域自动地检测出来。对目标区域的检测精度与检测效率将直接影响到
信息在当今社会中占据着越来越重要的地位。可靠精确的信息,能够提高工作效率,缩短工作时间,有助于增强竞争力,做出科学的抉择。信息检索作为捕获用户需求信息的一种重要手段
虚拟计算环境是建立在广域互联网基础设施之上,为完成大型的应用需求进行网络资源的聚合,为用户提供可信的、透明的、服务一体化的环境。在虚拟计算环境下搭建地理信息系统,
医学图像融合技术是当今国内外研究的一个热点,医学图像融合能够综合利用医学图像中的互补信息,得到包含信息更全面、显示效果更好的图像,为临床诊断和治疗提供更精确的数据
信息化是当今世界经济和社会发展的大趋势。通过搭建专用数据中心,企业以网络服务的方式将生产、管理过程数字化、信息化,极大的提高了企业自身的生产和工作效率。随着互联网技
随着移动互联网的高速发展和林业“十三五”改革的要求,针对现阶段的林业发展状况,林业现代化水平低严重制约着我国林业的发展。现有的林业巡护系统结构单一,致使林业部门的
随着计算机技术和互联网的迅速发展,各种信息呈爆炸式增长,人们对信息精确定位的需求促进了自然语言处理技术的研究。同时,随着人们对跨文本信息融合的分析,多文档自动文摘成
当今世界,科学技术突飞猛进的发展,而以高科技为基础的武器研发技术更是日新月异,现代战争可以说是新技术的“展览馆”,应用高科技的新式武器无论是破坏力还是杀伤力都达到了前所
未知环境下移动机器人的同时定位与建图(Simultaneous Localization and Mapping-SLAM)是自主探索领域的核心问题,现已受到了广泛关注,并涌现出大量的解决方法。与单机器人SLAM
当前面向主干网的网络检测系统鲜有将僵尸网络(botnet)传播检测数据纳入,并且缺少对检测到的威胁事件作进一步分析,以致无法评估出被保护对象所受的危害程度。本文尝试以出入