生物声音的自动探测

来源 :中国科学院研究生院中国科学院大学 | 被引量 : 0次 | 上传用户：nana9816245

【摘要】

：

生物多样性锐减威胁着人类的生存。为了有效保护生物多样性,需要发展各种形式的监测技术。基于声音的生物多样性监测越来越受到人们的重视。这不仅因为它属于被动式监测、对

【作者】

：

沈少青

【机构】

：

中国科学院大学

【出处】

：

中国科学院研究生院中国科学院大学

【发表日期】

：

2012年期

【关键词】

：

叫声探测生物多样性声音特征匹配算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

生物多样性锐减威胁着人类的生存。为了有效保护生物多样性,需要发展各种形式的监测技术。基于声音的生物多样性监测越来越受到人们的重视。这不仅因为它属于被动式监测、对生物无干扰、24小时全天候、数据量小,更重要的是因为它能直接监听生物之间沟通的信息及相关行为,这为保护生物多样性提供了重要的数据依据。　　随着生物多样性监测向着长时间、大范围和实时性的方向发展,人工识别录音记录的方式已经无法满足实际应用需求,亟需发展高效精确的自动探测方法。由于生物声音复杂多变且与人类语音差别很大,无法进行可控制的生物声音训练样本采集实验,缺乏生物相关的语言知识和野外环境背景噪声异常复杂等原因,直接移植语音自动识别领域的技术成果是不可行的,而是应该根据目标生物声音的特征和应用问题发展适合的生物声音探测技术。　　当一个生物声学家或者生物声音探测技术的其他应用者面对繁多的特征类型和模型方法时,快速合理地选择特征类型和模型方法来解决具体的生物声音探测技术相关的应用问题就会变得困难起来。实际上,生物声学家在进行抉择时,原则之一往往是平衡探测性能高低与实现代价大小之间的关系,因为探测性能高的算法其实现代价往往也很大。而基于声音的生物多样性监测系统一般都是工作在资源有限条件恶劣的野外环境中,实现代价过大的算法并不实用。生物声学家最希望找到的就是探测性能高且实现代价小的探测算法。正因为有这样的应用需求,本文建立起了一套通用的生物声音探测问题的解决方案和技术框架,旨在为合理地选择生物声音探测方法提供确切的依据和科学的建议。　　由于探测单元在探测性能高低、实现代价大小上起到重要的指示作用,并且每类探测单元具有不随具体模型变化的通用的技术路线,所以作者提出生物声音探测问题可从帧、窗口和片段三类探测单元出发寻找出探测性能较高而实现代价较小的探测方法(模型和特征)。作者定义了通用的非目标声音类型,将非目标声音类型分为通用噪声类型和通用信号类型,并提出采用现有的语音活动检测算法来找出非目标声音类型的训练数据。然后,作者挑选了FOM(Figure Of Merit)和最大假阳率作为探测性能评价的主要指标,设计了long_auc和short_auc(两者都是AUC的变体,Area Under Curve)作为探测性能比较的主要指标。最后,作者设计了统一的参数寻优方法。对寻优范围内的每一套参数值,作者采用Bootstrap重采样方法来直接估计FOM,并选择FOM最大时的参数值作为最优参数。作者还设计了寻优范围自动扩展机制,在一定程度上弥补人为设定的寻优范围的不合理性。至此,作者建立起了一套通用的生物声音探测的解决方案,以满足不同的生物声音探测应用需求。　　作者将上述通用的解决方案用于白枕鹤起始叫声的探测,以便为人们设计针对濒危动物白枕鹤的自动监测系统提供重要的决策依据。采用的特征有三类:语谱图、梅尔倒谱系数和感知线性预测系数。对于基于帧的探测,作者尝试了高斯混合模型和支持向量机。当模型采用高斯混合模型,特征采用梅尔倒谱系数时,FOM的平均值最大,为0.2125。对于基于窗口的探测,作者尝试了两套模板匹配算法。当模型采用均值模板,特征采用语谱图时,FOM的平均值最大,为0.5185。对于基于片段的探测,作者尝试了隐马尔科夫模型。当特征采用感知线性预测系数时,FOM的平均值最大,为0.5675。　　通过比较基于不同单元的探测方法的性能优劣,并综合考虑探测算法实现的难易程度,对于白枕鹤起始叫声的探测问题,作者提出如下建议:当要求小的实现代价而对精度要求不是特别高时,可以采用基于语谱图特征的均值模板方法作为探测方法;而当对探测精度和性能稳定性要求较高而允许较大的实现代价时,可以采用基于感知线性预测系数的隐马尔科夫模型作为探测方法。

其他文献

GRACE重力卫星反演黑河流域地下水变化

地下水是自然界中存在的重要的水体，是农业灌溉、城市生活用水、工业发展等重要的水源，与人类生活及社会经济发展息息相关。西北干旱区地处内陆地区，远离海洋，伴随青藏高原的隆升

学位

黑河流域水储量地下水动态GRACE重力卫星

三千年瓷火一夫立

宇宙万物，先有气，后有石，有石而后有土，有土而后有木，有木而后有火，火土合而后有瓷。瓷者气之所凝，石之所炼，水土之所变，匠之所工，火之所成，万物之所结也　　柴，燃起来了。四周极静，火发出风一样的声音。阎夫立沉默凝神，像通透了炉膛。在1300余度的高温下，泥土会烧成空气，砖会流淌成水。而瓷在火的淬炼中，器身挺拔，釉料熔化，色彩盈动，瞬息绚烂。瓷胎入窑，还全然泥土本色，当窑炉开启，已是满膛珠玉。　　阎

期刊

瓷胎余度器身古瓷烧瓷祸福无常古窑瓷魂国瓷蔚然大观

帝后CP

想让夫妻关系亲密，需要成为彼此的玩伴。那么，在古代有哪些娱乐伴侣呢？　　汉高祖刘邦与戚夫人是一对娱乐伴侣。　　刘邦的妻子是吕雉。吕雉嫁给刘邦时才19岁，风华正茂的年纪。根据八卦记者司马迁的回忆，吕雉年老时容色衰减，由此倒推，她年轻时肯定是有美色的。最难得的是，她还特别贤惠，下田种地、纺线织布、做饭洗衣、照顾孩子、孝顺公婆，活脱脱的刘慧芳。　　年轻、貌美、贤惠、家境好，这么美好的一个女人，可刘邦就是

期刊

干旱区城市低碳发展模式研究——以乌鲁木齐为例

在全球城市化进程中,由碳排放引起的气候变化是目前学术界和决策者面临的最具挑战性的科学问题之一。发展低碳城市己成为国际应对气候变化的重要途径,同时也是目前学术界研究

学位

干旱区城市低碳发展模式碳排放机制环境保护空间结构优化

青藏高原典型冻土区土壤制图研究

青藏高原地域广阔，多年冻土广泛发育，受多年冻土和强烈冻融作用的影响，土壤具有独特的特征。土壤分布特征资料不仅是土地资源合理利用和区域畜牧业规划的基础，同时也是各类陆面过

学位

土壤制图支持向量机冻土区土壤分类青藏高原

中央政治局常委深入县市指导“三讲”

中共中央总书记、国家主席、中央军委主席江泽民２月２０日下午出席了广东省高州市领导干部“三讲”教育会议并发表重要讲话进行动员，他强调，“三讲”教育仍是今年党建工作的重中之重

期刊

“三讲”教育领导干部“三讲”中央政治局江泽民党的建设方针政策党群关系干群关系整风精神

人口非农化对农村土地利用影响研究

我国正处在经济社会发展转型升级的重要时期，实现农业和农村快速发展成为统筹城乡发展和全面建设小康社会的关键。人口非农化是农业劳动力效率上升和经济发展的必然趋势，亟需从

学位

人口非农化农村土地管理传统农区利用效益适应性机制

自媒体对自驾游游客决策影响研究——以日照为例

随着网络与通信技术的发展，“互联网+”和大数据时代的来临，自媒体以其简单的操作、超强的互动、极速的传播、平民化的参与、实时的信息和娱乐的态度成为人们生活不可或缺的一

学位

自驾游游客结构方程模型自媒体决策过程游后评价口碑营销

运用“三讲”教育经验落实“三个代表”要求

在全党县处级以上干部“三讲”教育工作全面展开的关键时刻,江泽民同志发表了“三个代表”的重要讲话。它不仅是“三讲”教育的强大思想武器,也是今后全面加强党的建设的强

期刊

“三讲”教育强大思想武器党的建设江泽民三个代表领导干部马克思主义学风党的指导思想制度建设廉洁勤政

让“迷你型”干部寿终正寝

有一种裙子叫“迷你裙”,因其短而露,充满诱惑力。如今,有一种干部叫“迷你型”干部,因其甜而媚,而充满魅力。他们有的唯领导马首是瞻,恪守“多栽花,少栽刺”的信条,对领导

期刊

迷你型裙子陷阱所用因其心香曲意为人民服务

生物声音的自动探测

与本文相关的学术论文