采用2D-Haar声学特征超向量的快速特定音频识别方法

来源 :声学学报 | 被引量 : 0次 | 上传用户:njcdst
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对特定音频事件识别技术在大数据音频处理任务中的准确性和快速性问题,提出一种基于2D-Haar声学特征超向量和AdaBoost算法的快速特定音频事件泛化识别方法。首先将多个连续音频帧的常用声学特征构成"声学特征图",进而提取维数高达数十万的Haar-like声学特征,然后使用AdaBoost.MH或速度较快的Random AdaBoost特征筛选算法,筛选出较高代表性的Haar-like声学特征模式组合,从而构成2D-Haar声学特征超向量;最后分析特定音频事件子类间的共性和差异性,提取子类别的共性,弱化子类间的差异,训练后得到一个泛化的音频事件模板,可支持多子类的泛化识别,能够准确检测并定位音频流中的特定音频事件。实验结果表明,使用2D-Haar声学特征超向量可以获得比MFCC,PLP,LPCC等常用声学特征约5%的识别精度提升、7~20倍的训练速度提升和5-10倍的识别速度提升,在网格法寻得最优参数配置下,可获得93.38%的准确率,95.03%的查全率,这为大数据量的特定音频事件识别提供了一种准确快速的处理方法。
其他文献
在进行腐蚀管道的时变失效概率分析时主要存在腐蚀管道失效状态的判定以及管道腐蚀退化过程的准确模拟两个问题。基于管道试验爆破数据,依据损失函数值最小选择了管道剩余内
文章介绍一套加氢系统的自动化及安全联锁系统方案。阐述该系统的工艺流程、系统方案、硬件配置、系统安全控制功能等。本系统安全联锁项目内容主要有加氢工艺过程的控制。实
研究农业经济准确预测问题,农业经济具有混沌性、非线性的复杂系统,传统方法忽略农业经济变化的混沌性,难以精确地描述其变化规律,导致预测精度低。为提高农业经济时间序列预测的
反腐剧《人民的名义》虽然早已落下帷幕,但后续讨论仍在持续发酵。剧中,退休老党员陈岩石上党课时一句“背炸药包是共产党员才有的特权”迅速走红,燃爆众多党员观众的泪点。$$在
报纸
本研究将TBL教学方法应用于“方剂学”教学,教师根据“方剂学”的课程特点和教学大纲要求,确定教学内容和要点,改革TBL教学方法,将大班授课对象分为8~10人的学习小组,以小组协作的
根据客户满意度相关理论,结合建筑安全支护设备租赁行业竞争实际,将客户满意度理论与行业企业实践结合,对行业企业竞争需求进行把握,从而发现行业应用客户满意度的目的、原则
<正> 特点与现状 积极慎重地做好在大学生中发展党员的工作是高等学校一项具有战略意义的任务,也是高校党建和思想政治工作的重要内容。随着改革开放的不断深入,以高校为依托
由于CAD系统的独立性,传统的虚拟装配系统通常需要通过中性文件来重构CAD系统信息,而修改模型又必须返回到CAD系统。采取“在CAD中增加VR功能”的技术路线,给出了一种面向虚拟装
目的随着医学的发展,为满足住院患者的需求。方法回顾分析2008至2009年间护士的入院介绍工作情况,采用问卷对140名患者进行调查,分析护士入院工作做得不理想的原因。结果 140
当前,国产医疗器械产业急需实现由“中国制造”到“中国智造”,再到“中国创造”的战略转变,作为企业创新驱动力的专利部门就显得尤为重要。在本文中,笔者基于医疗器械行业的特点