基于MFCC和GMM的异常声音识别算法研究

被引量 : 0次 | 上传用户:zqfr3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
异常声音识别是声音识别系统中的一种,是应用音频波形中反映异常声音的特征参数,自动识别异常声音的一种技术。声音识别系统具有计算效率高,复杂度小,采集设备简单,成本低,而且能更好的保护人们的隐私等优点,它还可以和视频监控系统协作。因此,声音识别技术是具有广泛的应用前景,值得很多人投身其研究中。本文针对异常声音识别系统低识别率和高复杂度的问题,将梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficients,简称MFCC)与短时能量混合特征应用到异常声音识别系统中。该混合特征使得高斯混合模型(Gaussian Mixture Model,简称GMM)分类器可获得比使用MFCC特征及其差分MFCC更好的分类性能。分类器的平均识别率可达到90%以上,并且计算复杂度小。给出了系统实现的具体步骤,并通过仿真实验证明了该算法的有效性。在性能研究方面,分析了不同特征参数下异常声音识别系统的识别率,获得特征参数的性能与系统的识别率相关的结果;此外还分析不同高斯混合阶数下异常识别系统的识别率,获得高斯密度个数的选择与训练音频数据量相关的结果;最后对比分析了最大期望(Expectation Maxinum, EM)和最小描述长度(Minimum Description Length, MDL)算法,结果表明MDL算法能够有更好的应用空间。在系统构建方面,本文用MATLAB实现了一个完整的异常声音识别系统,包括音频信号的预处理,特征提取以及分类器的训练和识别。在预处理模块中,对原始音频进行了归一化,预加重,重叠分帧等处理;在特征提取模块中,提取了MFCC,过零率(The Zero-Crossing Rate, ZCR),短时能量(Short-Energy),对数频率倒谱系数(The Log Frequency Cepstral Coefficients, LFCC)等特征参数。在模型训练与识别模块中,使用了高斯混合模型作为分类器,它与其他分类器相比,能更好的分辨出异常声音的差别。该系统实现了对8种异常声音的分类识别,能够得到较高的识别率,而且系统性能好,方法简单,计算效率高,能够保护人们的隐私。
其他文献
目的:探讨音乐疗法对精神分裂症患者生活质量、社会功能及自我尊重感的影响。方法:确诊为慢性精神分裂症的患者120例随机分为2组,各60例。对照组给予抗精神病药物治疗,治疗组
随着现代化生活水平的提高以及高科技的发展,我国高速公路呈现日益增长的发展趋势,随之引发一系列交通噪声问题,噪声污染已成为世界性的大问题,因此,研究开发道路声屏障吸声
适应和发展是人生每个阶段都可能面临的任务,是青少年成长过程中的一项重要能力。学校适应不良在中小学生中具有一定的普遍性,据统计,约有7%~12%的学生有严重的适应不良,主要表现为
N-甲基-D-天冬氨酸受体(NMDAR),是一种配体门控离子通道,在大脑执行功能中发挥关键性作用。最近的研究报道,已经从癫痫患者中鉴定了越来越多的GRIN2A(编码NMDA受体的GluN2A亚
铁路是国家重要的基础设施,与国民经济的发展有着极为密切的联系,合资铁路作为推进铁路投资主体多元化的主要形式,其经营铁路的方式已经被广泛认可。长期以来,合资铁路公司的
风险投资作为一种支持创业者创业的投资工具,在孵化创新型中小企业、推动高技术产业发展、拓宽就业市场、增加就业机会,优化资源配置、培育新的经济增长点等方面发挥了巨大的
盐碱地在农业开发利用过程中不断受到外源重金属的污染,本文研究盐度对珠江口湿地土壤重金属行为的影响,为评价珠江河口湿地以及盐碱地在开发利用中存在的生态风险提供依据。
随着工农业的迅速发展,流域受到人为活动的干扰而发生剧烈变化。流域长期以来形成的自然、社会系统被改变了,流域的许多功能消失了。伴随而来的是流域自然灾害频繁发生,流域
随着我国城市化进程的加快,地铁已成为解决交通拥挤、土地资源紧缺、环境污染等问题的重要途径。由于地铁工程受到线路走向、地下空间等限制,不少地铁线路往往沿着城市道路修
<正>要提升英语教学质量,提高课堂教学效率,应从备课上多下工夫,向课堂45分钟要质量。英语备课应从长期备课和短期备课两方面着手。