基于集成学习的语音活动检测研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:xbh0820
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,语音交互在信息传递中的占比越来越大,语音信号处理也变得越来越重要。在语音信号处理技术当中,语音活动检测作为语音信号处理的前级技术,是语音增强、语音识别等语音处理中的必要环节,其准确率对整个语音信号处理体系有着较大的影响。虽然在信噪比较高的环境当中,传统的语音活动检测方法已经能达到较高的准确率,但在现实场景中,噪声种类较多且信噪比较低,这导致语音活动检测效果急剧下降。因此,研究在不同背景噪声和低信噪比的情况下提升语音活动检测的准确率具有重要的意义。本文在总结现有的语音活动检测算法基础上,提出使用集成学习方法gcForest来进行语音活动检测。集成学习算法是一种新的机器学习方法,它使用多个学习器的组合来进行学习,并能根据不同的组合方式来适应不同的学习任务;相对于单一学习器,集成学习能够明显提升系统的泛化能力,为语音活动检测带来了新的解决方案。为此,本文主要做了以下工作:(1)从理论出发,在大量文献的基础上,分析已有的语音活动检测算法的优势和劣势,并从仿真层面进行验证;(2)使用贴近人耳感知特性的MFCC系数作为特征,提出了使用集成学习框架gcForest作为分类器进行识别,利用gcForest较好的学习能力和泛化能力来对数据进行建模,并采用K折交叉验证防止过拟合,仿真表明了这种集成学习分类器相比SVM来说具有较好的检测能力和抗噪性能;(3)从增加集成学习器的多样性入手,通过在gcForest框架当中增加两种不同的AdaBoost集成学习器来达到对输入属性和算法参数的扰动,来增加整个框架的多样性;在信噪比逐渐降低时,改进后的gcForest框架对噪声的敏感程度要更低;(4)使用HMM来作为gcForest框架的前级结构,利用HMM拥有对动态数据较好的建模能力来对语音和静音数据进行建模,并用Viterbi算法进行解码,将解码后的N个最佳识别结果作为gcForest的特征矢量进行分类,进一步提高语音活动检测的性能。
其他文献
现在互联网上流行的QQ农场游戏,基于B/S模式使广大网民沉迷其中,在脱离网络环境下,不免有些失望,基于VB/SQLServer实现QQ农场游戏设计开发C/S模式,实现单机版或局域网环境的游戏开发
为了减小非球面环形子孔径拼接测量时的中心偏移误差,根据检测原理及几何关系,分析了中心偏移误差在面形测量中的作用机理,推导了中心偏移误差模型,并在此基础上提出了一种基
2003年以来我国房价持续高速增长,房价上涨带来的经济后果受到了学者们的广泛关注。宏观房价上涨时企业房产价值增加,企业的融资能力增强。由于资本市场不完善,银行信贷受到约束时,企业的融资能力成为一种竞争优势,可以提高企业的产品市场竞争地位。同时,企业房产价值增加,使企业的风险承担水平降低,改变企业的投资结构造成资源错配,企业把资源配置到低风险高回报的泡沫行业,挤出主业相关的投资,削弱企业的产品市场竞
养蚕实践中,要获得蚕茧丰收,在养好小蚕的基础上,还必须要加强大蚕期的饲养管理,尤其要抓好4龄和5龄期蚕的饲养。分别阐述了4龄蚕和5龄蚕的饲养技术,以为蚕桑养殖户提供参考。
对盘锦市商禽养殖场污染物排放及对周围环境的影响进行了调查,并对有代表性的商禽养殖场进行监测及评价。结果表明,畜禽养殖污染已经成为盘锦市农业面源污染的重要来源,对其周围
【摘 要】教改明确了自主探究能力是学生要发展的重要能力,而在高中数学课,本身学习过程就是需要一定自主能力以及探究精神,教师为了达到这一目标,就要在方法以及思想上革新,在高中数学课中可以适当开展合作探究。如今合作探究在高中数学课中已经是取得一定的成效,但是还是有诸多的问题存在,比如合作探究比较形式化,高中生的自主参与不足等。本文对当下高中数学课中合作探究的情况展开探讨,并对高中数学课日后的改进提出一
燃气轮机发电作为一种高效,清洁的发电形式在未来具有很大的发展前景。燃烧室是燃气轮机的三大部件之一,燃烧室的优化设计对于提高燃烧效率、降低污染物排放非常重要。本文将
铁皮石斛是我国传统名贵中药材,具有益胃生津、滋阴清热之功效,常用于热病津伤、口干烦渴、胃阴不足,食少干呕等症状;自20世纪90年代以来,随着生物科技的发展,铁皮石斛的产业
意大利作曲家朱塞佩·威尔第是欧洲19世纪最杰出的歌剧作曲家。《西蒙博卡内格拉》是威尔第43岁时完成的第20部作品,此剧的原作者是西班牙作家古蒂雷斯1843年发表的同名剧作
大家知道,传统的决策树算法,如:ID3,C4.5等,存在逻辑表达差、互信息计算复杂、性能改善比较困难等缺陷。仅考虑决策树的错误率;未考虑树的节点、深度等。对属性值分组时逐个探索;没有