复杂环境下基于GMM和SVM的语音激活检测算法研究与实现

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:mike1983mm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音激活检测技术采用一定的信号处理技术来检测输入信号是否包含有语音,是语音通信领域的关键技术。随着移动通信和网络电话的飞速发展,语音激活检测广泛应用于语音编码、语音增强以及语音识别等系统以降低语音编码速率,提高通信系统性能。传统的语音激活检测方法包括基于门限比较的算法、基于模型匹配的算法等。然而,基于门限比较的算法中,固定的门限值往往不能适应不同类型和信噪比的背景噪声环境;而基于模型匹配的算法中,假设的背景噪声模型可能与实际背景噪声环境存在较大差异。因此,这两种算法在复杂噪声环境下的性能都得不到保证,提高复杂环境下语音激活检测算法的稳定性和准确性依然是近年来研究的重点,对于语音通信系统的发展有着重大的意义。支持向量机作为一种基于机器学习的分类方法,在解决音频分类、语音识别问题时体现出良好的性能。因此,针对现有算法在复杂环境下性能下降的问题,本文通过学习研究高斯混合模型(Gaussian Mixture Model,GMM)算法、支持向量机(Support Vector Machine,SVM)算法,并结合多种语音特征值,提出了复杂环境下准确性和稳定性较高的语音激活检测算法。具体工作如下:第一,提出一种基于GMM和SVM的语音激活检测算法,旨在实现不同背景噪声环境及信噪比条件下准确性和稳定性较高的语音激活检测。该算法包括如下几个步骤:首先,使用改进的多类SVM对噪声环境进行分类,根据不同的噪声环境选取适合的特征参数;其次,利用GMM算法对所选取的特征参数进行变换,将经GMM聚类后得到的高斯超向量作为SVM语音激活检测系统的输入;最后,使用高斯超向量构造K-L核函数,并选取最优SVM参数,设计SVM分类器,准确区分噪声和语音。仿真结果表明,提出的算法与经典的基于GMM的模型匹配语音激活检测(Voice Activity Detection,VAD)算法相比,在人群噪声环境、机器噪声环境及白噪声环境下都具有更高的准确性,并且在低信噪比条件下优势更为明显。第二,提出一种基于短时能量和相关性的多特征值VAD算法,旨在保持较低算法复杂度的前提下提高IP电话(Voice over Internet Protocol,VoIP)系统回声消除模块中远端语音激活检测的准确性。该算法通过引入远端信号与近端信号的互相关这一特征值,排除了远端信号实际只包含近端残留回声的情况,提高远端VAD的准确性,从而避免远端无语音情况下滤波器的错误更新和滤波。仿真及实际测试结果表明,相比经典的基于能量的远端语音激活检测算法,所提远端语音激活检测算法可以更准确地判断远端语音活动性,从而有效地改善回声消除的效果。
其他文献
弹性填料和悬浮球填料是两种对微污染水源进行生物接触氧化预处理的常规填料,在果园桥水厂已运行多年,总结了两种填料的处理效果和运行情况。结果表明两种填料对微污染水源水
那时我刚走上工作岗位。早听说老师不好当,现在的孩子个个都鬼精灵,要想做个好老师,让他们真正喜欢,很不容易,于是我一直惶恐,也一直努力。好在我和孩子们处得还不错,他们都
期刊
摆在纺织服装业面前的重任之一是实现清洁生广,提升清洁生产水平,要发展生态原料与辅料;重视无水少水染整技术的创新;关键技术要实施新突破。
目的 研究负荷超声心动图在犬实验性重度心肌挫伤后心肌损伤程度判定中的应用价值。方法 选取杂种犬10只,3%戊巴比妥钠静脉麻醉,采用BIM-Ⅱ型生物撞击机制成心肌挫伤模型。常规
目的探讨彩色多普勒超声在甲状腺癌诊断及鉴别诊断中的应用价值。方法回顾分析甲状腺肿瘤患者64例,其中甲状腺癌33例,甲状腺腺瘤31例,全部经手术病理或组织活检证实。观察并比较
<正>名师一课,一个小时左右中浓缩的可能是一生的积淀。若能用心体会积累,语文学习与考试将不再是难点。若你有特别喜爱或难懂的课文,尽管对我们吐露,名师的心血结晶将让你洞
近年来,猪瘟、猪丹毒、仔猪副伤寒、猪链球菌病和猪弓形虫病等疾病,由于病原在流行过程中不断发生变异、毒力减弱、加上猪群中的免疫水平参差不齐,导致某些疾病在流行过程、
互联网产业的勃兴,让传统媒体业态发生根本性变化。在移动互联网的大潮中,传统媒体正在接受互联网的洗礼,2014年迎来纸媒转型高峰,以“解放军报”、“人民日报”为代表的报纸
输血疗法对于急性贫血疾病、败血症、中毒性疾病等急症、重症的抢救疗效显著.但是,以往在输血前供血牛与受血牛必须做血型交叉试验,如果供血牛与受血牛之间血型不合,那么供血