基于MFCC与IMFCC的说话人识别研究

被引量 : 0次 | 上传用户:lieying110
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别是指利用语音信号包含的信息来辨认说话人是谁或者确认此说话人是否为所声言的说话人。如今在低噪声、低失真环境下说话人识别已经达到较高的识别性能,但说话人识别的实际应用环境中却充满了噪声,导致说话人识别系统的识别率急剧下降。因此,目前的研究热点已转为提取噪声环境下仍能达到较好性能的鲁棒性特征和设计更加有效的分类器,从而真正实现说话人识别系统走出实验室,走向实际应用场合。针对以上需求,设计了一个以短波信道为背景的说话人识别系统,即以在短波信道环境下获得的语音信号为数据进行实验。在特征提取阶段,剖析了基于人耳听觉机理的美尔倒谱系数(MFCC),从美尔滤波器组的结构上看,MFCC只在信号的低频区域具有较高的分辨率,在高频部分分辨率却较低,这样必然会遗失一些包含在高频区域的信息。本文应用翻转的美尔滤波器组提取出一组特征IMFCC,弥补了传统的MFCC在高频提取特征信息薄弱的不足,与原始MFCC形成互补关系。鉴于两种特征的互补关系,设计多分类融合系统,以支持向量机为分类器,分别以MFCC和IMFCC为特征单独执行分类,将得到结果按某种方式融合,取两者之长,最后做出判决来提高说话人识别系统的性能。另外应用自适应动态阈值的开集说话人识别算法,建立一个综合所有参考说话人语音特性的非特定说话人RN+1,将其列入参考说话人之中,识别时以其得分作为阈值判定待识说话人是否在集内,若在集内给出识别结果,若在集外则将待测者自动加入参考说话人集中。经实验证明,以MFCC&IMFCC为特征进行多分类融合的方法能够在短波信道环境下获得较好的识别效果。
其他文献
目前,WLAN(无线局域网)以其建网成本低廉和入网方便等优点,深受人们的欢迎,正在进入普及化和规模化阶段。WLAN的迅速发展,也相应地引起了众多攻击者的注意。与有线网相比,由
【目的】通过CRISPR/Cas9基因组编辑技术遗传改良优质粳稻秀水134来创制糯稻新材料。【方法】构建靶向水稻直链淀粉合成主效基因Wx的CRISPR/Cas9表达载体,并通过农杆菌介导秀
本论文在充分学习国内外城市轨道交通与常规公交系统整合协调的基础上,对西安市地铁二号线的交通情况作了现状的调研,基于轨道交通与常规公交的特性及功能定位,通过“四阶段
本文在考虑道路线形、行车视距、车辆横向力系数等因素下,综合考虑各种因素情况下,设定匝道限速值,并设计交通安全设施,目的是保证安全的情况下尽量提高道路通行能力。
以人为本已成为地方高校教学质量评估体系建设的价值取向,但是当前地方高校教学质量评估体系中存在着教学管理者缺位的问题。这一问题主要表现为教学管理者的价值缺位,即评估
目的观察分析多西紫杉醇联合替吉奥在治疗蒽环类耐药三阴性乳腺癌(triple-negtive breast cancer,TNBC)中的临床疗效。方法选择2009年6月~2011年6月绍兴市人民医院肿瘤放疗科
目的 了解狼疮新月体肾炎 (CLN)患者临床和病理特征。方法 对 38例CLN的临床、血清学和病理改变进行分析归纳。并将肾功能异常和肾功能正常的CLN患者进行比较。结果 CLN患
选取人工合成的无定型氧化铁(AHOsFe)纯矿物,以及两种典型土壤(黑土和砖红壤)的原土(S1和S2)和AHOsFe包被土壤(AHOsFe-S1和AHOsFe-S2)为研究材料,采用批量平衡法,研究AHOsFe对土壤中
创新驱动发展战略的实施离不开各类人才的有效支撑,要想更好地实施创新驱动发展战略,必须培养出大批的高素质创新创业型人才。当今世界,创新创业发展作为决定国家或区域未来
笔者分析了生产运作管理核心课程群构建,是为了满足社会制造业和为地方经济发展而服务的需要。在总结现有课程群存在内容交叉重复、实践内容薄弱的基础上,构建了以持续学习能