耳语音说话人识别的研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:charles93
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
耳语音说话人识别是指根据包含在耳语音中的同说话人有关的信息来自动识别说话人,可以应用于电话银行、特殊场合的身份确认、公众场合下的通讯和国家安全的某些特殊需要等方面。它是一个较新的课题,有许多问题有待解决。因为耳语音发音方式与正常音不同,所以两者在说话人识别上有着很大的差异。本文建立了基于GMM模型的说话人识别系统,通过研究文本无关的说话人辨认,比较了耳语音和正常音的区别并通过特征的修正优化了耳语音说话人识别系统。本文的工作主要体现在以下方面:建立了22人的耳语音库和正常语音库,使用Mel倒谱系数(MFCC)、线性预测倒谱系数(LPCC)、差分Mel倒谱系数(ΔMFCC)、差分线性预测系数(ΔLPCC)和组合特征MFCC+LPCC作为特征参数,比较了正常音和耳语音的说话人识别效果。利用耳语音库和正常语音库,本文比较了MFCC维数的变化对正常音和耳语音的说话人识别的影响。实验中正常音的说话人识别率在16维最高,而耳语音的说话人识别率在50维最高。提出了一种MFCC的改进方法,分频段完成滤波器组的设计。将滤波器组的设计任务分配给各频段独立完成,使改进后的MFCC能更好的表现信号的局部频率特性。实验表明,改进后的MFCC可以有效地提升耳语音说话人识别系统的性能。
其他文献
溶解氧(Dissolved Oxygen,DO)是指溶解于水中分子态的氧,是水生生物生存不可缺少的条件,也是水体受有机污染程度的重要指标。快速、准确、连续测量水体溶解氧的含量,对工农业生产
随着智能电网的发展,电网的智能化逐步覆盖从发电端至用户端之间的各个环节,并具有可观测特性、可控制特性、自适应特性以及自愈性特性,而配用电网与用户用电服务直接相关,是当前电网智能化发展的研究关键点与难点。依托电力流传输与控制,采用信息与通信融合的新技术是实现配用电网智能化的技术切合点,依据所承载的业务信息同时具有工业传输控制及电力流结构特征,采用一张具有高传输性能、安全性能及平台化的通信网是实现配用
数字荧光示波器(DPO, Digital Phosphor Oscilloscope)是第三代示波器,它结合了前两代模拟示波器和数字存储示波器的优点,既有前者高速的波形更新率和荧光显示效果,也具备后
合成孔径激光雷达(SAL—Synthetic Aperture Laser Radar)可以有效地提高合成孔径激光雷达的分辨率、显著增大雷达的调制带宽、提高传输功率密度以及容易实现系统的小型化和
日前,由国内主要龙头造纸企业为主组成的全国工商联纸业商会与物流业巨头中海集装箱运输股份有限公司、大连港集团有限公司签署战略合作协议,双方承诺建立稳定、长期的战略合
本文对国内外的各种时延估计算法进行了分析和比较,简要说明了它们之间的相互联系,各自的优缺点。 本文在研究通过峰值检测估计时延的基础上,提出了基于经验模式分解(EMD)的H
语音分离技术尤其是基于人耳听觉的语音分离技术,在语音增强、语音识别和助听器等语音信号处理领域具有重要的地位。本文以双耳空间信息为基础,结合语音信号的稀疏性,提出了
随着移动通信系统的不断演进,除传统话音业务之外的移动多媒体业务将逐渐成为未来移动通信系统中的主流业务?对于移动多媒体业务的支持,需要通信系统能够提供极高的数据速率,