耳语音说话人识别的研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户：charles93

【摘要】

：

耳语音说话人识别是指根据包含在耳语音中的同说话人有关的信息来自动识别说话人,可以应用于电话银行、特殊场合的身份确认、公众场合下的通讯和国家安全的某些特殊需要等方

【作者】

：

丁国梁

【机构】

：

苏州大学

【出处】

：

苏州大学

【发表日期】

：

2009年期

【关键词】

：

耳语音说话人识别 MFCC 高斯混合模型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

耳语音说话人识别是指根据包含在耳语音中的同说话人有关的信息来自动识别说话人,可以应用于电话银行、特殊场合的身份确认、公众场合下的通讯和国家安全的某些特殊需要等方面。它是一个较新的课题,有许多问题有待解决。因为耳语音发音方式与正常音不同,所以两者在说话人识别上有着很大的差异。本文建立了基于GMM模型的说话人识别系统,通过研究文本无关的说话人辨认,比较了耳语音和正常音的区别并通过特征的修正优化了耳语音说话人识别系统。本文的工作主要体现在以下方面:建立了22人的耳语音库和正常语音库,使用Mel倒谱系数(MFCC)、线性预测倒谱系数(LPCC)、差分Mel倒谱系数(ΔMFCC)、差分线性预测系数(ΔLPCC)和组合特征MFCC+LPCC作为特征参数,比较了正常音和耳语音的说话人识别效果。利用耳语音库和正常语音库,本文比较了MFCC维数的变化对正常音和耳语音的说话人识别的影响。实验中正常音的说话人识别率在16维最高,而耳语音的说话人识别率在50维最高。提出了一种MFCC的改进方法,分频段完成滤波器组的设计。将滤波器组的设计任务分配给各频段独立完成,使改进后的MFCC能更好的表现信号的局部频率特性。实验表明,改进后的MFCC可以有效地提升耳语音说话人识别系统的性能。

其他文献

高精度溶解氧测量仪的研究与设计

溶解氧(Dissolved Oxygen，DO)是指溶解于水中分子态的氧，是水生生物生存不可缺少的条件，也是水体受有机污染程度的重要指标。快速、准确、连续测量水体溶解氧的含量，对工农业生产

学位

溶解氧电极测氧核心处理器电化学传感器测量精度在线连续监测

智能配用电通信网测试系统研究

随着智能电网的发展,电网的智能化逐步覆盖从发电端至用户端之间的各个环节,并具有可观测特性、可控制特性、自适应特性以及自愈性特性,而配用电网与用户用电服务直接相关,是当前电网智能化发展的研究关键点与难点。依托电力流传输与控制,采用信息与通信融合的新技术是实现配用电网智能化的技术切合点,依据所承载的业务信息同时具有工业传输控制及电力流结构特征,采用一张具有高传输性能、安全性能及平台化的通信网是实现配用

学位

智能电网配用电通信传输规约业务建模测试系统

河南造纸行业5个产品被认定为河南省名牌产品/广东质监局公布2013年广东省生活用纸产品质量专项监督抽查结果/4项造纸国家标准获批

期刊

河南省造纸行业名牌产品广东省生活用纸产品质量专项监督抽查结果

环保部支持新乡县2家造纸企业进行二恶英减排示范改造/广东碳交易试点预计年底启动/2013年7-8月份我国造纸行业主要产品产量

期刊

环保新乡县造纸企业二恶英减排改造广东交易试点启动业主

5Gsa/s数字示波器中数据采集与荧光显示模块的设计与实现

数字荧光示波器(DPO, Digital Phosphor Oscilloscope)是第三代示波器,它结合了前两代模拟示波器和数字存储示波器的优点,既有前者高速的波形更新率和荧光显示效果,也具备后

学位

数字荧光示波器数据采集数字荧光处理PCI9054

合成孔径激光雷达信号模型及成像算法研究

合成孔径激光雷达(SAL—Synthetic Aperture Laser Radar)可以有效地提高合成孔径激光雷达的分辨率、显著增大雷达的调制带宽、提高传输功率密度以及容易实现系统的小型化和

学位

合成孔径激光雷达SAL外差接收RD算法载机平台振动误差

全国工商联纸业商会与中国海运、大连港签署战略合作协议

日前,由国内主要龙头造纸企业为主组成的全国工商联纸业商会与物流业巨头中海集装箱运输股份有限公司、大连港集团有限公司签署战略合作协议,双方承诺建立稳定、长期的战略合

期刊

全国工商联纸业商会中国海运大连港签署造纸企业物流成本战略合作关系运输行业集装箱运输造纸产业物流效率生产成本企业经营集团有限合作

时延估计算法及其应用研究

本文对国内外的各种时延估计算法进行了分析和比较，简要说明了它们之间的相互联系，各自的优缺点。本文在研究通过峰值检测估计时延的基础上，提出了基于经验模式分解(EMD)的H

学位

时延估计算法经验模式分解遗传算法血流速度

基于双耳空间信息的语音分离研究

语音分离技术尤其是基于人耳听觉的语音分离技术,在语音增强、语音识别和助听器等语音信号处理领域具有重要的地位。本文以双耳空间信息为基础,结合语音信号的稀疏性,提出了

学位

双耳声源定位盲源分离语音分离二进制掩码压缩感知

MIMO通信系统中有限反馈技术研究

随着移动通信系统的不断演进,除传统话音业务之外的移动多媒体业务将逐渐成为未来移动通信系统中的主流业务?对于移动多媒体业务的支持,需要通信系统能够提供极高的数据速率,

学位

MIMO有限反馈码本设计非理想信道

耳语音说话人识别的研究

与本文相关的学术论文