基于压缩感知的鲁棒性说话人识别技术研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:jueqidf_1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为语音识别的一种,说话人识别技术因为其独有的优势在生物特征认证领域一直备受瞩目,并得到了广泛的应用。目前识别系统中最为常用的MFCC特征参数,在无噪声环境下,虽然有很好的识别效果,但是仍存在两大问题:(1)需要提取以及传输的参数量较大;(2)在有噪环境下识别效果不佳。本文利用新兴的压缩感知技术,改进传统的MFCC参数,从而提出了一种新的说话人识别参数——CS-MFCC参数,使得提取以及传输的参数量降低到传统MFCC参数的1n(n为观测矩阵的压缩比)。在此基础上,本文还完成了以下工作:(1)提出了基于行阶梯矩阵的新参数,并证明当行阶梯矩阵的压缩比为4时识别效果最好。在无噪声环境下,该参数的Fish比高于MFCC参数,系统识别率显著提高,同时基于行阶梯矩阵的新参数对于脉冲噪声和高斯噪声有明显的去噪效果,系统抗噪鲁棒性提高。(2)提出了基于加权循环矩阵的新参数,该参数对循环矩阵的系数加权,从而利用基于能量的非均匀采样法实现了对高频噪声的抑制。通过matlab仿真也证明了系统鲁棒性的显著提高。
其他文献
期刊
期刊
在日趋发达的无线通信技术中,通信的安全与可靠也越来越成为人们关注的焦点。无线通信压制系统的研发为信息安全的传递提供了有力保障。而通信压制系统中能够产生带宽可调、性
无线局域网技术是计算机技术和无线通信技术不断融合发展的产物,也是无线网络技术的一个重要分支。而MAC层技术在整个无线局域网技术中起的关键作用,它的性能在很大程度上决
目前,人脸检测的算法大都是基于图像的人脸检测算法,不是基于视频的人脸检测算法。视频是一个图像序列,对于一个有语义的运动物体(例如行人)来说,视频不但包含运动物体空间位置的
数字多媒体与互联网技术的快速发展,给人们的生活、学习和工作带来便捷之时,又引发了侵犯隐私、盗用版权等非法行为的发生,这也使得古老的信息隐藏技术逐渐成为当前信息安全领域
随着近年来无线通信系统能量消耗的迅猛增长,实现能效优化的绿色通信技术已经受到人们的广泛重视。分布式MIMO多天线系统因其潜在的能效优势备受关注。本文对分布式MIMO多天线
随着科学技术的不断发展,电子信息技术在康复治疗中起到越来越重要的作用。近10年来,康复治疗仪器的发展十分迅速,用于康复治疗的仪器不断出现。其中步态校正在临床诊断、物理治疗和体育训练等重要领域都有着重大的意义。基于这种大的历史背景下,本文研究和制作了符合国人需求的步态校正系统。本文主要的工作包括如下三个部分:(1)首先研究了国内外当前的下肢康复治疗仪器的发展现状,参考了一些医院的病人样本数据,利用V
脉冲多普勒(PD)雷达是一种先进的全相参体制的雷达。经过近50年的发展,PD雷达技术已经发展的非常成熟。近来这种雷达体制更多地与其他雷达体制兼容工作,是信号处理技术发展和
高斯最小频移键控GMSK是20世纪80年代提出的一种非线性连续相位数字调制方式。这种调制是先用高斯型低通滤波器对输人数据进行处理再进行MSK调制而得到的。它优良的特性,如连