基于压缩感知的语音识别

来源 :北京师范大学 | 被引量 : 0次 | 上传用户:guoln
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在近年来,语音识别系统已经广泛应用到日常的工作生活中,例如语音拨号系统。同时,现在的语音识别系统仍然是依靠模式识别技术来实现语音信号的分类判别,模式识别技术关键部分是模型的构建,所以选择一个合适的分类器是得到良好识别效果的基础。  压缩感知是近年来发展较好的技术,基于压缩感知原理的分类器已经在图像识别领域取得很好的效果,所以本文将介绍两种基于压缩感知的稀疏表示分类器的基本原理和算法,然后通过非特定人的孤立词识别和文本无关的说话人识别,检验两种分类器的识别性能,同时对其进行比较分析。本文从TIMIT语音库采集训练测试样本,然后通过一系列信号处理得到语音信号的Mel倒谱系数,因为稀疏表示分类器是传统的统计模型,所以用于模型训练测试的样本应该是维数相等的特征向量,参考支持向量机中的特征处理方法,将高斯混合模型平均超矢量作为两种分类器的特征向量。  利用所有的训练样本构成一个过完备字典,该字典的原子是训练样本,他们按类依次进行排布,使得每类原子组成的子字典具有类别信息。测试样本就是通过这些训练样本线性组合,从而得到用于分类判别的稀疏系数,即是在稀疏限制条件下求解最小e1泛化,得到测试样本的稀疏系数。得到的稀疏系数将在某一个类别的所有项非零,而其他类别的项几乎为零。最后计算测试样本对于每一个类别的重构错误,值最小的类别就判定为测试样本的类别。这就是以压缩感知原理为基础,从而得到的稀疏表示分类器。实验结果显示稀疏表示分类器在说话人识别系统中具有很好的识别性能,且在一定程度噪声下系统具有较好的鲁棒性。而在孤立词识别中,识别性能因为特征等原因,无法达到说话人系统的识别水平。  基于Fisher判别字典学习的稀疏表示分类器是在上述分类器的基础上添加了Fisher字典学习的过程,即是在稀疏系数矩阵训练过程中添加了Fisher判别准则。基于Fisher字典的判别属性主要表现在两个方面:首先是每个类别的子字典可以很好的表示本类的样本,而对其它类别的样本无法很好的表征;其次是通过Fisher字典学习后的系数,类内距小类间距大。因此,基于上述两方面通过Fisher准则训练得到字典。然后在判别过程中,同时利用重构错误和稀疏系数进行分类判别。实验结果显示在无噪声的环境下,基于Fisher判别字典学习的稀疏表示分类器较原来的稀疏表示分类器,识别性能有所提高。但在添加噪声的情况下,识别性能不如原来的稀疏表示分类器。
其他文献
不同于传统控制理论,系统性能极限理论研究的核心问题是:根据系统的内部结构特性判断其闭环控制系统能否获得完美的控制性能,并且计算其最优可达控制性能.显然,系统的性能极
小目标是指图像平面中所占像元数少、信噪比低的目标。小目标的检测与跟踪技术广泛地应用于军事与民用领域,对小目标检测与跟踪算法进行深入研究,具有重要的意义。但是由于小
统一电能质量控制器(UPQC)是具有综合调节功能的串并联补偿调节装置,它包含了串联补偿调节装置和并联补偿调节装置各自具备的特有功能,主要用于综合解决多种电能质量问题。随着
滚动轴承振动信号是由不同零部件振动耦合而成,且滚动轴承工作环境极为复杂,因此具有非常明显的非平稳性,如何从振动信号中提取能够准确反应滚动轴承工作状态的特征量成为对其进行故障诊断关键所在。本文以对滚动轴承振动信号的分析为基础,重点研究了基于时序分析的经验模态分解和时变自回归模型方法在滚动轴承故障诊断中的应用。针对经验模态分解后选择固有模态函数时具有盲目性的问题,提出一种基于能量阀值的固有模态函数筛选
本文选择单级倒立摆作为研究对象,因为它是一个典型的输出多变量、极度非线性、天然不稳定的随动系统,其实现实生活中的倒立摆是处处存在的,比如发射的火箭卫星、摆动的摆钟、体
现实环境中语音信号往往被各种环境噪声污染。语音增强作为消除噪声和提高语音质量的一种有效手段,尽管近年来取得了长足的进步,但仍不能完全满足实用的要求。本文从先验知识
分类是机器学习中一个非常重要的方法,在已有数据的基础上构造出一个分类模型,用来判定新的测试数据的类别。同时稀疏化模型的研究成为研究的热点,希望算法可以得到很好的分
电子技术的广泛应用使得汽车电控系统的结构越来越复杂,当发生故障时,判断故障发生原因以及发现故障的部位也相应的变得越来越困难。随着电子技术和故障诊断技术的发展,汽车
磁力仪是通过测量磁感应强度大小和方向来进行磁异常数据采集仪器的统称。磁场测量技术是一种研究与磁现象相关的物理现象的重要手段。利用磁力仪进行磁异常数据采集是一种非
随着世界范围内对社会公共安全和公众保护需求的日益增长,数以万计的监控摄像头被安装在公园、体育场馆、大型广场、学校、医院、商业街、住宅小区等公众活动和聚集的场所,有