论文部分内容阅读
随着信息技术和网络通信的快速发展,人们已经不仅仅局限于对信号的准确获取上,更期望对信号进行深度的挖掘,这是信号领域的一场革命。语音作为人类交流和人机交互最重要的一种工具,语音信号的识别和情感分析在互联网、通信、人工智能等等高科技领域中变的日益重要,因此专家们在语音信号识别和情感分析方面进行了大量的工作,在这些研究方向中,语音内容的识别日益趋于成熟且已经商用。虽然近些年针对语音情感识别的研究,相当多的研究成果得以发表,取得了很大的发展,但是语音情感识别研究仍处于初级阶段,一直没有形成一套被广泛认可的、系统的理论和研究方法。此外,实际生活中大多语音信号都处于噪声环境中,而传统的语音情感识别算法大多针对于纯净语音,因此寻找一种具有较好鲁棒性的语音情感识别技术迫在眉睫。压缩感知是近些年提出的一种新型采样技术,且基于压缩感知提出的稀疏表征识别算法在图像和语音识别领域展现出优异的识别性能。语音情感信号在小波等变换域中具有较好的稀疏性,因此将压缩感知技术应用于语音情感识别中,具有较强的理论基础。此外,压缩感知重构算法对信号中的噪声有一定的抑制作用,而针对噪声环境下语音情感识别的研究较少。基于上述分析,在现有研究的基础上,我们将压缩感知技术与语音情感识别相结合,使语音情感识别系统性能的进一步提升成为可能,具有重大的理论和实际应用价值。本文开展了针对纯净和噪声环境下,基于压缩感知的语音情感识别研究,具体工作内容如下:1)通过深入研究语音情感识别系统理论和压缩感知算法,将压缩感知应用于语音情感识别领域,研究了基于压缩感知的语音情感识别算法。仿真实验表明:与经典的GMM语音情感识别算法相比,基于压缩感知的语音情感识别系统在低信噪比时可以取得更好的识别结果。实验结果验证了将压缩感知应用于语音情感识别这一思路的正确性,拓宽了语音情感识别算法思路。2)为进一步提升纯净及噪声环境下语音情感识别系统的识别性能,本文研究了一种压缩感知抑噪语音情感识别系统。首先采用压缩感知技术对带噪语音进行稀疏重构,进而提取稀疏重构后信号的声学特征,最后将特征输入到传统的GMM分类器中。仿真实验表明:与不采用压缩感知语音抑噪的情感识别系统相比,本文提出的方法能够取得较大的识别增益,识别率提升了 5到32个百分点。3)为进一步提升语音情感识别系统的性能,本文针对压缩感知稀疏解存在的缺陷,提出了一种基于稀疏贝叶斯学习的语音情感识别算法。首先将语音信号提取参数特征,经稀疏贝叶斯学习进行参数向量重构,然后使用重构的参数向量与情感码本计算重构距离,进行情感分类。仿真实验表明:稀疏贝叶斯学习算法可以更加接近l0-范数的解,与FOCUSS、BP相比具有较小的重构误差。实验证明将稀疏贝叶斯学习算法应用于语音情感识别系统,提升了识别系统的性能,显示了该算法在语音情感识别领域的应用潜力。在本文最后部分对论文所有的研究和成果做了总结,并对日后的研究工作进行展望。