语音情感状态模糊识别研究

来源 :电子科技大学 | 被引量 : 5次 | 上传用户:lengxiang520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音情感识别技术是人工智能领域的一个新兴分支,在建立和谐人机交互环境和安全系统自动监督方面有着广泛的应用前景,对人类的进步意义是重大的。语音情感的识别过程主要包括语音信号预处理、语音情感特征参数提取分析、语音情感类别分类识别。由于情感信息这一语义变量本身的模糊、不可确定性,所以对情感状态进行精准识别是很有难度的。而在识别过程中所用到的情感特征参数的维数又高,增加了识别的难度,降低了识别率。为此,本文针对基于模糊理论的语音情感识别方法进行了研究,主要研究内容如下:1、研究了语音信号的端点检测、预加重、分帧和加窗等预处理步骤,以及提取详细的语音情感特征参数和用KPCA方法对语音情感特征降维分析。KPCA能够降低特征的冗余度,有效减少学习算法的运算量,改善识别性能。实验结果表明基于核主成分分析方法的特征选择使识别结果得到提高。2、研究了基于模糊支持向量机算法(FSVM)的语音情感识别方法,通过将模糊理论与支持向量相结合,提高支持向量机方法的学习性能和泛化能力,解决小样本、非线性、高维数以及局部极小点等问题,并消弱噪声和孤立点对模糊分类的影响,改善了对语音情感状态的识别率。3、研究了基于自适应模糊C均值算法(AFCM)的语音情感识别方法,该方法对不同的数据使用不同的聚类半径,弥补了FCM方法使用同一个聚类半径的不足,改善了语音情感状态的识别率。在AFCM算法中,实验发现用Mahalanobis距离函数和模糊加权指数m=2时对四类的情感识别率都最高。而在FCM算法和AFCM算法对比实验中发现,AFCM比FCM有更好的识别效果。4、研究了模糊矢量量化相关理论,接着研究模糊核矢量量化算法(FKVQ)和模糊核熵矢量量化(FKEVQ)。在FKEVQ算法中引入了码字矢量量化,把相似的数据量化成码书,还用核映射将输入空间映射到高维特征空间,使数据有更好的区分性,同时为了平衡隶属度函数,使用模糊熵度增加不同数据的可区分性。实验发现码书中的码字数目C为22和模糊加权指数m为1.1以及高斯核宽度δ为5时,FKVQ算法性能是最优的。而在研究FKEVQ算法发现,FKEVQ系统的误识率随着模糊熵度初值增大有一定的上升趋势,当λ为0.06时,FKEVQ的识别率最佳。
其他文献
随着数据媒体等新通信业务需求的出现,基于电路交换的PSTN网逐渐暴露出其资源利用效率和可靠性低的缺陷。VoIP技术采用IP网络作为传输载体实现语音通信,同PSTN网相比,提高了电话
随着计算机网络和多媒体技术的飞速发展,大量的图像数据信息通过Internet进行传输,这些信息的安全性逐渐成为人们所关心的问题。由于传统技术无法对图像这样数据量大的信息进
房地产开发项目中,开发成本控制是房地产企业主要的工作之一。房地产的开发成本控制应该在项目各阶段进行全过程成本管理与控制。通过运用科学合理的管理方法和措施,以达到把各
嵌入式系统的存储器空间和寻址能力是有限的,采用计算机汉字字库存储和识别机理必将限制嵌入式系统的工作性能。因此,研究基于嵌入式系统的汉字存储与识别改进技术尤为重要。
本文从房地产多项目开发的必要性着手,对当前的多项目开发模式进行了探讨,同时指出了多项目管理中的问题,探讨了房地产多项目开发的有效模式,目的是为房地产管理工作提供指导和依
近年来随着海洋开发和水下探测需求的日益增加,高分辨率成像声纳的研究越来越受到重视。目前,使用电子电路的传统高分辨率声纳通常具有较大的体积、较高的功耗和较低的图像更
多输入多输出(MIMO)雷达采用多个发射和接收天线,且每个发射天线发射相互正交的信号,其中分置天线MIMO雷达的天线相距较远,保证了各收发通道间的独立性,能在多个不同方向上对
阵列信号处理一直以来都是大家备受关注的问题,已经应用于多个领域之中,而波达方向估计(DOA)是其中比较重要的部分。由于实际环境的复杂性,现实中往往不是一种信号单独存在,
OFDM(正交频分复用)最突出的优点是频谱利用率高、抗多径时延能力强,适合未来高速宽带无线通信的应用。在宽带移动OFDM系统中,不同的子信道经受不同的信道衰落,具有不同的传
大数据时代背景下,越来越多的音乐著作在互联网上呈现出来。然而海量音乐反而使得用户更难找到喜欢的作品,也使冷门的音乐愈发无人问津。因此,需要最大程度地挖掘音乐间的关