语音特征提取及其情感识别的研究

来源 :浙江理工大学 | 被引量 : 0次 | 上传用户:caojunsuper
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的不断发展,尤其是网络技术的日益普及和完善,人机交流变得越来越普遍,为使人机交流更自然、更从容、更人性化,基于语音的情感处理研究已经成为近年来一个重要的研究方向。语音情感识别技术不仅仅在增加计算机的智能化、开发人机交互环境、以及推动心理学、语言学和人工智能等学科的发展,有着不可替代的现实意义,并且它最终会产生巨大的经济和社会效益,目前它在智能玩具、自动电话服务系统和电子宠物等领域都得到了应用。本文的主要目的是在研究分析各种语音情感特征参数的提取方法,以及比较和筛选有效并具有可观的识别效果的分类器的基础上,建立可靠的语音情感识别模型。论文的主要内容是:  (1)介绍语音情感信号的前端处理研究,即情感的分类、情感语音数据库的录制以及语音信号的预处理。简要阐述了语音数据库的分类和获取方法,重点介绍了预处理过程:去噪、预加重、数字化、加窗分帧和端点检测。这里提出了一种两级自适应滤波结构,用来滤除语音信号中常见的两种干扰:周期性干扰和高斯白噪声。  (2)提取和分析几种情感语音的时序特征参数:线性预测倒谱系数(LPCC)、Mel频率倒谱系数(MFCC)和线性预测Mel频率倒谱系数(LPMFCC)。在此基础上,提出了基于经验模态分解(EMD)法的MFCC参数及其一阶差分参数的合成参数作为语音情感识别的特征向量,实验表明其可以产生比较好的识别效果。  (3)在传统的支持向量机的基础上,基于所选取的特征参数,构建了融合模糊思想和最小二乘支持向量机的语音情感识别模型。通常最小二乘支持向量机比传统的支持向量机法计算的速度更快,但训练精度有所下降。为了弥补这个缺憾,所以在其中引入模糊隶属度,从而在兼顾计算速度的前提下确保分类器的训练精度。
其他文献
随着我国经济快速发展,机动车数量呈现大规模增长。过多的机动车给城市交通带来了巨大的压力,交通拥挤成为困扰城市管理的重大问题。道路视频监控是解决交通问题的重要手段,
随着科学技术和社会经济的快速发展,人们的生活理念与生活需求也在不断改变,对住宅环境提出了更高的要求。为给用户提供更加便捷、舒适、安全的居住环境,智能家居应运而生,市场前
随着科技的发展,目标跟踪已经广泛应用到军事和民用领域,同时对目标跟踪应用背景及条件要求也日益提升。滤波算法作为目标跟踪的核心内容,一直是国内外专家学者研究的热点。
从神经电信号中提取出与刺激相关的神经元响应信号对于大脑信息处理机制和脑机接口研究都有着十分重要的意义。然而,由于微电极阵列胞外方式采集的神经信号幅值较小,易受噪声的
更新产品是指对现有的产品进行部分部件的更新或者增加一些新的功能。这样不仅可以充分的利用企业原有的生产和销售渠道,使其减少在生产和广告等的投入,也可以使新生产的产品更
氯乙酸是随着工业生产水平发展同时发展起来的一种应用广泛的化学原料,其氯化工艺所采用的氯化技术效率高、污染低,具有很好的经济效益,具有很强的发展潜力。本文以分析其工艺及
直接转矩控制技术广泛的应用于交流调速系统,因为它有着控制结构简单、转矩响应快、鲁棒性强等特点,是继矢量控制技术之后发展起来的一种新的高性能交流调速方法。定子磁链准确
随机分布系统(Stochastic Distribution Control, SDC)应用在许多实际复杂系统中,该类系统要求控制输出概率密度函数(Probability Density Function,PDF)的形状而不是系统输出本身
有源电力滤波器(Active Power Filter,APF)作为一种电能质量改善工具,能对电网中大量不断变化的谐波和无功电流进行实时补偿。如今对有源电力滤波器的控制方法研究有很多,但大多
随着人工智能以及多媒体技术的快速发展,基于机器学习的自然图像识别方法在过去的几年中取得了很大进步。针对高级语义在人工智能识别领域的应用,本文重点讨论此背景下的机器学