基于多核融合和模型参数自适应的非特定人语音情感识别研究

来源 :江苏大学 | 被引量 : 0次 | 上传用户:ponny2006
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音情感识别是情感识别的一个重要分支,它利用计算机及其辅助设备提取说话人的情感特征,分析说话人的情感状态及其变化,进而确定说话人的心理情绪或思想活动,实现人机之间更自然、更智能化的交互。目前,特定人语音情感识别研究已经取得了巨大的成就,特别是在远程教育、医疗、通信、刑事侦查等方面已经得到大量应用;但现实世界中,非特定人语音情感识别的应用领域更加普遍,故针对非特定人的语音情感识别研究具有更大的现实意义。本文正是针对非特定人语音情感识别过程中识别模型对待识别样本的适应性问题,提出改进方法,并通过实验进行有效性验证。论文主要工作如下:   (1)提出基于错分样本近邻支持向量优选的语音情感自适应识别算法。该算法用语音情感训练集样本训练的初始模型对新增的语音情感样本进行识别,把被识别错误的语音情感样本作为自适应样本,与对其进行识别的模型中的近邻支持向量一起构建自适应训练集,根据C-SVM模型参数拉格朗日乘子总和保持不变的原则,通过SMO算法调整模型的支持向量和对应的拉格朗日乘子,从而提高模型的泛化性能。   (2)提出基于特征分组的多核融合语音情感自适应识别算法。此算法首先把语音情感特征按照待识别样本集的特性分为若干组,然后根据各组特征的特性采用不同的核函数训练C-SVM模型,并分别把各个模型支持向量间的相似度作为其权重系数,通过自适应样本不断调整权重系数和模型参数,使得C-SVM模型的参数能够随着待识别语音情感样本特性的变化而自适应地变化。这种特征集与核函数相匹配的方法最大程度的利用了不同特征的特性和不同核函数的优点,使得模型的识别性能进一步提高。   (3)采用Matlab和VC++结合的开发模式,实现了非特定人语音情感识别原型系统。其中语音信号的读取和处理以及情感特征的提取均采用Matlab编写代码实现,模型训练、情感识别功能用VC++编写代码实现。最后,通过与其它算法实验结果的对比和分析,证明了本文算法的有效性和稳定性。
其他文献
本文对无标度网络的研究可以大致分为三个密切相关却又逐层深入的方面:通过实证量化网络的统计性质;构建对应的网络模型来研究这些统计性质;在已知网络拓扑结构及其构建规则的基
在以往嵌入式系统主要在控制领域应用,在数据存储方面的要求并不是很高。但随着信息技术的不断发展,嵌入式技术在诸多领域得到广泛应用,嵌入式系统中要存储的数据信息量不断
随着经济的发展,软件的规模越来越大。仅仅依靠原来的开发方式已经无法满足社会的要求。传统的作坊式开发方法费时费力,存在大量的重复劳动,软件开发的速度已经完全跟不上社
随着虚拟环境(Virtual Environment,VE)技术研究的深入以及语义Web技术的广泛应用,语义虚拟环境(Semantic Virtual Environment)的研究已成为虚拟环境领域一个崭新的研究方向
无线传感器网络作为多学科相互交叉的新兴的研究领域,可以实时的监测和采集网络分布区域内各种监测对象的信息,并将这些信息发送给远方的观察者,来实现对目标对象的跟踪与监
随着计算机技术的高速发展,数字图像信息的应用面越来越广,数字图像处理技术也随之得到了空前的发展和更广泛的应用。图像缩放作为图像处理技术的一种,在实际应用中具有重要
目前,移动应用程序大多需要适配多个物理平台(Android&iOS)。由于各个平台在技术层面的差异性,同一应用必须针对不同平台进行定制,导致了软件设计与实现过程中的多遍重复式开
传统的关系数据库一般采用关系模型作为其信息数据的组织方式,而关系模型是以布尔逻辑和精确的数据工具为基础的,它不能够直接表示更不能够处理模糊的、具有不确定性的数据信息
随着互联网的迅速普及,互联网应用越来越简易,使得上网人数与日俱增。互联网生活呈现出多元化,复杂化的趋势,越来越多的人们开始关注互联网,开始通过互联网来发出自己的声音,
当前企业之间的竞争日益激烈,而企业之问的核心人才,无疑已经成为了现代企业最强有力的竞争力。但是,目前很多企业人才流失比较严重,原因有很多种,薪酬待遇,企业环境,职业发