基于核函数的语音情感识别技术的研究

来源 :东南大学 | 被引量 : 0次 | 上传用户：qiwa99

【摘要】

：

作为情感计算的一个重要分支,情感识别在近年来引起了国内外研究者的广泛关注。语音作为人类交流的重要方式之一,承载着说话人大量的情感信息。语音情感识别技术能够使计算机

【作者】

：

陈文汐

【机构】

：

东南大学

【出处】

：

东南大学

【发表日期】

：

2015年期

【关键词】

：

语音情感识别核C均值聚类核K近邻核稀疏表示支持向量机

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

作为情感计算的一个重要分支,情感识别在近年来引起了国内外研究者的广泛关注。语音作为人类交流的重要方式之一,承载着说话人大量的情感信息。语音情感识别技术能够使计算机通过语音信号识别说话人的情感状态,实现更和谐的人机交互,在实际生活中具有非常广阔的应用前景。本文主要研究了基于核函数的语音情感识别,将核方法引入传统的模式识别算法中,进一步提高算法的非线性处理能力,并针对相应的算法提出若干改进应用于语音情感识别中。本论文的主要研究内容和创新点如下：(1)阐述了语音情感识别的研究背景和意义,并总结了情感描述模型、情感数据库、情感特征参数、特征降维及情感分类算法等方面的国内外研究现状。(2)设计并录制汉语语音情感数据库,该库包含高兴、愤怒、悲伤、害怕、平静等五种基本情感下的语音,且全部语音样本都经过有效性检验以确保数据符合规范。对数据库中的语音信号进行预处理工作,并提取出语速、能量和幅度、基频、共振峰、MFCC等参数组成情感特征矢量并分析不同情感状态下参数的变化规律,为后续语音情感实验做好基础工作。(3)提出一种核C均值聚类与核K近邻分类相结合的算法用于语音情感识别中,该算法利用核映射将原输入空间映射到高维特征空问,在特征空间内进行C均值聚类构造代表性的情感模板,再利用K近邻算法对测试样本分类。该算法不仅利用了核方法提高分类器的非线性处理能力,还克服了传统核K近邻分类时需要计算测试样本与所有训练样本间距离的缺点,提高了分类速度。为了进一步提高该算的识别正确率,本文还将模糊集的理论引入该算法中,通过构造模糊聚类得到更优的情感聚类集合并在近邻分类时通过构造隶属度函数使测试样本以不同程度隶属于各个情感类别,得到更加符合实际情况的分类结果。最终实验表明,该算法具有更有效的识别效率。(4)提出将核稀疏表示分类算法应用在语音情感识别中,该算法利用核映射机制将传统稀疏表示分类器推广到核稀疏表示分类器,克服了稀疏表示分类器不能有效解决非线性问题的缺点,使测试样本更准确地表示为训练样本的一个稀疏线性组合。最后利用局部编码的思想对该算法进行改进,提出一种基于局部约束的加权核稀疏表示分类算法,与核稀疏表示分类算法相比,该算法能够使测试样本用更多近邻的训练样本进行稀疏表示,在一定程度上能够提高分类的准确度。(5)对支持向量机中的核函数进行了深入研究并提出改进,为了突出了不同特征对分类作用的差异性,本文将特征重要程度的信息融入多项式核函数和高斯核函数中,然后利用改进后的多项式核函数和高斯核函数组成组合核函数,最后再通过优化算法寻找最优核参数以获得性能最优的组合核函数。该算法不仅对基核函数进行了改进,还利用组合核函数代替单一核函数,并通过优化算法寻找最优核参数及组合参数,可以说对传统支持向量机做了多重改进以提升算法性能。

其他文献

基于PSoC和LabVIEW的大白鼠脑电信号采集与处理系统

脑电信号是一种典型的生物电信号,包含了大量的生理和病理信息,通过对脑电信号的研究,我们可以了解神经细胞电活动与生物的生理和心里状态之间的关系,在脑疾病的临床治疗和认

学位

脑电信号无线传输PSoCLabVIEW

IP网中基于定价的多服务资源分配机制研究

随着网络业务量的迅猛增加和业务类型的多样化，网络的带宽资源己成为一种典型的稀缺资源。因此，网络资源的分配和控制对于提高用户对网络服务的满意度，优化网络系统的整体性能具

学位

IP网络资源分配服务质量网络定价

基于双核处理器的流速剖面数据处理系统的研究

声学多普勒流速剖面仪ADCP(Acoustic Doppler Current Profilers)利用声波的多普勒效应,通过高效、可靠的信号处理方法来测量各水层的水流速度。与传统的流速测量方法相比,AD

学位

流量测量系统ADCP多普勒信号频率测定功率谱密度

IEEE802.16e OFDMA系统同步及相关技术研究

OFDMA系统中前导序列的相关特性,对最大峰值的检测与处理方法进行改进,使帧的起始位置得到很好的估计。在分析细同步时候,分析了IEEE802.16e OFDMA前导符号时域中心共轭对称

学位

OFDMAIEEE 802.16e同步载波干扰噪声比

多用户OFDM系统动态资源分配算法的研究及其应用

本文主要研究了多用户OFDM(Orthogonal Frequency Division Multiplexing , OFDM)系统的动态资源分配问题。首先介绍了正交频分复用的基本原理和认知无线电技术。其次研究了

学位

认知无线电多用户OFDM动态资源分配跨层调度

毫米波无线局域网中的导频同步关键技术研究

随着各种无线业务需求的发展和智能终端的普及,低频波段显得愈发拥挤,下一代无线局域网(WLAN)系统不仅需要提供更好的网络服务,同时需要支持更高速率的实时业务。当前的无线

学位

毫米波无线局域网正交频分复用导频位置优化频偏相位噪声

基于QOTDM卫星下行链路传输研究

准正交时分复用(QOTDM)技术是连续波时分复用(CWTDM)技术实现的一种方式,它能够将多路带限信号的采样样点复接成一路信号在一条连续信道中可靠传输。该技术使得FDMA/QOTDM卫

学位

QOTDM样点定时同步信道估计信道均衡

基于软件调制解调的电力线载波抄表系统研究

低压电力线恶劣的传输环境使得载波抄表系统在应用中还面临着诸多难题,其中,载波通信和自动中继技术是制约其性能的两个重要因素。为了降低系统成本、提高通信可靠性、增强中继抄表功能,本文在探讨载波通信采用软件方式实现的设计方法后,提出了一套基于软件调制解调的载波抄表系统方案。同时,在载波中继抄表问题上,首次引入蚁群随机搜索机制,研究了一种电力线载波抄表自动路由算法。最后,通过计算机仿真和设计专门的上位机测

学位

电力线载波通信自动抄表系统软件调制解调中继技术自动路由算法

基于混沌加密的视频编码算法研究

本课题的研究工作是结合导师科研课题“部队油料库无线网络视频监控系统”展开的。视频通信系统已经发展到以数字化和网络化为特征的第三代视频通信系统,在得到越来越广泛应

学位

分形理论图像压缩混沌序列混沌图像加密

井下3.3kV供电网漏电保护系统研究

目前,大多数矿井开始将综采面工作电压由1140V提高到3.3kV。电压等级的提高使因供电网漏电故障引起的设备损坏和人身触电之类的事故发生更加频繁,危害性也更大。而且井下工作

学位

3.3kV供电网选择性漏电保护附加直流电源自然直流保护抗干扰

基于核函数的语音情感识别技术的研究

与本文相关的学术论文