高斯混合模型用于语音情感识别研究

来源 :广西师范大学 | 被引量 : 3次 | 上传用户:cjw37600
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音情感识别技术是人工智能(AI)领域的一个重要分支,该技术是通过对语音信号进行分析处理来识别说话者当时的情感状态。随着计算机科学技术与其他学科如生理学、心理学、统计学等相互交叉和发展,语音情感识别技术获得了显著的进展。情感自身具有主观性和复杂性,对情感进行建模,开展情感计算研究具有重大的理论和实践意义。随着计算机技术和机器智能技术的发展,越来越多的人工智能设备和产品将会被开发出来,并会在社会生活的各个领域中得到广泛的应用,如教育行业、医学界、服务行业和工业等领域。本文采用高斯混合模型,对语音情感识别问题做了较系统的研究。首先,基于情感理论基础知识确立了本文的实验语料库,并选取了四种基本情感状态作为本文的研究对象,即生气、高兴、恐惧、悲伤。接着对语音信号进行预处理操作,便于提取更为有效的情感特征。其次,鉴于语音情感特征提取的好坏将会直接影响识别的效果,所以本文的特征参数提取兼顾韵律学、音质以及谱等三个方面,这些特征分别是语速、短时能量、基音频率、共振峰参数以及Mel频率倒谱系数(MFCC)五类特征,对这一系列特征进行提取计算和分析研究,最终确定了21种语音情感特征作为高斯混合模型(GMM)的输入参数。再次,通过选取不同的情感特征和不同的识别模型进行实验,寻找能区分各种情感的有效情感特征。本文先选用支持向量机(SVM)模型进行识别,通过对比不同的核函数的识别效果决定选用线性核,并且使用网格搜索法确定了用于识别的最优参数;然后采用层次模型决策树、分层模型分别进行识别。最后,利用已确定的21种语音情感特征和高斯混合模型在语料库的训练数据集上对四种基本情感建立识别模型。在建模的过程中,使用到了极大似然估计(MLE)和期望最大化(EM)算法对高斯混合模型的参数进行优化。在进行优化训练的过程中,极大似然估计详细推演了期望最大化算法迭代并直到最后收敛的过程。最终确定了最优的高斯混合模型,并使用该模型在测试数据集上进行了识别实验。同时对其他三种识别模型(即支持向量机、决策树和分层模型)的实验结果做了详细的分析,最后通过对比分析四种模型的实验结果说明了使用高斯混合模型在本文选取的四种基本情感进行识别时具有更强的区分能力,同时也验证了期望最大化算法的参数估计对高斯混合模型的识别率具有重大影响。
其他文献
随着结构基因组的出现,通过结构进行生物功能预测已经发展成为结构生物学和生物信息学的主要目的之一。蛋白质的功能大体由它的三级结构决定的。研究蛋白质的结构有非常重要
对象检测技术是一门具有研究价值和实用意义的技术,同时也是一门极具难度和挑战性的技术。在众多对象检测技术中,车辆的检测是比较困难的一类检测,主要原因在于车辆具有各种
随着电力系统的规模越来越大,大量的非线性设备引起的谐波在造成电能质量污染的同时,也影响了电力系统的安全运行和电力用户的安全使用。因此,电能质量成为电力部门日益关注的问
面向服务的体系结构SOA通过服务的形式将传统软件系统的功能对外部开放,使得实现某个功能的服务被匹配、发现、组合和执行。传统SOA架构以服务提供者为中心,而没有从服务消费
随着移动机器人技术的不断成熟与发展,使用机器人替代人工进行海底侦测、零件加工组装、家庭服务和危险场所救援等领域的应用越来越多,移动机器人在人们的生产和生活各个方面
随着因特网的快速发展,为了顺应信息化网络的发展,路由器作为因特网重要的网络设备,随之不断的更新和发展,同时许多广域网技术也应运而生。POS (Packet Over SONET/SDH又称IP
多输入多输出(MIMO, Multiple Input Multiple Output)技术不仅能够利用多条天线来实现多发多收,充分利用空间资源,而且还能够在不增加天线发送功率与频谱资源的前提下,获得
随着Internet的普及,电子邮件已经成为了现代人际交流中逐受青睐的通信方式之一。然而由于电子邮件系统本身存在的技术缺陷,SMTP协议(简单邮件传输)对邮件发送不做任何身份验
随着互联网技术的发展和安全形势的变化,恶意软件的数量成几何级数爆炸增长,恶意软件的变种更是层出不穷,在经济利益的驱使下,恶意软件开始互联网化并形成了庞大的黑色产业链。传
近年来,互联网取得了突飞猛进的发展,网络信息越来越丰富,呈指数级增长,到现在为止,全世界已有几亿个网站。然而,任何事物都有两面性,在互联网飞速发展的同时,大量不良信息在