语音情感识别的研究与应用

来源 :浙江大学 | 被引量 : 0次 | 上传用户:limajubo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人机交互技术的发展,人机接口的研究已经逐渐从机械化时代跨入多媒体用户界面时代。作为智能人机交互的关键技术之一,语音情感分析与识别已经成为一个研究热点。各领域研究者十分关注如何从语音中自动识别说话人的情感状态,并使计算机作出更有针对性和更人性化的响应。本文首先概述了语音情感识别的研究意义以及文中的主要研究内容,然后回顾了目前语音情感研究中涉及的多个关键问题,包括情感的分类、情感语料库概况、语音信号的声学特征、特征降维、分类算法以及基于半监督学习的语音情感分类。本文提出了多种特征选择和特征抽取模型。基于类集和类对特征选择相融合的语音情感识别是一种新型的模型结构,它在关注每一对类别区分度的同时,兼顾样本数据的全局分布,因而同时引入类集和类对特征选择方式。该模型结构适用于多种分类算法,而且能有效地提高系统的识别性能。基于特征投影矩阵的特征选择算法利用特征抽取算法中的投影矩阵,衡量各个初始声学特征的重要性,据此进行特征子集的选择。实验结果表明,相比于单纯使用投影矩阵进行映射变换的特征抽取方法,该特征选择算法更具优势。基于多层次特征抽取的语音情感识别通过对数据的分析,针对不同性别、不同情感类别的语料,选择多样化的降维算法进行处理。这种思想可以推广到其他语料库上,通过构建合适的基于多层次降维的识别系统,提高系统整体的识别效果。基于流形学习的增强型Lipschitz嵌入算法则是一种非线性降维算法,它通过测地距离的计算,将高维特征向量映射到低维子空间中。该算法在实验室受控环境下的特定人和非特定人语音情感识别、高斯白噪声和正弦噪声情况下的特定人语音情感识别中,显著地提高了识别准确率。在传统的语音情感识别系统中,各个声学特征通常是以分量的形式简单地组成特征向量,作为分类器的数据输入。基于协方差描述子和黎曼流形的语音情感识别系统考虑了不同声学特征之间的关联性,实验表明该关联性能够反映语音的情感信息,而且基于此关联性所建立的识别系统稳定性高,抗噪能力强。在只有少量已标记样本和大量未标记样本的情况下,本文提出增强型协同训练算法,建立起基于半监督学习的分类模型。它通过引入类别预测一致性的限制,改进标准协同训练算法,减少了分类噪音的产生,并提高了分类器的性能。虑到语音情感研究的实用性,使用AdaBoost+C4.5分类模型对语音信号进行情感分析,实现了完全实时的情感识别,并将其应用于实时情感语音驱动的人脸动画生成系统。
其他文献
在矿山企业的经营管理工作中,成本核算具有重要意义。本文首先介绍矿山行业成本核算的特点,然后分析成本核算和矿山企业经营管理之间的关系,并结合企业成本核算的主要模块,探
积极有效地加强对大学生的管理越来越被世人所重视。大学生作为特殊的人群,不仅具有人的基本人性特征还具有其特殊性,思想政治教育工作者开展大学生思想政治教育管理工作应采取
[目的]探讨产房风险分级管理及风险预警制度在高危妊娠产妇管理中的应用。[方法]将医院收治的90例高危妊娠产妇根据产妇入院时间将产妇分为对照组(2017年1月—2017年6月,n=45
<正>【设计说明】高中语文教材受限篇幅,多为单篇短章,即使长篇也多是节选。对整篇文章而言,节选会使学生难窥全豹,甚至"一叶障目"。为了让学生能够全面了解作品的内容,获得
对马尾松(Pinus massoniana)改良代种子园8年生子代测定林进行早期选择与评价。结果表明,35个半同胞家系的胸径、树高和材积性状差异达到显著或极显著水平,家系平均材积比初
某省某高速公路大桥位于所在市的东侧位置,是该高速公路主干线和该地区外环公路上的一座重要桥梁。文章主要介绍了预应力施工技术在我国某高速公路桥梁的施工工程中的应用,对
伴随着信息技术一日千里的发展,金融电子化的应用在全球范围内得到了蓬勃发展。电子商务的兴起将金融服务业推向信息化的最前沿,金融服务不仅在内容上迅速扩大,在手段上也正
近日,金融信息资讯服务机构投中集团发布的最新数据显示,在线短租细分行业成为2013年一季度中国创业投资市场投资的热点,除途家网之外,蚂蚁短租网、小猪短租网等从事在线短租业务
报纸
在信息化时代随着市场竞争形势的加剧,要想让企业更好的发展,内部必须实施新会计准则,保证可以跟上时代的步伐。要求工作人员具备较强的业务能力,在操作中的每个细节都可以做
对6年生马尾松种子园自由授粉家系子代测定,结果表明:种子园子代林材积、胸径、树高3个性状生长量明显大于对照的当地商品种.材积性状比对照增长40%,平均遗传增益达27%,最高