语音情感识别的关键技术研究

被引量 : 0次 | 上传用户：orangeboy2222

【摘要】

：

语音情感识别是人工智能领域的一个新兴分支,在自然人机交互、多媒体分段与检索、安全系统自动监管等方面有着广泛的应用前景。语音情感识别过程包括语音信号预处理、声学特

【作者】

：

尤鸣宇

【发表日期】

：

2007年期

【关键词】

：

语音情感识别情感语料可视化半监督学习 ELE非线性映射特征选择对话情感关联多模态情感识别带噪语音的情感识别

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

语音情感识别是人工智能领域的一个新兴分支,在自然人机交互、多媒体分段与检索、安全系统自动监管等方面有着广泛的应用前景。语音情感识别过程包括语音信号预处理、声学特征提取、特征向量降维处理和基于统计模型的情感识别。本文的工作主要集中于语音情感识别过程中的若干关键问题。提出情感语料库的可视化方法、半监督机制的语音情感识别、非线性特征降维算法ELE以及基于对话关联矩阵的情感识别技术。探讨情感语料库的采集、标注和可视化技术。构建包括表演语料、引导语料和自然语料的中文情感语料库CHAD。通过听辨实验,分析和比较不同来源的语料。将情感语料的高维声学特征通过Sammon’s算法映射,得到二维可视化空间图MASEMAP。基于图中的位置分布分析语料的情感表达以及各情感间的独立与依赖关系。在分析各声学特征及其提取算法的基础上,改进co-training算法,提出半监督机制的语音情感识别。该算法结合时域特征和倒谱特征,以未标注语料扩充训练语料集,提高情感识别率7.4%-9.0%。通过改变未标注语料的加入规则,减小由于错误接纳未标注语料造成的分类噪声。探究各种特征降维算法。在分析线性特征抽取算法的基础上,提出一个分层次的语音情感识别系统。不同特性的语料采用不同的降维算法,提高系统的整体性能。在非特定人情感识别中取得78.7%-83.4%的识别率。提出ELE非线性流形学习算法。基于测地距离估算法,高维特征点被投影到六维子空间中。同一情感状态的特征点聚集在子空间的一个平面附近。该分布规律有利于情感语料的分离。基于ELE的非特定人情感识别取得9%-26%的识别率提高,特定人的结果提高5%-20%。提出LDA-L1-Rank特征选择算法,并与PCA-L1-Rank进行对比实验。在语音情感识别中,引入结合类集和类对的特征选择算法。综合考虑优于分离所有类别和某两个类别的特征,兼顾全局和局部的特征分布特性。基于该算法的非特定人情感识别的平均F1衡量提高3.2%-8.4%。在纯语音情感识别的基础上,进一步研究结合其他信息的情感识别。采集和分析对话情感语料后,提出对话情感关联矩阵。对话双方的情感约束提高了情感识别的正确率和鲁棒性。结合人脸表情,实现双模态情感识别。提出THMM模型及相关的Viterbi最优路径搜索算法和分段式K-means模型训练算法。通过设置通道权重最大化融合视觉和语音信息,取得91.9%的平均识别率,识别结果也更为鲁棒。根据实用化的要求,调查噪声环境下的情感识别。叠加受控噪声的情感语料在提取声学特征后,采用本文提出的ELE算法进行特征降维。优于其他算法10%的识别率表明,ELE算法能较好地发掘情感语音特征的内在分布规律,且性能不被噪声等干扰。

其他文献

城镇化影响城乡收入差距的时空差异分析

文章运用我国1982~2011年28个省的面板数据,分别通过基于截面的变系数面板回归模型与基于时期的变系数面板回归模型,考察了城镇化影响城乡收入差距的省级地区差异与年度差异

期刊

城镇化:城乡收入差距:时空差异

团体辅导在大学生职业生涯发展规划教育中的效果研究

根据自愿报名选取大一12名学生作为研究对象,实施3周共6次团体辅导,探讨在大学生职业生涯规划教育中团体辅导的方式及效果。用《团体单元回馈表》、《团体成员回馈表》和《大

期刊

团体辅导大学生职业生涯规划辅导干预

世界500强企业年度报告中致股东的信的文体分析

本文采用定量和定性相结合的方法,旨在从文体学的角度分析致股东的信的语言风格,进而探索上市公司与投资者间高效沟通的方式。本文通过运用FOXPRO和SPSS等专业统计软件,对30

学位

文体特征年度报告致股东的信语料库

经济全球化背景下的新闻英语语篇特征与翻译策略分析

近些年来,随着经济水平的不断提升,以及生产力水平的不断发展,人民的生活质量处于稳健发展的趋势,英语也逐渐成为世界经济、文化沟通的重要桥梁和必要纽带。本文将从新闻英语

期刊

新闻英语语篇特征翻译策略文化差异

浅析国有企业思想政治工作与企业文化融合

国有企业思想政治工作与企业文化在具体的操作过程中存在着密切的联系,也有明显区别。在新时期,要以企业文化为载体,把思想政治工作渗透到企业文化建设各个环节中。同时,思想

期刊

企业文化建设社会主义国有企业思想政治工作企业文化融合

降雨径流下不同煤矸石堆场Fe、Mn、SO4～（2-）污染特征比较

在自然降雨条件下,采用对贵州废弃煤矸石堆场野外勘查分区采样的方法,对不同风化程度的代表性煤矸石堆场进行分区:泥质煤矸石,砂质煤矸石,煤矸石夹砂,煤矸石夹土,分析比较不

期刊

煤矸石堆场地表径流污染物污染特征

茄子种质资源遗传多样性的RAPD和SSR分析

茄子(Solanum melongena)起源于亚洲南部热带地区,古印度为其最早的驯化地,中国栽培茄子的历史也很悠久,是茄子的第二起源地,拥有丰富的茄子种质资源。对茄子种质资源分类和

学位

茄子RAPDSSR聚类分析遗传多样性

Web信息提取技术研究与应用分析

随着我国社会经济和计算机网络技术的不断的发展,Internet已逐渐广泛应用到人们的日常生活中,并且利用web来提取信息已变为人们生活中不可缺少的一个部分。然而目前,相当一部

期刊

web信息提取HTML应用

壳聚糖大鼠颅内组织相容性的初步观察

本实验探讨了生物可降解的天然高分子缓释材料壳聚糖在脑组织中的生物相容性。以期为临床提供可用于颅内植入化疗的药物缓释高分子载体。我们以 32只SD大鼠为研究对象 ,随机

期刊

壳聚糖生物相容性脑组织

外宣新闻翻译策略研究

外宣新闻翻译是一种跨文化、跨语言的活动。当今社会,外宣翻译是一国向他国传播国家时事的重要传播手段,是展示一国政治、经济及文化生活的主要窗口。为了使中国外宣新闻翻译

期刊

外宣新闻翻译翻译策略政治类新闻

语音情感识别的关键技术研究

与本文相关的学术论文