基于长短时特征融合的语音情感识别方法研究

来源 :第九届全国人机语言通讯学术会议 | 被引量 : 0次 | 上传用户：nfx0123

【摘要】

：

语音情感识别领域中广泛使用的情感特征有基于语句的全局统计特征和基于语音帧的时序特征，但单独使用其中的任何一种均不能有效地表达情感信息。为了有效地融合长、短时情感信

【作者】

：

韩文静;李海峰;韩纪庆;

【机构】

：

哈尔滨工业大学计算机科学与技术学院，哈尔滨，150001

【出处】

：

第九届全国人机语言通讯学术会议

【发表日期】

：

2007年期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

语音情感识别领域中广泛使用的情感特征有基于语句的全局统计特征和基于语音帧的时序特征，但单独使用其中的任何一种均不能有效地表达情感信息。为了有效地融合长、短时情感信息，本文首先提出使用“语段特征”用于识别，并给出了针对各类情感的“最佳识别语段长”。为进一步提高识别性能，我们还构建了一种全局控制Elman神经网络(Global Control Elman Neural Network)用于将全局统计特征与基于语段的时序特征有效地融合起来。实验表明，融合了长短时特征的系统识别率较单独使用各类特征均有明显提高。

其他文献

基于MSC.PCL 的五心底结构形状优化

三心底结构是国防、航空、航天等领域经常采用的结构，其旋转母线是由三段弧线组成的，对应着三个圆心，故得名三心底。三心底结构可调整的参数变量少，优化潜力小，本文根据三心底的形

会议

齿轮测量仪振动问题的有限元分析

为了保证齿轮传动仪器的工作性能、工作精度及使用寿命，对齿轮精度进行检测是非常必要的。本文用数值模拟的方法对齿轮测量装置的振动问题进行分析研究，从理论和有限元模拟两方

会议

基于MSC.Fatigue的脉动真空灭菌器的疲劳分析

本文主要应用MSC.Fatigue疲劳分析软件对脉动真空灭菌器进行了疲劳分析。首先应用MSC.Patran 建立脉动真空灭菌器的基结构，将其引入到有限元分析软件MSC.Nastran 中进行静力分

会议

脉动真空灭菌器疲劳分析分析软件应用疲劳载荷疲劳寿命静力分析仿真软件有限元基结构预测应力信息设置曲线材料

真空灭菌器力学性能的实验及数值模拟分析

在检测中发现有些真空灭菌器在远未超过使用寿命时，双层结构的内壁就出现了断续的裂纹，大部分集中在加强筋与内壁的焊缝处。为追寻其力学原因，本文采用电测法对真空灭菌器进行实

会议

不定长语音单元在语音自动切分中的运用

在语音自动切分中普遍采用的声学模型是三音子模型。研究表明，以三音子模型为单元模型在语音自动切分中是存在局限性的。其原因在于连续语流并不是简单的音子串联组合，各音子结

会议

基于共振峰增强训练算法的HTS 研究与改进

传统的基于隐马尔可夫模型的语音合成系统（HTS）存在着合成参数过平滑问题，导致合成结果音质下降。过平滑问题可以分为时域过平滑和频域过平滑。本文对这两个问题进行分析，并通过

会议

共振峰增强平滑问题语音合成系统音质隐马尔可夫模型实验研究频域运算过程训练算法训练方法合成参数新参数证明果优程度

三焦针法对快速老化模型小鼠海马神经元细胞骨架重组相关蛋白的影响

目的观察三焦针法对快速老化模型小鼠(SAMP8)海马神经元细胞骨架重组相关蛋白的影响,探讨针刺治疗阿尔茨海默氏病(AD)的可能细胞生物学机制.方法以7月龄SAMP8为AD动物模型,

期刊

阿尔茨海默氏病快速老化模型小鼠三焦针法细胞骨架小G蛋白

基于最大熵模型的多音字消歧

字音转换是语音合成系统必不可少的模块，而多音字消歧则是字音转换的核心问题。本文选择了33 个常见常错的多音字作为研究对象，使用最大熵模型来辨析多音字的读音。在特征选择

会议

熵模型多音字消歧字音转换语音合成系统特征选择决策树关键词研究对象算法似然比性能提取实验模块方法读音

汉语语音识别网站的设计与实现

随着网络技术的飞速发展，它为汉语研究领域带来了新的动力。本文设计并实现了一种汉语语音识别的网站。介绍了隐含马尔科夫模型(HMM)在语音识别系统中的应用和小波变换在声调

会议

鹿茸蛋白对缺血缺氧诱导心肌细胞凋亡的保护作用

目的探讨鹿茸蛋白对缺血缺氧诱导心肌细胞凋亡的作用及其机制.方法将SD大鼠心肌细胞适应性培养后分为对照组,模型组,鹿茸蛋白低剂量组(0.25 mg/mL)、中剂量组(0.5 mg/mL)、

期刊

鹿茸蛋白缺血缺氧心肌细胞凋亡

基于长短时特征融合的语音情感识别方法研究

与本文相关的学术论文