基于长短时特征融合的语音情感识别方法研究

来源 :第九届全国人机语言通讯学术会议 | 被引量 : 0次 | 上传用户:nfx0123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音情感识别领域中广泛使用的情感特征有基于语句的全局统计特征和基于语音帧的时序特征,但单独使用其中的任何一种均不能有效地表达情感信息。为了有效地融合长、短时情感信息,本文首先提出使用“语段特征”用于识别,并给出了针对各类情感的“最佳识别语段长”。为进一步提高识别性能,我们还构建了一种全局控制Elman神经网络(Global Control Elman Neural Network)用于将全局统计特征与基于语段的时序特征有效地融合起来。实验表明,融合了长短时特征的系统识别率较单独使用各类特征均有明显提高。
其他文献
三心底结构是国防、航空、航天等领域经常采用的结构,其旋转母线是由三段弧线组成的,对应着三个圆心,故得名三心底。三心底结构可调整的参数变量少,优化潜力小,本文根据三心底的形
会议
为了保证齿轮传动仪器的工作性能、工作精度及使用寿命,对齿轮精度进行检测是非常必要的。本文用数值模拟的方法对齿轮测量装置的振动问题进行分析研究,从理论和有限元模拟两方
会议
本文主要应用MSC.Fatigue疲劳分析软件对脉动真空灭菌器进行了疲劳分析。首先应用MSC.Patran 建立脉动真空灭菌器的基结构,将其引入到有限元分析软件MSC.Nastran 中进行静力分
在检测中发现有些真空灭菌器在远未超过使用寿命时,双层结构的内壁就出现了断续的裂纹,大部分集中在加强筋与内壁的焊缝处。为追寻其力学原因,本文采用电测法对真空灭菌器进行实
会议
在语音自动切分中普遍采用的声学模型是三音子模型。研究表明,以三音子模型为单元模型在语音自动切分中是存在局限性的。其原因在于连续语流并不是简单的音子串联组合,各音子结
会议
传统的基于隐马尔可夫模型的语音合成系统(HTS)存在着合成参数过平滑问题,导致合成结果音质下降。过平滑问题可以分为时域过平滑和频域过平滑。本文对这两个问题进行分析,并通过
目的 观察三焦针法对快速老化模型小鼠(SAMP8)海马神经元细胞骨架重组相关蛋白的影响,探讨针刺治疗阿尔茨海默氏病(AD)的可能细胞生物学机制.方法 以7月龄SAMP8为AD动物模型,
字音转换是语音合成系统必不可少的模块,而多音字消歧则是字音转换的核心问题。本文选择了33 个常见常错的多音字作为研究对象,使用最大熵模型来辨析多音字的读音。在特征选择
随着网络技术的飞速发展,它为汉语研究领域带来了新的动力。本文设计并实现了一种汉语语音识别的网站。介绍了隐含马尔科夫模型(HMM)在语音识别系统中的应用和小波变换在声调
会议
目的 探讨鹿茸蛋白对缺血缺氧诱导心肌细胞凋亡的作用及其机制.方法 将SD大鼠心肌细胞适应性培养后分为对照组,模型组,鹿茸蛋白低剂量组(0.25 mg/mL)、中剂量组(0.5 mg/mL)、