论文部分内容阅读
情感智能是人机交互智能化的一个关键部分,语音情感分析越来越多地应用于人机交互系统以提高系统的的智能水平。本文主要从语音情感识别在语音查询系统中的应用和医学诊断对语音情感强度分析的需求两个方面对语音情感分析进行了研究。
本文首先分析了语音情感识别在语音信息查询系统中的应用现状,为了解决识别率低的问题,把“与文本有关且与说话人无关”的语音情感识别应用于语音信息查询系统中。利用贝叶斯最小错误率决策理论确定最优阈值,提出了一种新的语音信号端点检测算法。研究了语速、幅度和基频三类语音信号特征,并利用模糊熵理论分析了这些特征用于情感分类的有效性,然后选择最优的特征参数组合来进行语音情感识别。研究了适用于语音情感识别的分类器,采用ParZen概率神经网络完成语音情感状态的识别。实验结果表明,本文采用的研究方案提高了系统的整体识别率。
本文针对医学诊断对语音情感强度分析的需求,初步研究了语音情感强度分析中的基本理论问题。首先提出了语音情感偏移假设,并在此基础上给出了语音情感强度分析的一般理论框架,完成了语音情感强度分析的实现算法。为了验证该理论的合理性,建立了具有5个强度级别的语音情感数据库,对算法的性能进行了测试。实验结果表明,利用该语音情感强度分析算法得到的强度值与主体录制语音时的主观情感强度是一致的。