基于多语种语音信号的情感识别研究

被引量 : 8次 | 上传用户:sondenaclaire3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语言是人类特有的表达情感的重要工具,话语中不仅包含语义信息,也包含人们特定的情绪心理特征。传统的语音处理系统往往着眼于内容的准确性,忽略了对心理特征的研究。近年来,随着人机自然交互、心理检测、智能机器人等诸多领域的应用需要,针对语音信号分析辨识其中的情感特征,受到越来越多的研究人员的关注,语音情感识别成为语音处理领域一个新的研究热点。但是,目前对情感识别的研究还不深入,在情感语音数据库的建立、情感特征参数提取、情感识别方法等诸多方面的研究还没有形成系统的理论。研究人员对英语的分析较多,而对汉语的研究较少。另外,情感参数的选取主要集中在语音声学方面,而对融合了语义、面部表情、人体生理信息的多模式识别研究较少。因此,可以说语音情感识别尚处于初步阶段,还有许多工作须要深入下去。本文以多语种情感语音为研究对象,对语音情感数据库的建立、语音声学特征参数的提取、基于声学特征的情感识别、结合语义的情感识别等问题进行了深入的研究,主要包括以下内容:第一,选择平静、高兴、愤怒、惊奇和悲伤5种情感状态,在实验室环境下录制情感语音样本,建立包括汉、英、日、韩、俄等在内的多语种情感语音数据库。第二,分析了不同情感状态下多语种语音信号的声学特征,提取了韵律特征参数,对不同语种的情感语音进行了声学特征的比较,得出了语音情感特征的一般规律,即在同一情感状态下,不同语种的声学特征存在相似性。第三,以多语种情感语音数据库为样本集,分别运用主元素分析法及高斯混合模型法进行了情感识别实验,其中主元素分析法取得了74.2%的平均识别率,高斯混合模型法则获得了78.1%的平均识别率。第四,在分析声学特征的基础上,结合语义信息对语音情感进行识别。首先对带有情感色彩的词汇进行标注,通过动态时间规整算法识别语句中的情感关键词,提取语句的语义信息。然后将语音信号的韵律特征与语义信息结合,采用高斯混合模型法进行识别。实验结果表明,结合语义信息的情感识别率比单纯使用韵律特征的识别率高3个百分点。本文的主要创新,一是建立了多语种情感语音数据库,通过声学特征参数的提取、分析,得出了语音情感特征的一般规律;二是在韵律特征的基础上结合语义信息,进行了情感识别实验,获得了比使用韵律特征更高的识别率。
其他文献
<正>在中文中,"收放自如"是挺高的境界,形容人之技艺高超;在"新基础教育"研究中,用"放"和"收"指代教学与班级建设过程
当前新一轮海洋经济开发热潮正在兴起,而海洋经济开发必然需要大量的资金投入,所以金融支持在海洋经济开发中的作用更加关键。有鉴于此,本文在分析金融支持对海洋经济开发的
爆破作业安全管理的传统模式是以爆破器材(含流向轨迹)、爆破作业单位及爆破作业人员为核心对象建立的录入-查询静态系统模式,在分析爆破作业安全管理三要素及其逻辑联系的基
介绍了盾构机姿态测量的人工测量方法和自动测量方法,通过实际工程数据分析比较这几种测量方法的精度,从精度、可操作性方面考虑选择自动测量方法进行施工测量,采用人工测量
<正>为了扭转班级存在的个别学生贪玩、不遵守纪律、集体观念淡漠等问题,建设优秀班集体,引领学生健康快乐成长,自2010年起,我在班级开展"大雁中队"建设实践和探索,培养学生
食品质量安全问题越来越受到人们的高度关注,对食品中添加物和最高残留限量标准的要求越来越高。因此,在控制食品安全方面,迫切需要发展高选择性、高灵敏度的兽药残留检测方
截止2009年5月底,中国移动通信用户数达到了惊人的6.8亿,伴随着移动通信产业的迅猛发展,商用移动网络的日渐成熟,运营商之间的竞争也日趋激烈。为了提高网络的运行质量和服务
目的: 1.研究青岛市男性酒精依赖患者的一般情况及饮酒行为特征;2.酒精依赖患者的社会、家庭、心理状况与正常对照组的异同,为酒精依赖患者的治疗提供一定的科学依据。方法:1
计算机自适应测试具有许多传统纸笔所无法提供的优势:可以依据被试个体不同的被试状态,个性化地提供动态测量服务。而项目反应理论的测试较之于经典测试理论,有样本独立、可
资产证券化是20世纪70年代以来金融创新的重要成果之一,但美国次贷危机事件表明资产证券化的潜在风险是巨大的。次贷危机的爆发绝不是偶然的,在此之前,许多资产证券化项目都