普通话语音情感声学特征数据库的建立

来源 :电子科技大学 | 被引量 : 7次 | 上传用户:laogong90
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音情感识别的研究对于增强计算机的智能化和人性化,开发新型人机环境,以及提高语音识别系统的性能等方面,均有着非常重要的现实意义。本研究的目的是深入分析语音信号中的声学特征与情感之间的关系,建立了一个语音情感识别数据库,为进一步探索新的语音情感识别方法做准备。本文结合四川省教育厅基础应用研究课题(2008RQ002)项目“基于粗集理论的普通话语音情感识别”这一个课题展开关于语音情感识别的研究;阐述了语音情感识别国内外的研究近况、目前常用的语音情感识别方法及国内外具有代表性的情感语音数据库;分析了语音信号的声学特征及其提取方法;关于情感特征分析与选取、语音情感建模等理论进行了相关讨论。最后由提取的30个声学特征属性,建立了一个语音情感数据库。本文主要工作如下:由于普通话情感语音研究刚刚起步,有关建立情感语音数据库的技术、经验和方法都较少。为了研究的需要本文建立了一个普通话情感语音数据库,用录音法共采集1600句情感语音,分为愤怒、害怕、高兴、惊讶、悲伤和平静六个情感类别。之后经过多位专家反复听取,去掉其中情感状态不清晰及语音表达不明确的语音549句,最后剩余实际有效语音1051句。然后再用cool edit pro v2.1和praat等软件对每一句语音进行初期处理并获取语音的各个声学特征的详细数据,再然后用神经网络中的BP神经网络对初始特征进行化简即特征提取,最后得到有效特征为30个。再用所得到的数据表1051*30,基于SQL Server2000系统中的企业管理器中的第三方软件建立了一个语音数据库。数据库存储了各情感语音的基频、能量、时长和共振峰等声学特征。为普通话语音情感识别研究提供了一个良好的实验样本数据平台。
其他文献
<正>台湾政局蓝绿对决乱象丛生,乃是台湾光复以来最乱的时代,但于乱局中或许有转机成就好时代来临。台湾中间选民面临新的抉择。一、李登辉"第三势力"的空间有多大近来的李登
<正>2010年,教育部发布了《关于大力推进高等学校创新创业教育和大学生自主创业工作的意见》,提出将创新创业教育课程纳入大学生课堂教学,同时全面实施"本科教学工程"——国
对缺少含有丰富情感标注信息的情感语音数据库问题,建立了一个包含语音和电声门图仪(EGG)信息的汉语双模情感语音数据库,并对其进行了标注和一致性检测.首先,根据情感语音数
利用自建聋生小型语料库,对程度副词"很"的使用情况进行检索分析,从二语习得的角度对聋生产生偏误的语言心理进行初步探讨。从语料统计看,聋生能掌握汉语程度副词"很"的基本
<正>"您的孩子有什么优点吗?"面对这一问题,很多普通孩子的家长会滔滔不绝。而面对同样的问题,大部分特殊孩子的家长则会显得有点"无话可说"。有的家长在沉默良久后,可能会艰
本研究运用《基本认知能力测验》软件,对上海聋中职生的反应速度、思维、空间表象、工作记忆和记忆五个方面进行了测试评估,发现:(1)上海聋中职生的认知能力总体水平较低;(2)
在培智低年级语文识字教学中,创设多感官运动式情境、音诗画的多媒体情境、多形式游戏情境、生活实践情境等,能帮助学生感性识字、直观识字、情趣识字、有效识字,并使智障学
目的探讨2型糖尿病患者合并骨质疏松的危险因素,为预防和早期诊断糖尿病合并骨质疏松提供依据。方法根据2014年2月-2015年7月茂名市人民医院收治的175例2型糖尿病确诊患者的
《你所不知道的中国》(第三季)成功实现在中英主流媒体的同步播出,离不开国际间深度制播合作。作为电视纪录片重要元素,题材类型直接影响其可视性与跨文化传播。本文以《你所
近几年随着地铁工程的大规模建设,安全事故也频繁发生,施工前的风险识别显得尤为重要。目前地铁工程风险识别的难点包括:专家数量少、专业技术人员少、主观性强、大量隐性知