基于语音信号的情感识别研究

被引量 : 0次 | 上传用户:wonkyman2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音是人类交流的重要手段,是相互传递信息的最方便、最基本和最直接的途径。语音信号在传达语义信息的同时,还传递着情感信息,而情感在人们生活和交流中起着重要的角色。因此,随着人机交互技术的快速发展,语音信号中的情感信息正越来越受到研究人员的重视。作为语音信号情感信息处理的一个重要研究方向,语音情感识别是计算机理解人类情感的关键,是实现智能化人机交互的前提。但是,目前对于人类情感的研究还处于一个探索阶段,对情感的定义与表示至今没有一个统一的认识。加之情感具有较强的社会性和文化性,以及语音信号本身的复杂性,这些因素使得语音情感识别的研究面临着重重困难。应该说语音情感识别的研究还处于一个起步阶段,对于情感语音库、情感特征以及情感建模与识别方法等诸多方面的研究还有待深入。本文以建立不依赖于话者和文本内容的语音情感识别系统为目标,对情感语音数据库、语音声学特征参数提取、情感特征分析与选取、情感维度空间、语音情感建模与识别等问题进行了深入探讨与研究。在对大量情感语料进行分析的基础上,提出了两种语音情感建模方法,为语音情感识别提供了一个理论和技术上的框架,为实现自然的人机交互奠定了一定的基础。借助于这两种情感模型,本文开发了两种语音情感识别算法,构建了不依赖于话者和文本内容的汉语语音情感识别系统。本文的创新点和主要贡献如下:(1)从语音情感特征提取的需求出发,提出了一种基于修正倒谱和动态规划技术的基频估计算法。该算法根据倒谱、短时能量和短时过零率在清音段和浊音段的不同表现,构造了一个清浊音判决函数,据此可简化清浊音判决过程,并大大提高清浊音判决精度。为了得到合乎实际的、具有平滑轨迹的基频估计,利用动态规划技术进行基频跟踪。由于充分考虑了基频连续性的影响,该算法能够有效地避免倍频和半频错误,具有准确率高、基频轨迹平滑等优点。(2)对韵律和声道共振峰等语音声学特征与情感状态之间的关系进行了深入细致的定性/定量分析,得出了一些具有重要指导意义的结论。通过分析发现,短时能量虽然对于区分情感状态有一定的帮助,但存在明显不足;但是信号能量在不同频段上的分布对于区分情感状态具有重要意义,其中,250Hz以下能量占全部能量的比例是区分情感状态的一个重要特征。本文还对基频轮廓及基频轨迹导数等特征与情感状态之间的关系进行了分析。在分析过程中我们发现,男性和女性在语音情感特征参数的分布上存在着较大的差异。据此本文提出了一种以基频均值、范围和方差为特征、采用Fisher线性判别函数的性别判别方法。实验结果表明,通过训练,该方法可取得非常高的正确判别率。(3)提出了一个三维情感空间模型构想,通过听辨实验确定了几种基本情感在情感空间中的位置,并定量分析了语音信号的韵律特征和音质特征与不同情感维度之间的相关性。(4)从情感建模的角度出发,根据情感具有连续性和离散性的双重特点,将数据场的概念引入情感建模,提出了情感场和情感势的概念,并对势函数的计算方法提出了改进措施。通过势函数寻优确定各类基本情感中心在情感空间中的位置,从而把情感空间中任何一点的情感看成是由几种基本情感复合而成,每种基本情感对该点的贡献由基本情感中心在该点处的情感势决定,情感势的大小决定了该点处情感属于某种基本情感的程度。本文基于这一思想开发了一种基于情感场的汉语语音情感识别方法,获得了优于传统语音情感识别方法的识别率。(5)根据语音韵律特征与情感唤醒度、音质特征与愉悦度之间的相关性,提出了一种基于情感维度的情感建模方法。该方法利用韵律特征和音质特征分别为每种情感构建唤醒度和愉悦度概率模型,然后将每个情感语音样本在12个维度模型上的概率输出作为特征训练情感类别模型。本文利用高斯混合模型(Gaussian Mixture Model,GMM)构建情感维度模型,并提出了一种基于对训练样本进行聚类分析的GMM初始参数估计方法。在最后识别时,选用了支持向量机(Surport Vecter Machine,SVM)来构造六类情感类别识别器。根据该情感维度模型,本文进行了汉语语音情感识别的相关实验,获得了优于情感场方法的识别率。作为一种新的尝试,本文提出的两种语音情感建模方法具有一定的理论依据和较好的实用效果,为今后的语音情感建模与识别研究奠定了良好的基础。
其他文献
在通信工程建设时,必须满足省时、省力、高效的关系,以统筹兼顾的方法,应用合理的计划,执行的坚决性和变通性保证省时;通过重视资金分配,重视系统工程等方面保证省力;各个方
随着"雾霾"的普遍蔓延,化工等能源产业的环境治理问题再次成为人们关注的焦点。目前国内外比较流行的脱硫技术是湿法脱硫方法,包括石灰-石膏湿法、微生物法和海水烟气法等。
人体肠道微生物组是人体最庞大而复杂的微生物群落,也是人体的一个重要的代谢“器官”。在哺乳动物中,肠道微生物在营养物质的摄取、上皮细胞的生长发育、免疫及药物的代谢和毒
文题为语境与中学作文教学,主要探讨如何利用语境来加强作文教学,从而提高学生的写作。第一章和第二章是研究基础部分。首先,从主客观因素入手,分析现在中学作文教学现状。针对相
村镇体系规划的成功实施主要取决于农居点的合理撤并.本文针对农居点撤并中的耕作出行阻力因素,根据空间距离统计构建了基于GIS的定量分析模型,并对规划行为的负面效应进行微
错牙合畸形是一类口腔常见病,不仅影响患者颜面美观,同时也影响患者口腔功能和身心健康,因此尽可能早期预防和矫治在临床上具有十分重要的意义。健康宣教可以提高人们对错牙
期刊
四性(气)是中药的基本特征,是指导中药组方和临床运用、解释中药治病原理的主要理论依据之一。阐释中药四性理论科学内涵,建立中药有效成分四性的评价模式对发展药性理论,发
目前,国内的监狱干警开始越来越关注采用心理矫治的方式帮助改造罪犯。遗憾的是,在实践工作中心理矫治的尝试很多,但有心理学理论支撑的专业化心理矫治模型不多。同时针对罪犯的
《中华人民共和国国家赔偿法》赋予了公民、法人和其它组织在其合法权益因国家机关及其工作人员的不法侵害而造成损害时,有依法取得国家赔偿的权利。但是,无论是在理论上还是
<正>从7月23日夜里开始,一场特大暴雨突袭我省豫西南山区,引发了山体滑坡、泥石流、地面塌陷等地质灾害,仅栾川县就引发地质灾害点和地灾隐患点多达上百处,严重威胁着当地居