汉语语音情绪识别

被引量 : 0次 | 上传用户:wolfboy5566
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本论文的主要研究内容是汉语语音情绪识别,即从语音信号中识别说话人当时所处的情绪状态。虽然许多研究者已经在研究解决这个问题的可能性,并取得了一些成果,但至今仍没有统一的定论,尤其是汉语方面的研究还很少。因此,本文的研究涵盖整个汉语语音情绪识别:从汉语情绪语音的采集,到情绪语音信号特征分析,再到情绪语音信号特征提取和选择,最后到语音情绪识别分类方法。论文中所研究的情绪为四种最基本的情绪状态:愤怒,恐惧,高兴和悲伤;另取中立表征没有情绪时的状态。汉语情绪语音采集方面:在分析当前国际上一些情绪语音库的基础上,独立设计文本,确定录音人数和语音种类(自然、模仿、诱出)。通过对采集的情绪语音数据进行听辨实验,最后建立汉语语音情绪数据库。情绪语音声学特征分析方面:分析了愤怒、恐惧、高兴和悲伤四种情绪相对于中立状态的声学特征(持续时间方面,短时能量方面和基音方面)。同以往的研究不同,本文不仅对语句层面的特征进行分析,而且着重于语句中字层面上的特征分析。在此基础上,特别进行了不同情绪对汉语重音的影响分析。最后给出不同情绪在声学特征上的区分特点。情绪语音特征提取及选择方面:首先提取了208个包括基音、短时能量、短时幅值、信号振幅和持续时间方面的特征。对于这208个数目众多,存在冗余且不便分析的特征,进行两两情绪之间的分析,取代总体分析。根据分析结果,选择出以后研究需要的特征共28个,为以后的研究打下基础。语音情绪识别分类方法方面:传统的语音情绪识别方法是利用统一的分类模型来区分所有的情绪。然而,两两情绪之间的特征分析却表明不同的特征对区分不同的情绪具有特殊的能力。因此,基于决策树理论,本文首次提出了一种有效的语音情绪识别过程——连续两分过程,将统一的分类变成一系列连续二叉分类过程,这样在每一步分类过程中都建立自己的最优分类模型。连续两分过程的建立是根据不同特征的不同区分能力,在识别中能够充分的利用所提取的语音情绪特征,从而得到较好的识别效果,正如实际情绪语音数据实验所表明的一样。为了更好的提高识别效果,需要提取出更多的具有区分性能的特征。因此,考虑到以上分析仅限于时域上的声学特征,此部分着重于临界频带上特征分析。在此基础上,提出了具有区分不同情绪能力的两种特征类型。在充分验证可行性后,将临界频带信息融合到连续两分过程中,通过实际情绪语音数据的实验验证,结果分析显示了融合临界频带信息的连续两分过程的优点。连续两分过程中决策树结构导致累计误差传递,使得最后进行分类的情绪“愤怒”和“高兴”的识别率较差。针对这个缺点,本文首次提出了基于模糊理论的连续两分过程,将模糊理论不仅应用到每一步的分类模型中,而且应用的整个分类过程中。通过实验验证,结果分析显示其优点。针对连续两分过程中建立每一步最优模型的问题,提出了一种基于Boosting算法的连续两分过程。Boosting算法在训练过程中针对困难样本进行了加强训练,能够得到较优的分类模型。通过实验验证显示其优点。
其他文献
英国中世纪的土地税属于刚刚起源的英国国税的一种,同时又属于加征于土地之上的一种直接税。土地税是英国中世纪最早的一种国税形式,并且在英国中世纪的历史上存在了相当长的时
基于项目信息门户(PIP)的房地产项目管理是提升房地产项目管理水平的重要途径。本文在总结国内外相关领域研究成果的基础上,借鉴其他行业先进管理思想和理念,并结合当前房地产
本论文依托吉林省项目《吉林省共用物流信息平台关键理论与技术研究》部分研究成果,在全面分析了我国物流企业在发展中遇到的各种问题的前提下,有针对性的提出了以信息化来推
商场建筑的能耗统计和分析是进行商场节能研究的基础,国外在这方面进行了大量的工作,但国内尚处起步阶段,有限的研究仅在北京、深圳、长沙等经济较发达地区展开,国内大多数地区尚
奇蒿 ,为菊科植物奇蒿的带花全草 ,在浙江、江西等地俗称六月霜 ,南方药用多称南刘寄奴。为常用中药。江苏、安徽、浙江、江西、福建等地为主要产地。奇蒿具有解暑消食、活血
我国目前的建筑能耗形势相当严峻,呈现出总量大、比例高、能效低、污染重的特点。忽视住宅特别是普通住宅的节能工作,住房能耗过高已成为能源的重负。然而,目前我国没有一套行之
传统的Nyquist模数转换器对模拟电路的精度要求较高。相反,过采样ADC通过过采样技术,将基带中的量化噪声功率降低(特别是当采样频率比基带频率大很多时),提高了基带内的信噪比,达
大幅度超快速脉冲形成电路技术是一项具有广泛应用前景的技术。大幅度在本论文中指幅度在几百伏甚至更高数量级,而超快速则指脉冲前沿或后沿在纳秒甚至更小数量级。以上两方
数字信道化接收机具有大监视带宽、高灵敏度大动态、高频率分辨率、高截获概率和多信号处理能力等诸多优势,是应用广泛的一类电子战接收机。数字信道化接收机在侦收宽带相位编
<正>目前,全球范围内冠状动脉心脏病(coronary artery disease,CAD)发病率和病死率居高不下[1]。一直以来,冠状动脉造影(coronary angiography,CAG)被认为是诊断CAD的"金标准