论文部分内容阅读
以往的情感语音感知和合成研究人员,多注重从语音信号出发,分析不同的情感在语音参数上的差异,然后通过训练高质量的文本,寻找新的算法来提高感知正确率。但是任何情感语音的感知和合成技术,都源于人的情感感知,本文从人类情感感知出发,通过分析人类情感感知机制,试图建立一种新的情感语音合成模型。人类的情感表达和感知受到语言文化背景的影响,不同文化背景下的情感表达存在共同的心里基础。本文从中日不同的文化背景出发,设计情感感知实验,发音人4名,两名中国人(一男一女)和两名日本人(一男一女),听辨者分为4类:不会日语的中国人、学习日语的中国人、不会汉语的日本人和学习汉语的日本人,情感包括:生气、厌恶、害怕、高兴、中性、悲伤和惊讶七种,实验分为两部分:音频实验和视频实验。我们从音频和视频两个角度分析不同文化背景下的听辨者的情感感知,探讨中日语言文化对中日情感表达和感知的影响。本文采用的研究方法包括:情感听辨、情感特征分析、声学分析。在情感听辨实验中,我们发现:1,在感知中国发音人情感的时候,即便没有学过汉语,日本听辨者的感知结果接近中国听辨者,同样在感知日本发音人情感的时候,即便没有学过日语,中国听辨者的感知结果接近日本听辨者,这说明中日情感表达有相同之处。2,在音频实验中,在感知中国发音人情感的时候,学习汉语的日本听辨者的情感感知结果更接近中国听辨者,在感知日本发音人情感的时候,学习日语的中国听辨者的情感感知结果更接近日本听辨者,这说明学习者的感知结果受到所学语言隶属文化的影响,接近母语听辨者,但是我们在视频实验中没有上述发现,视频实验受到文化的影响弱于音频实验。3,不同的情感在感知中会出现相互混淆现象,例如生气和厌恶情感、害怕和悲伤情感在感知中都有混淆现象,这种情况在四类听辨者的感知结果中都出现过,说明是情感感知的混淆现象是普遍存在的。在情感特征感知实验中,我们发现:1,在感知中国发音人情感的时候,日本听辨者进行情感判断使用的特征组合和中国听辨者使用的特征组合有相似之处,在感知日本发音人情感的时候,中国听辨者用于情感判断的特征组合和日本听辨者使用的特征组合有相似之处,这验证了我们在情感感知分析中得到的结论。2,对于某些情感,与之相关性高的特征组合有相似之处,例如生气和厌恶情感、害怕和悲伤情感。这给我们提供了情感混淆感知的原因。在声学分析中,我们主要分析中国发音人的情感语音,比较了不同情感在声学参数(时长和基频)上的表现,发现生气情感的声音在时长比中性情感要短,而其他情感则比中性情感要长,在基频上,六种情感的基频普遍比中性情感高,基于情感在声学参数上的不同表现,我们得到了六种情感较之于中性情感的韵律规整方法。