【摘 要】
:
随着语音合成技术的发展,合成语音的音质和可懂度不断提高,而如何进一步提高其自然度成为语音合成方面的重要问题。本文总结了近年来主流的波形拼接式语音合成系统在自然度方面影响主观感受的四类问题,分析了它们对自然度主观感受的影响、产生的原因以及进行测试和改进的方法。考虑到不自然点的定位与检测对于自然度问题发现与改进的重要作用,本文针对其中与语音相关的两类问题,音调连续性和结尾自然度,分别提出了基频连续性和
论文部分内容阅读
随着语音合成技术的发展,合成语音的音质和可懂度不断提高,而如何进一步提高其自然度成为语音合成方面的重要问题。本文总结了近年来主流的波形拼接式语音合成系统在自然度方面影响主观感受的四类问题,分析了它们对自然度主观感受的影响、产生的原因以及进行测试和改进的方法。考虑到不自然点的定位与检测对于自然度问题发现与改进的重要作用,本文针对其中与语音相关的两类问题,音调连续性和结尾自然度,分别提出了基频连续性和波形包络在停顿前的连续性两种不自然点的客观度量方法,并在此基础上进一步设计了语音自然度中不自然点的自动定位与检测算法。实验数据表明,人工听辨发现的音调不自然点都可以通过基频不连续点检测出来,并且在较为挑剔的自然度评判中,该算法有较高的准确率;而通过波形包络在长停顿前的不连续点检测,可以非常精确地发现结尾不自然的点。在语音合成系统的评测和改进工作中,本文提出的客观度量和不自然点自动检测方法提供了比人工听辨更可信的数据参考,具有较高的实用价值。
其他文献
The study investigates dispersion and variability of the vowels of three Chinese dialects,namely Yongding (Hakka or Kejia),(Hong Kong) Cantonese,and Wenling (Wu) with three,seven,and eleven vowel phon
汉语把方言的语音描写需要完善,文章以8号元音[(w)]为例作了一些探讨.1)分析了IPA-HELP中的发音样本[(w)]以及在整个元音系统中的格局,总结了[(w)]的主要特点.2)选取9个方言音系中记录为[(w)]的元音,用Praat标注、提取共振峰数据并作声学元音图,发现与IPA-HELP的声音样本[(w)]较为接近的是海南乌烈军话、武汉话、西宁话、西安话以及合肥话中的[(w)],而银川话、兰州
英语元音后辅音/r/读音是美音中的一个显著标志,也是人们区别美音与英音的一个重要标准。本文通过问卷调查和材料朗读的方式,对烟台市三所高校的48 名英语专业大学生的发音情况进行了调查,并且结合了听觉上的辨认和实验的方法,对所得语料进行了转写。调查结果显示:/r/读音的音系环境对/r/读音的影响很大;在影响/r/读音的音系环境的作用方面,本文与Irwin & Nagy的研究结果有着显著的差异,表现出了
本文采用共振峰数据分析的方法,考察了增城粤语的a 和(e)。发现增城话(a)i 和(a)u的起点比ai 和au 的高一些、后一些,(a)i 起点舌位比较靠后。与单韵母a 相比,a(n)的元音靠前一些,而(a(n))的元音高一些,且非常靠后。在后接-p 尾时,增城话的a 和(a)非常接近;后接-k尾时,a 比单韵母a靠前一些;而(a)k 的元音比单韵母a 靠后。在时长方面,增城话(a)的比a 略短。
本文主要探讨了汉语语音清晰度评价方法中的权重系数问题。语言传输指数STI是常用的语言清晰度客观评价方法,权重系数是影响STI值的重要参数。通过汉语语音清晰度主观评价实验,利用迭代法,求出了一组评价汉语语音清晰度的权重系数。结果表明,该组权重系数比原有的权重系数更适合用来评价汉语语音清晰度。
系统阐述了运用鼻音计对中国学生习得日语响音的鼻化度分析。包括通音声母的鼻化对比度、元音内在鼻化度、元音复合鼻化度的内涵及其应用,对比中日学生日语响音鼻化度,初步得出中日学生日语元音、拨音鼻化度顺序。
Based on Prosodic Theory in Phonology,the paper makes a tentative study upon the pitch pattern (F0) of the Chinese version of Death of a Salesman to investigate the translated dramas’ prosodic feature
播音发声属于艺术嗓音范畴,要求播音员音质稳定圆润,并能有效控制共鸣。目前对播音发声音质的微扰特性分析较为少见。为此,本文录制了10 名播音员(5 男5 女)和8 名普通人(5 女3 男)汉语普通话单音语料(阶梯音、韵母、单字),提取其基频、基频微扰百分比及幅度微扰百分比、共振峰及带宽、共振峰频率微扰百分比、共振峰幅度微扰百分比7个声学特征,分析播音员音质在这些特征上的表现,并与普通人的特征结果相比
文章对汉语普通话高兴、害怕、生气、难过、厌恶五种基本情感语调进行了全面的感知实验和相关的声学分析.感知实验表明:(1)普通话五种情感语调的听辨优劣性差异较大,听辨优劣的排序为难过>高兴>生气>害怕>厌恶;(2)难过与害怕之间、生气与厌恶之间分别出现较高的听辨倾向性,他们之间存在一个感知边界,其临界S值分别为0.16和0.22.(3)情感语调的感知情况与受试者的语言背景有关,母语为普通话的受试者听辨
本文利用石锋教授提出的“语调格局”思路和语调起伏度的研究方法,在对蒙古语标准音自然焦点陈述句、祈使句、疑问句和感叹句的语调及其起伏度进行系统地定量和定性分析的基础上,探讨了用语句调域和语句内调群调域起伏度区别蒙古语四类基本句式的方法。结果表明,无论是从语句音高曲线的变化,还是从语调曲线的起伏度以及语句调域和调群调域的宽窄变化,都可以观察到不同语气和不同发音人之间的细微差别。摘要部分不要超过两段。