论文部分内容阅读
语音合成是当今计算机智能应用领域的研究热点,目前的合成系统在可懂度方面的研究取得了较大突破,语音合成的可懂度效果已经达到了基本可以接受的程度,但在自然度方面还不尽如人意。因此现阶段的重点工作就是努力提高合成语音的自然度。在目前合成技术已经相对比较成熟的情况下,存在的主要困难是韵律层面处理不够理想,其中合成语句缺少重音的刻画是突出问题之一。如果能够从文本层面对语句重音的位置进行较好的预测,能够从声学层面给出与韵律词重音匹配的声学参数,必将使合成的语音在自然度上得到较大的提高。
本文的目标是研究基于重音模型的汉语语音合成系统,即是在传统的韵律模型中加入对重音的预测,从而构成支持重音合成的汉语语音合成系统。
本文首先对汉语语音合成系统的研究历史和现状做了较为全面的介绍,接着研究汉语语音合成的重音模型。重音模型的研究思路为:第一,从句法分析结果建立词的重音模型。通过提取词所属的句法结构、声调组合、词在句中的位置以及词本身的词性(或短语类型)作为属性,使用决策树和SⅧ进行对比,最终选取了对重音影响比较大的属性,同时应用统计(C4.5)和规则相结合的方法来建立重音模型;第二,研究不同重度的词的声学参数特征,结合以往前人的研究成果,提取了重音声学参数规则;第三,基于重音模型和重音参数规则完成了一个支持重音模型的汉语语音合成系统。
另外,本文还提出了利用简谱的音符和节拍来描述单字词韵律的方法。最后对本文进行了总结和分析,对需要改进和增加的功能进行了说明,以便以后的研究者进一步完善支持重音合成的汉语语音合成系统。