论文部分内容阅读
随着科学与技术的发展,高自然度的语音合成成了人工智能、语音信号处理以及人机交互领域一个重要的研究课题。现阶段的语音合成技术研究重点是实现汉语文语转换系统(CTTS),将输入的文本按语音处理规则自动地转换为声学信号输出。为了更准确预测出输入文本的韵律边界信息,提高输出语音的自然度,本文建立了文本语料库,统计分析了语法特征、句法特征和韵律结构的关系,对比分析了词性、词长和邻接度等各个参数对韵律边界预测的影响,最终利用TBL算法来实现对汉语韵律边界的预测。论文的研究结果对于揭示文本与语音之间的关系、提高合成语音的自然度具有重要的理论意义和应用价值。论文的主要研究成果和创新如下:1.设计并建立了一个含句法信息的大规模的汉语文本语料库。本文利用面向web基于XML的中文信息处理平台——语言技术平台LTP,对句子进行句法结构拆分;语料信息标注结果均通过了专家的抽样检查,达到了科研要求,可用于韵律边界的预测。该语料库包含约10000句标准语法的汉语文本语料,平均句长为52字。2.统计分析了语法特征、句法特征和韵律结构的关系,提出了一个用于汉语韵律边界预测的新特征——邻接度。对文本信息的统计分析表明:文本语料中语法词在该句子中的句法层级和韵律结构有很大的相关性。本文提出用邻接度(Adjacent Degree,AD)这一概念来描述文本语料中语法词在该句子中的句法层级,并将它作为新的韵律结构的预测参数,反映句法结构和韵律结构的关系。因此,标注汉语语料时追加了邻接度这一反映句法特征的信息。3.提出将词性、词长和邻接度等特征作为韵律预测的参数,并对比分析了词性、词长和邻接度等特征对韵律边界预测的影响。本文对汉语语料库的文本信息进行了统计分析,根据分析结果选用了词性、词长和邻接度等特征作为韵律边界预测的重要参数。4.提出了一种能有效预测韵律边界的统计学习算法——TBL算法。TBL算法是一种基于转换的错误驱动学习算法,它能在人工规则模板不适用时自动地从实例中学习新规则,并将新规则添加到已有的规则模板中。实验结果表明,该方法在测试集上韵律词的预测精度达到了98.4%,韵律短语的预测精度达到了82.7%,均优于现有的同类研究结果。