论文部分内容阅读
中国是一个由56个少数民族组成的国家,藏语人口已达到38.58万人次,但是藏语研究相对较晚,尤其是统计参数藏语语音合成方面,缺乏相关文本分析,缺乏对于特定领域的藏语语音合成的文本分析。因此,本文针对已有的统计参数语音合成的文本分析中的词及词性层和语句层进行了改进,在语句层加入了文本的分类信息,然后利用此文本分析进行了藏语语音合成并获得了较好的合成效果。本论文的主要工作和创新如下:1.提出了3种藏语分词模型来获得词边界,分别为双向长短时记忆网络加条件随机场模型(Bi-directional long short-term memory with conditional random field model,BiLSTM_CRF),卷积神经网络加双向长短时记忆网络加条件随机场模型(Convolutional neural network bi-directional long short-term memory with conditional random field model,CNN_BiLSTM_CRF)和序列到序列(Sequence to sequence,Seq2seq)的标注模型,实验结果表明CNN_BiLSTM_CRF模型的藏语分词效果更好,BiLSTM_CRF模型的藏语词性标注准确率高,Seq2seq模型能同时进行藏语分词及词性标注。2.提出了一种基于深度神经网络的藏文文本分类方法。首先对藏文分类文本进行分词,其次设计藏语停用词表,去除文本停用词、计算所有词词频、提取每个类别的特征词构建词向量空间模型获得词向量,然后将该词向量输入到分类模型训练藏文文本分类器,最后采用训练好的藏文文本分类器对待分类藏文文本进行分类。结果表明,深度神经网络模型中快速文本分类器得到的文本分类效果最好。3.提出了一种面向特定领域统计参数的藏语语音合成的文本分析方法。首先,将合成文本通过分解藏字得到藏字的声、韵母信息,完成字音转化。其次,对合成文本进行每个音节的切分。接着,对藏语语音合成文本进行分词及词性标注。然后,对藏语语音合成文本中的每句话通过分类模型进行类别确定。最后将以上步骤得到的声韵母信息、音节信息,词及词性信息和句子类别信息通过上下文相关标注程序得到一个四层的上下文相关标注,将该四层标注和问题集共同输入到深度神经网络进行的特定领域的藏语语音合成。实验结果表明加了分词和词性标注后的合成语音的自然度更好,加了文本分类后,合成语音的表现力更高。