面向特定领域藏语统计参数语音合成的文本分析研究

来源 :西北师范大学 | 被引量 : 0次 | 上传用户:szf_2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中国是一个由56个少数民族组成的国家,藏语人口已达到38.58万人次,但是藏语研究相对较晚,尤其是统计参数藏语语音合成方面,缺乏相关文本分析,缺乏对于特定领域的藏语语音合成的文本分析。因此,本文针对已有的统计参数语音合成的文本分析中的词及词性层和语句层进行了改进,在语句层加入了文本的分类信息,然后利用此文本分析进行了藏语语音合成并获得了较好的合成效果。本论文的主要工作和创新如下:1.提出了3种藏语分词模型来获得词边界,分别为双向长短时记忆网络加条件随机场模型(Bi-directional long short-term memory with conditional random field model,BiLSTM_CRF),卷积神经网络加双向长短时记忆网络加条件随机场模型(Convolutional neural network bi-directional long short-term memory with conditional random field model,CNN_BiLSTM_CRF)和序列到序列(Sequence to sequence,Seq2seq)的标注模型,实验结果表明CNN_BiLSTM_CRF模型的藏语分词效果更好,BiLSTM_CRF模型的藏语词性标注准确率高,Seq2seq模型能同时进行藏语分词及词性标注。2.提出了一种基于深度神经网络的藏文文本分类方法。首先对藏文分类文本进行分词,其次设计藏语停用词表,去除文本停用词、计算所有词词频、提取每个类别的特征词构建词向量空间模型获得词向量,然后将该词向量输入到分类模型训练藏文文本分类器,最后采用训练好的藏文文本分类器对待分类藏文文本进行分类。结果表明,深度神经网络模型中快速文本分类器得到的文本分类效果最好。3.提出了一种面向特定领域统计参数的藏语语音合成的文本分析方法。首先,将合成文本通过分解藏字得到藏字的声、韵母信息,完成字音转化。其次,对合成文本进行每个音节的切分。接着,对藏语语音合成文本进行分词及词性标注。然后,对藏语语音合成文本中的每句话通过分类模型进行类别确定。最后将以上步骤得到的声韵母信息、音节信息,词及词性信息和句子类别信息通过上下文相关标注程序得到一个四层的上下文相关标注,将该四层标注和问题集共同输入到深度神经网络进行的特定领域的藏语语音合成。实验结果表明加了分词和词性标注后的合成语音的自然度更好,加了文本分类后,合成语音的表现力更高。
其他文献
全卷积神经网络(FCN)的图像语义分割算法不仅能够直接处理任意尺寸的图像,省去繁琐的中间步骤,实现端对端像素级分割,而且提高了分割的准确率。但是全卷积神经网络中的池化层
随着互联网信息技术的快速发展,数字图像的数量显著增长,同时对于数字图像的处理也变得越来越简便,使得各个领域内出现大量的伪造图像,因此,图像的真实性受到人们的严重质疑
近年来,电阻层析成像技术(Electrical Resistance Tomography,ERT)是一项发展比较迅速的技术,具有低成本、无放射性、可视化和非入侵的特点,主要以电磁场的似稳场为理论基础,
中子探测技术被广泛应用在材料勘探、爆炸物的安全检测、环境污染的放射性检测、航天航空、核工业等领域,中子探测技术的广泛应用致使中子探测器也得到了快速发展。但是常用
视频中人体动作识别是计算机视觉领域内长期备受关注的课题,在视频监控、人机交互和视频理解等领域发挥着重要的作用,受到国内外学者的广泛关注。随着大数据时代的到来,视频
中国古建筑是精湛建造工艺与优秀传统文化的有机结合,是中华民族的宝贵财富。在古建筑结构中,木梁是主要抗弯承重构件,长期承受屋盖、楼板传来的积雪、人群等竖向荷载,在上百
国内外研究水流泥沙运动的动床模型中,为满足泥沙运动相似和河床变形相似,模型沙大多选用轻质沙。眼下由于对轻质沙运动理论的认识不够充分,仍无法有效避免在模型试验中出现
一氧化氮(NO),生物体内重要的神经递质分子,生物活性强且广泛存在于人体器官组织中。铜是自然界中广泛存在的金属元素,在生产生活中具有广泛应用。基于NO和Cu2+在生物体内的
微细电火花加工具有非接触、无毛刺、低应力等特点,在微细加工领域中占据重要地位,是微细孔、微沟槽及微三维结构等微小尺寸零件加工中不可替代的一种技术。脉冲电源为微细电
人文社会科学通过人类行为来揭示社会现象和经济现象背后的规律。但受到网络应用不断深入的影响,人类在线行为越来越复杂,其背后隐藏的信息也越来越难以发掘。大数据技术的出