越南语文语转换技术研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:yishuiji111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着语音合成应用的普及,人们对合成语音的音质和自然度提出了更高的要求。越南语是越南的官方语言,属于南亚语系孟—高棉语族。越南语类似于汉语普通话,也采用“声、韵、调”标记其音节。本文以开发越南语文语转换(TTS)应用系统为目的,研究越南语语音合成,探索提高音质和自然度的途径。根据越南语的特点,本文选用声母和韵母为合成基元,并采用左、右相关的三音子模型。一个完整的TTS系统包括前端文本分析模块和后端语音合成模块。在前端文本分析方面,本文研究越南语的分词、词性标注、特殊符号处理和韵律短语(L3)边界预测等关键技术。在后端语音合成方面,本文研究越南语训练语料的收集、标注,以及合成器的训练等。学位论文的主要工作包括:1.构建越南语的TTS基线系统,包括文本收集和录音、确定音素列表、标注、上下文属性和问题集设计、训练HMM合成器等。根据系统测试和评测的结果,从标注、上下文属性和问题集三个方面对初步构建的合成器进行了改进。2.采用正向最大匹配法(FMM)和逆向最大匹配法(BMM)相结合的分词方法实现自动分词工作。提出了越南语词性标注方案,拟采用基于统计语言模型的方法实现词性自动标注。对越南语文本中出现的特殊符号进行标准化处理,包括文本中的阿拉伯数字、数学符号、国际物理量和货币单位、缩略语等。3.采用C4.5决策树算法实现越南语L3边界的自动预测工作,包括属性信息提取、模型训练和L3边界自动标注,并对自动标注结果进行了主客观评测。实验结果表明:(1)采用本文方案改进后的合成系统,其合成语音的主观评测得分(MOS)分别为:集内3.89,集外3.55,说明改进效果明显。(2)使用论文中所述方法实现越南语自动分词和特殊符号处理具有实用性和可行性。(3)采用本文所述方法预测L3边界,集内外测试的F-Score值分别为60.73%和57.96%,主观评测其可接受率分别为72.3%和69.0%。该方法用于越南语L3边界的预测可满足语音合成系统的初步应用,且为进一步提高越南语语音合成的自然度奠定了基础。
其他文献
有丝分裂纺锤体存在于目前已知的所有真核细胞中,主要负责细胞分裂时已复制染色体的分离。不正当的纺锤体组装会直接导致染色体的分离错误或失败,造成遗传的不稳定性,从而导致细
中国是一个多民族国家,由于地理、历史和文化等方面的因为,各民族之间,同一民族内各地理群体之间相对隔离。分析中国各群体遗传结构和变化规律,对探索中华民族群体起源、法医
哺乳动物中枢神经系统绝大多数的兴奋性神经传导都是由谷氨酸能突触介导的。果蝇神经肌肉突触与哺乳动物的中枢神经系统兴奋性突触有诸多相同点,其谷氨酸受体与哺乳动物的非NM
香蕉枯萎病是由镰刀菌(Fusarium oxysporum f.sp.cubense)引起的维管束病害,对我国广东和海南的香蕉种植业造成了严重的威胁。迄今为止仍无有效的防治方法,由于是土传性病害,所以
荔枝(Litchi chinensis Sonn.)是原产我国南方的名果,但果实采后极易褐变。果皮褐变是限制荔枝长期贮运、导致货架寿命缩短和果实商品价值下降的主要因素。一般认为,荔枝采后
当今,用户对高质量视频的需求愈加强烈,致使视频图像传输码率日益增高,伴随着移动视频设备的发展及信道带宽的限制,运营商希望能够使用较低的码率传递高质量的视频。致使视频
AVS的应用推广伴随着技术的日趋成熟已经走过了十年,在新形势下,高性能的AVS高清编码芯片的开发成为其进一步开拓市场的关键。本文就是从实际多媒体芯片的设计出发,研究了AVS
气候变化是当今人类面临的严峻挑战,积极探寻气候要素变化与不同尺度生态系统之间的相互作用,揭示气候变化对生态系统的影响已成为近年来全球变化和生态学研究的一个重要领域。
本刊讯5月15日,海南省科技厅和财政厅组织对2013年度立项的海南省重大科技专项项目进行了年度考核和经费审计。中国热带农业科学院热带作物品种资源研究所牵头的《主要热带花
可调光学滤波器是全光通信中不可缺少的器件,是全光通信网络中光分/插复用器(OADM,OpticalAdd-DropMultiplexer)、光交叉互联器(OXC,OpticalCross-Connect)及光性能检测器(OPM,Op