维吾尔语TTS语料库建设关键技术研究

被引量 : 0次 | 上传用户:feifeiml
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音语料库的建设是语音合成技术中的重要环节,其中包括文本语料收集、典型文本的筛选、录音、语料的标注、语音语料库的设计和压缩等工作。本文围绕着自动标注和压缩技术进行研究。本文为了实现容量小、可懂度和自然度较好的波形拼接式维吾尔语语音合成系统,结合维吾尔语的特点,完成了文本设计、录音、语音标注。在语音标注工作中,为了减少人工工作量,提高语音标注的准确率,结合维吾尔语语音特征,本文用单音素HMM和上下文相关三音素HMM两种模型对连续维吾尔语音进行语音单元边界的自动划分。研究HMM和HTK的使用法,通过训练得到单音素HMM模型和上下文相关三音素HMM模型后实现维吾尔语语音单元边界自动划分。在设计语音语料库结构的过程中,把音节作为基本的合成单元建立了音节语音库,为了弥补音库中不存在的音节的合成,又建立了音素作为合成单元的音素语音库。实验结果表明,以音节和音素为最小合成单元的波形拼接式维吾尔语语音合成系统除了音库容量相对少等特点之外,还具有良好的可懂度。减小占用空间,同时解压后的语音不失真,本文对语料库进行无损压缩,即选择了运算速度快,便于实现的哈夫曼压缩。压缩语料库时对语料库中的所有音节、音素进行压缩。在合成语音时只对被候选出合成单元进行相应的解压,不需要解压整个语料库。
其他文献
建国后,我国在相当长的一段时间内处于计划经济体制下,政府对各项社会资源进行统一分配,作为重要生产要素的土地也不例外。因此在这个时期,基本不存在土地市场,对土地经济问
分布嵌入式软件功能模块的设计与实现是当前研究热点,在嵌入式系统中,实时定位的研发是一类重要的应用。在手机上开发实时定位软件,选择Android这样的技术框架是必要的。首先
近年来,基坑向着超深、超大规模的方向发展,对基坑的安全性和经济性要求越来越高。本文的依托工程——龙江特大桥锚碇基坑工程,为深度达到30-38米的第三系强风化玄武岩地层深
针对目前多数入学研究生有理论知识,但临床实践不足的状况,我院神经精神病学教研室对神经病学硕士研究生的临床神经病学课程采取案例教学法。经过两年来应用取得了较好的教学效
李白在其诗赋中多处塑造了大鹏的形象。他本身就是盛唐文化哺育出的一只独特而复杂的大鹏:既热衷功名,志在济世,又酷爱自由,傲岸不羁。李白身上的这两种个性本并不必然构成矛
基于HJ2.2-2008《环境影响评价技术导则——大气环境》有关规定,结合大气环评实践案例,对大气环境影响评价工作等级划分技术方法进行深入、系统地研究与探讨,提出等级划分原
在油田实际生产过程中,随着注采时间的不断推进,注采工作制度的不断改变,目的层孔隙压力不断变化,进而导致地层压力重新分布并呈动态变化;同时地层孔隙压力又诱导地应力发生改变,这
目的:建立蕨麻药材中刺梨苷含量的HPLC测定方法.方法:色谱条件phenomenex(5 μm,C18)分析柱,甲醇-水(64∶ 36)为流动相,检测波长208 nm.结果:刺梨苷在0.2040~4.080 μg范围内
民国时期,重庆是中国长江上游第一商埠,也是西部最重要的贸易枢纽之一。重庆城被城中的山脊分为上下半城,由三条主干道构成城市交通的骨架,并大抵按功能形成城市分区的格局。
以嵌入式ARM9控制器和FPGA为处理核心,设计了手持式的电压波动与闪变测试仪,可以同时测量4路交流电压信号的短时闪变值Pst和长时闪变值Plt。为了简化运算过程,对电压每半周波