藏汉双语多模态生理语音数据库的建立和语音特征分析

来源 :天津大学 | 被引量 : 0次 | 上传用户:pooh__5210
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着近几年藏文信息处理技术的迅速发展,藏语语音研究也跟着逐渐升温;实验语音学的理论和方法也在藏语语音研究中逐渐推广和应用。但是到目前为止还没有较为完整的藏汉双语多模态生理语音数据库,因此,建立一个藏汉双语多模态生理语音数据库对藏语语音的基础研究和藏语语音其他领域的发展具有重要的意义。本课题的主要研究对象是藏语卫藏话,首先需要建立一个藏汉双语多模态的生理语音数据库。我们根据此数据库的要求,设计和建立藏汉双语的文本语料集,此文本语料集中包括41句藏语句子、27句汉语句子、30个藏语辅音、4个元音以及25个藏语单音节;然后以该文本语料集为基础,通过由Terason超声仪(Ultrasound)、高速摄像仪(High-speed video camera,HSV)、电磁发音记录仪(Electromagnetic Articulograph,EMA)等组成的生理语音数据采集系统对藏汉双语生理语音数据进行多模态的采集;之后,利用Praat软件对所采集到的音频文件进行语音文本的标注;最终建立了一个大小约为2.5TB的生理语音数据库。数据库建立之后,对得到的多模态数据进行整理和分析,此课题中首先是对藏族发音人发藏语元音和汉语元音的分析,得到男、女发音人在发这两种元音时共振峰的数据,并根据这些数据画出了相应的元音空间图。然后对藏族男、女发音人发藏语元音和汉语元音时的元音空间进行对比研究,发现藏族发音人在发汉语普通话的元音时会受到他们母语的影响。同时也将藏族人发藏语元音时的元音空间与汉族人发普通话元音、美国人发英语元音的元音空间进行对比,发现三者的元音空间大小相差不大,这也说明语言中元音的数量对元音空间的大小没有太明显的影响。
其他文献
基于纳米材料与有机聚合物复合的电双稳存储器件由于快速响应、非破坏性读取、高存储密度和易于制备等特点备受关注。已有研究结果显示纳米材料中与表面缺陷以及量子尺寸相关
随着数字化矿山的提出和推进,矿山数据信息化已经越来越重要了。财务评价作为矿山数据信息化的重要一环,其地位越来越重要。开发矿山企业财务评价系统,旨在矿山开采之前就能
茎秆抗折力是茎秆抗倒伏能力的基础,与茎秆弹性、硬度、充实度以及物质转运等有着紧密的联系。本文在大田条件下研究了3个株高域(矮杆60-70cm、中杆70-80cm和高杆80-90cm);12
本篇论文主要介绍了(+)-JQ1的背景研究,合成现状和我们的合成方法以及雷公藤乙素的背景研究和我们的合成研究。本篇论文主要分为绪论,(+)-JQ1的合成研究和雷公藤乙素的合成研
甜叶菊为菊科甜菊属的多年生的草本植物,因叶片中富含有多种甜菊醇糖苷,且是一种低热量的健康糖源,被应用于多种行业。由于市场上的一些甜叶菊品种的状况较杂,种子的质量也有高有低,导致后代遗传的稳定性较差,存在着一定的缺陷,且糖苷总含量较低,因此如何提高甜叶菊的繁殖系数,保持其优良性状,选育甜菊糖苷含量高,性状优良的新品种成为甜叶菊生产的迫切需求。本研究实地调查搜集了甜叶菊的7个品种材料,对其在同一栽培条
尼龙6(PA6)作为一种常见的工程塑料,具有优良的综合性能,广泛应用于交通运输、电子电气等领域。同时,PA6作为有机高分子材料,易燃烧,放热量高,在火焰中的燃烧速度快,特别是燃
以玉米秸秆木质素为填充剂,利用溶液浇铸的方法制备了木质素填充的苯乙烯/丁二烯/苯乙烯嵌段共聚物(SBS)膜材料,借助力学性能测试以及动态力学分析(DMA)、锥形量热分析(CONE)
RDF以三元组的形式描述语义网络中的信息,SPARQL是针对RDF数据模型的查询语言。well-designed SPARQL中的OPT操作是真正的可选操作,可以达到扩展结果集的目的。在来自真实世
信息技术已进入到云计算的时代。而随着云计算技术的发展,作为云依托的数据中心也发生了深刻的变革并产生了新一代的云数据中心。相比传统数据中心,新一代数据中心能满足云计
语音信号在语音通信系统中不可避免地受到环境噪声的干扰。语音增强是降低和抑制噪声干扰,提高语音系统通信质量的主要方法,在语音编码、语音识别、语音合成等方面得到了广泛