语音语料库的设计与实现

被引量 : 0次 | 上传用户:pipipipi9
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类社会的理想之一就是让机器掌握“听”与“说”的人类言语能力。随着计算机科学和信息社会的发展,这个理想正逐步变成现实。语音识别技术是解决机器“听”懂人类言语的一项研究,语音合成技术是解决让机器获得了“说”的言语表达能力。不管是语音合成研究还是语音识别研究,都一定程度上依赖于后端优秀语音语料库的构建。本文提出构建的语音语料库,主要起到扩大语音语料的来源,提高语音识别和合成系统构建工作的效率。首先,在本文第一章中介绍了语音合成与语音识别发展现状,语音语料库与语音合成与语音识别研究的关系。在第二章中介绍了语音合成与语音识别对语料设计的要求,然后提出了我们语料文本设计的目标,确定语音基本单位(三音子),开始进行原始语料的收集。介绍了贪婪算法在语料文本选取中的应用,最后通过贪婪算法(基于高频词、三音子)对原始语料进行筛选,得出设计的语料文本。其次,在第三章中,我们按照实际需求对语音采集系统进行模块设计,使用的开发工具和平台为基于.Net技术、采用SQL Server2005数据库、C/S模式,对每一个模块进行详细的设计,主要包括分析数据对象、结构以及存取方案的实现以及完成语音数据库的设计。在开发过程中对程序不断地进行完善、修改与测试,最后进行部分录音测试。最后,在第四章中介绍了国际上流行的英语语音标注体系ToBI和汉语普通话的语音标注体系C-ToBI,然后根据我们的实际情况,确定我们的语音数据的标注分为音段标注(文字、带调拼音、声韵母)和韵律标注(韵律边界)。下来就是自动生成未经对齐的标注文件的实现,然后通过人工手动把标注文件与语音文件进行对齐。
其他文献
京味派小说的魅力不仅在于其浓烈的平民化色彩,更在于其通过口语化的幽默语言来表现的一种雅致、含蓄、舒展、雍容的北京文化。作为京味小说的源头,老舍以其作品的"北京味儿"
<正>引言:在直肠癌的治疗方法中,手术切除仍是治疗直肠癌的主要手段。腹腔镜、吻合器的应用明显提高了保肛率。然而吻合口漏仍是最令病人及外科医生烦恼的并发症之一[1],因此
目的:对盐酸多西环素对非淋菌性尿道炎、宫颈炎的治疗效果进行简要探究。方法:在我院自2012年4月至2014年5月收治的非淋菌性尿道炎、宫颈炎患者中,随机抽取52例,根据抽签的方
使用膜浓缩-酸化法联合工艺处理黄金生产企业含氰废水,实验研究反渗透膜对黄金生产企业含氰废水中氰化物截留率、气水比和温度对酸化吹脱膜浓水中氰化物的效率的影响、臭氧投
本文通过:(1)检测、分析类肾阳虚家免的心脏收缩、舒张性能及其与血清性激素水平的关系;(2)检测类(肾)阴虚和类(肾)阳虚大鼠血清心钠素水平;(3)观察温补肾阳、滋阴、助阳等中
介绍钢结构CAD软件STS的研究开发目的、技术条件 ,以及STS软件的功能和应用情况
一方面,民事责任能力的适用范围不限于侵权责任;另一方面,并非所有的侵权责任都适用民事责任能力。民事责任能力的适用范围不应以责任的发生原因如侵权行为、违约行为等为界
目的:观察和分析对因慢性阻塞性肺疾病(COPD)所致单纯急性呼吸衰竭患者采用面罩机械通气进行治疗的临床应用价值。方法:选取我院2012年12月~2014年12月间收治的需行机械通气
<正>不记得什么时候同一友人谈到青岛有种苦老酒,而他这次竟从青岛带了两瓶来,立时打开一尝,果真是隔了很久而未忘却的味儿。我是爱酒的,虽喝过许多地方不同的酒,却写不出酒
期刊
介绍了福州电业局所属变电站直流系统的运行现状,就变电站直流系统从蓄电池、充电机、绝缘监察装置存在问题分别进行剖析,对加强直流系统的运行管理提出了建议。