限定性文本的语料库自动构建

来源 :中国海洋大学 | 被引量 : 0次 | 上传用户：LUOLIJIAN88

【摘要】

：

语音合成技术是人机交互研究中比较重要的技术之一,并且已经应用到了社会生活的许多领域。语料库构建技术作为语音合成技术开发中的一个重要模块也受到研究人员的普遍关注。

【作者】

：

刘亚玉

【机构】

：

中国海洋大学

【出处】

：

中国海洋大学

【发表日期】

：

2010年期

【关键词】

：

语音合成语料库贪婪算法信息检索

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

语音合成技术是人机交互研究中比较重要的技术之一,并且已经应用到了社会生活的许多领域。语料库构建技术作为语音合成技术开发中的一个重要模块也受到研究人员的普遍关注。快速构建语音合成语料库的研究具有重要意义。目前,解决此问题较为成熟的技术是传统的构建语料库的方法。在传统的语音合成系统的构建中,首先要收集大量的文本资料,然后从文本中选择文本然后进行文本的录音和标注工作。对于英语语音合成系统的构建中,发音人的发音水平对合成语音的自然度和表现力方面都有重要的影响,是语音合成系统实现中要解决的重要问题。由于本试验室非母语发音人的关系,不能够实现纯正的发音水平。考虑到在网络中存在着海量的电子文本及其对应的语音录音(例如MP3形式)的优势,所以要采用新的方式实现语音合成系统。本文所做的工作是实现语音合成系统的一个组成部分-限定文本的语音合成语料库的自动构建。所要实现语音合成系统的方法是首先从网络中自动下载语言教学类网站中的基于特定人的文本和语音。我们从美国之音网站中下载了Faith Lapitus的语音MP3文件和对应的文本文件。由于发音人是新闻节目主持人,解决了实验室非母语发音人发音不标准的问题。由于在语音文件中存在音乐音频,所以需要实现语音和音乐音频分类,挑选出语音音频文件。由于构建语音合成语料库通常的方法都是使用句子,所以需要把这个的文本篇章形式的文件转换为句子形式的,所需要做的是句子切分,本文所实现的就是最后把得到的切分正确的句子集合作为初始文本集合来构建语音合成语料库。由于文本的选择是必须存在录音的情况下进行选择的,所以本文命名为在限定条件下的语料库构建。本文对语料库构建的常用方法一文本选择方法进行了研究和介绍,贪婪算法是解决文本选择问题常用的方法,我们应用贪婪算法进行了文本选择,并且结合信息检索中的方法,使用开源软件语音识别工具HTK和语音合成工具Festival实现语料库的构建过程。从实验中我们得到的最后结果就是基于特定人的文本选择中,双音素的覆盖率为93.52%。本文的主要工作和创新点有：(1)本文是一种全新的语音合成系统实现的组成部分。(2)本文采用与信息检索方法相结合的方法实现语料库的自动构建。这说明将信息检索方法和文本分类方法应用到贪婪算法中实现语料库的自动构建过程,可以提高语音单元的覆盖率,从而实现语音合成系统语料库的自动构建。

其他文献

基于SIP的WLAN可视电话IPv6移植研究

中国下一代互联网示范工程CNGI作为下一代互联网的实验平台，采用IPv6为重要协议，推动了IPv6在我国的发展。SIP和IPv6是下一代网的关键协议，SIP以其极好的协议扩展性已经成为构建

学位

可视电话IPv6协议SIP协议无线局域网

国标DSRC协议测试套的设计与实现

专用短程通信(DSRC,Dedicated Short Range Communieation)是智能交通系统(ITS,Intelligent Transport System)领域中专门用于机动车辆与路边设备交换信息的协议。DSRC系统分

学位

DSRCOBURSU协议一致胜测试抽象测试套TTCN-3

基于NTFS文件系统的计算机取证研究

信息技术的发展使得利用计算机系统作为犯罪的工具或目标的案件在司法案件中逐年增多，因此电子证据成为越来越多的诉讼证据，如何能有效地获取电子证据日益成为一个迫切需要解决

学位

计算机取证数据恢复NTFS文件系统文件记录

无线传感器网络节点和路由协议的研究与实现

近年来，无线传感器网络的发展引起了人们越来越多的关注。“物联网”“普适计算”等和无线传感器网络相关联的新名词接连出现；ISO/IEC JTC1国际传感器网络研究组(SGSN)和ISO/IE

学位

无线传感器网络分簇路由协议节点设计拓扑控制健壮性

利用上下位关系的中文短文本分类研究

短文本通常指文本长度小于160个字符，一般以手机短信、网页评论、网络聊天信息等形式存在的文本。短文本的分类问题是短文本应用领域必须解决的具有挑战性的基础问题之一。由

学位

短文本分类上下位关系特征扩展

自适应策略在多媒体教学系统的设计与实现

随着计算机技术、多媒体技术、网络通信技术的发展,网络教育以其特有的教学模式、丰富的教学内容与方法得到越来越多教师与学生的欢迎。计算机测试系统是网络教育发展中的一

学位

自适应策略项目反应理论参数估计牛顿迭代

基于内容感知的图像缩放算法研究

随着信息时代的来临，数码相机、摄像机等电子产品已走入千家万户，人们可以方便地获取到高分辨率的数字图像。为了信息传递、共享和交流，需要能够在手机、PDA、MP4等小屏幕的移动

学位

图像缩放算法内容感知特征网格有限元方法

虹膜识别中预处理及识别方法的研究

人类的虹膜具有唯一性、稳定性、不可改变性和高度的抗欺骗性,因此基于虹膜的生物识别技术广泛应用于安全控制和电子商务等许多领域。随着虹膜识别技术的日益进步,人们对识别

学位

虹膜识别非参量概率密度函数随机采样一致性算法眼睫毛检测SIFT

电力行业物资备品信息共享解决方案

电力的安全运营是其他行业正常运转的基本保障,为了保证电力供应,需要对电力供应相关的备品进行储备。电力行业的分散布局决定了备品分散在各个执行机构不能集中储备,由于没有面向全局的规划储备方案,备品大量重复储备,占用大量流动资金并消耗大量保管费用。同时由于设计时没有统一规划,使得备品信息成为‘数据孤岛’,备品储备信息无法共享,在应急维修中不能快速的找到相邻单位的空余设备来完成紧急任务。为了降低运营成本,

学位

物资备品变化捕捉物资分类管理系统信息共享

细粒度数据完整性检验算法研究

近年来，计算机犯罪一直是有增无减，严重影响到社会的安定，计算机取证是有效打击计算机犯罪的重要手段，其关键在于保证提取的电子证据具有法律认可的证明力。　　与传统证据相比

学位

计算机取证计算机犯罪电子证据法律认可细粒度数据完整性检验

限定性文本的语料库自动构建

与本文相关的学术论文