嵌入式语音合成关键技术研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:mybestlove_nx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代社会信息化、智能化,网络化的发展,嵌入式系统作为后PC时代和网络时代的新秀,正在大放异彩.而智能语音技术的不断成熟和完善,也给嵌入式的发展带来无限的活力.由于语音合成系统对于运算和存储资源要求比较高,因而限制了语音合成技术的应用范围,过去主要局限在服务器级和桌面级应用.然而,近几年随着嵌入式技术的蓬勃发展,嵌入式设备越来越受到社会的认同,为了满足用户对于嵌入式设备更便捷、更自然使用的需求,将汉语语音合成技术应用到嵌入式设备中已成为必然的趋势.嵌入式语音技术的应用必将形成强大的社会潮流.我们已经积累了相当丰富的大语料库合成知识和技术,拥有较成熟的大语料库合成系统,并具有良好的合成效果.大语料库合成方法代表了语音合成技术领域的最新研究方向.如何协调好大语料库合成系统的合成效果和资源消耗,使得大语料库合成技术在嵌入式领域应用是一个亟待解决的研究内容.该文在已经积累了大语料库合成技术的基础上,充分利用原有资源,运用数据挖掘中聚类技术以及统计学方法对原始语料库进行统计分析,聚类裁减,制作尽量覆盖原始音库中韵律情况,同时满足系统极小尺寸资源消耗要求音库,并用裁减后的音库去构建嵌入式环境下的语音合成系统.为了进一步提高嵌入式语音合成效果的自然度,对原有的基于音节的语音片断拼接技术进行改进,引入不定长单元挑选、拼接技术.该文从一个大语料库合成系统的音库入手,对音库进行了相关统计以及聚类裁减,最后得到一个尽量覆盖原始音库中韵律情况,同时满足系统极小尺寸资源消耗要求音库,并建立了相应的不定长单元索引,形成了基于音节和音步的双层索引体系.采用裁减后音库以及改进的单元挑选算法,搭建出研究原型系统,并经过多个专业人士测听,根据合成效果来验证音库裁减和不定长单元单元挑选技术.合成的声音具有较好的清晰度,自然度,基本达到预期目标,裁减后系统虽然未能达到与原系统一样优质效果,但在极小的资源消耗下整体上逼近原先效果,更加适合向嵌入式环境下移植.
其他文献
目前在Internet/Intranet环境中,企业级应用系统大多采用三层或多层应用模式。为了方便开发、部署、运行和管理基于多层结构的应用,需要以网络和分布式计算的底层技术为基础,构建
Gnutella网络是典型的完全无中心的文件共享的P2P网络,近年来发展非常迅速。但是,Gnutella网络的可扩展性差,大量的冗余消息加重了网络负载,这些缺陷限制了Gnutella网络的进
语音信号和视觉信号是多媒体交互信息的主要载体.人们对语音、图像的处理技术已经有了比较深入的研究,但是对于语音和图像之间的内在关系的研究却还不够深入.作为综合考虑语
利用遗留系统来开发新系统,已成为当前软件工程研究的一个重要方向。软件再工程正是在这种情况下已越来越显示出其重要作用。软件再工程提供了一条有效利用遗产系统的现实可行
空中交通指挥系统(ATM)是保证航空飞行安全、高效的关键系统,它由复杂的硬件系统和软件系统组成,如何有效的监视并控制这些硬件、软件系统的运行状态是现代空管技术中的重要
需求工程是近些年来兴起的软件工程研究的子领域,人们对软件工程中的需求分析及建模技术的认识越来越重视.需求分析与建模技术在现阶段的研究中虽然各自有所发展,但技术都是
互联网、集群和多媒体技术的发展,使多媒体数据日益成为下一代互联网信息数据的代表。多媒体信息压缩的技术是多媒体通信领域的关键技术,因此编码标准MPEG-4也成为了研究的焦
随着网络技术的飞速发展,网络安全问题日益突出,防火墙是目前广泛使用的一种网络安全技术.由于当前基于Windows的包过滤防火墙一般建立在网络层之上,不能拦截所有数据包.另外
自动控制作为计算机的重要应用领域之一,对国民经济的发展起了极大的促进作用。通过智能控制,不仅大量节省了人力物力和成本,提高了劳动生产率,同时还提高了产品质量。 本课题研
工作流管理系统WfMS(Workflow Management System)是近年来随着Internet和Intranet的急剧推广而快速发展的软件系统之一。该系统的主要目标是通过调用有关信息资源与人力资源来协调业务流程中的各个环节,使之按照一定的顺序依次进行,从而实现业务流程的自动化。 目前国内外虽然已经有了很多工作流管理系统的产品,但是它们大部分不能有效的处理工作流中的异常情况,极大的