分布式语音合成系统及关键技术研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:ren_sir
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文针对如何在资源有限的便携/嵌入式设备上实现高自然度的合成语音展开研究工作.作者首先分析了目前和未来在便携/嵌入式设备上的语音交互和合成应用的特点,指出这些设备实际上都具有某种方式的与外界通信能力,部分程度上,其表现内容也是由提供方事先制作的.在综合分析这些应用的实际需求后,作者创新性的提出了一种分布式语音合成方法,这种方法将原本在同一处理单元上完成的语音合成处理过程分解为服务端和客户端两部分,通过合理的设计其分界点,可以既做到通信量少,客户端占用资源低,又做到合成效果高.在后面的章节中,作者就这种思想的可行性与具体实现展开研究.在文章的最后,对整个系统和分布式语音合成方法的优缺点进行了详尽阐述,指出了这种方法适合与不适合的领域.同时指出在研制该系统的过程中所得到的关键技术成果对于其他领域的贡献.在最后的展望中,作者对于分布式语音合成技术的下一步发展,以及技术如何与需求更紧密的结合给出了自己的观点.附录中引用了CSSML的标准文本与其Schema定义,供有兴趣的读者参考.
其他文献
在光纤接入网(OAN)领域,相对于有源光网络(AON),无源光网络(PON)具有对高速传输的兼容性,对调制码型的透明性以及更高的可靠性等特点。正是无源光网的这些优点使它成为了未来光纤接入
该文通过对比多种频谱估计的方法和计算技巧,提出了有效的译码方案.并利用以DSP芯片为中心的硬件实现了译码方案.论文内容的结构是这样的:第一章介绍了TVM430信号系统的一些
该论文通过对VoIP技术较为深入的分析研究,根据作者的实际工作情况,提出了针对VoIP系列产品的VoIP软件系统设计思想,这些设计思想在实际的团队式开发中较为有用,并可以缩短新
目前在临床诊断过程中,心电信号的存储与传输是一个有待解决的问题,但是由于采集到的原始信号的数量巨大,所以对于这些数据的压缩处理是十分必要的.对于一个ECG数据的压缩算
本文所述是频谱管理系统的一个子模块,即网络服务模块,其中首先详细分析了频谱管理系统对该模块的各种功能需求,然后在相关技术分析和方案论证的基础之上给出了原理说明和主要算
人工神经网络和遗传算法是两种以生物学为基础的现代优化算法,因其优越性而被广泛应用于诸多领域。本文主要研究二者在微波设计中的应用。 文中对多层双复介质对垂直入射平
语音识别系统的噪声鲁棒性是决定语音识别技术从实验室走向实际应用的关键环节,是目前语音识别领域的研究热点与难点。由于语音识别系统是一种基于训练的系统,实际应用环境与形
偏振模色散(Polarization Mode Dispersion),简称PMD,现已成为发展高速光纤通信的主要限制因素。如果不消除PMD,不仅使人们在光纤中传输飞秒级光脉冲的愿望不能实现,而且使目前传
正交频分复用(OFDM)技术是当前移动通信领域的一项关键技术,OFDM技术具有很强的抗符号间干扰、抗多径衰落能力,适合在无线信道中传输高速的数据业务,因而倍受关注。OFDM采用了正
通信浮标战术应用及控制系统是一种基于通信浮标的设备.通信浮标经潜艇发射后,漂浮在海面上,作为潜艇与水面、空基、陆基之间的通信中继.该系统可以充分发挥潜艇的作用,提高