基于PSOLA算法的语音编码压缩的研究与实现

来源 :东南大学学报:自然科学版 | 被引量 : 0次 | 上传用户:pingzidege
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
以时域基音同步叠加(TD-PSOLA)技术和一个全汉语单音节库为全成单元进行汉语语音合成,合成的语音清晰度和自然度很高,但是这样的系统语音库太大,不利在于小型设备中实现,影响了语音合成的进一步应用,本文针对此问题,在研究A很压缩的基础上,采用自适应量化和自适应预测的技术,以较少增加合成运算量复杂度为代价,对语音库的编码实现压缩,使压缩后的语音库减小了约一半,大大减小了所需的存储空间,并且利用压缩后的语音库合成语音,基本上不影响合成后的语音质量,从而进一步扩展了语音合成的应用。
其他文献
2018年是晏阳初平民教育与乡村建设实验100周年,本文拟从晏阳初先生平民教育思想在新时代的传承为起点,在晏阳初故里四川省巴中市,建立晏阳初美丽乡村学院,以诵读艺术公益课
讨论了钻井泥浆泵阀的失效机理,提出影响泵阀寿命的2个主要因素是阀的冲击造成的阀的疲劳点蚀和由泥浆液的刺蚀、犁沟造成的冲蚀磨损.针对钻井泵现场工况,采用声信号进行诊断
为应对大数据时代背景下的个人信息保护困境与挑战,全球个人信息保护立法进程快速推进。随着信息技术的快速发展、经济利益的驱动,以及制度内因和客观外因结合,导致侵犯公民
用神经网络(ANN)建立非线性时间序列预测模型时,ANN输入数据延时间隔τ的选取是必须考虑的一个方面.目前关于延时间隔τ选取的流行做法是:将τ确定为相空间重构时的最佳延时
主要讨论了一种将加紧支撑窗与分数阶傅里叶变换相结合的信号处理方法.其原理在于将信号以短时窗函数截取,再配合分数阶傅里叶变换.通过改变这种变换中的角度参量可以找出最大
针对电子邮件应用日益广泛,邮件系统安全防护问题日益突出的现状,分析了邮件防护系统的
众所周知,深度报道记者因为没有“片”,采访常是“一锤子买卖”,因而记者要在收集线索上多下功夫。实践证明,只要用心,往往可以从所采写的新闻中挖掘出其他新闻。
介绍了一套应用于纸厂蒸煮车间的间歇蒸煮过程计算机优化控制系统,该系统能自动完成蒸煮各阶段的操作,也可用来指导操作工进行操作.除了实现对蒸煮过程的常规温度和压力控制
<正>今年,葫芦岛市委市政府把打造一流营商环境,推动政务公开工作作为重中之重。为营造"人人关心营商环境、人人维护营商环境"的舆论氛围,今年3月以来,市委常委、常务副市长