基于语谱图的语音变速不变调算法的研究与应用

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:ljs19841215
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音的变速不变调处理,是目前十分流行的一种语音信号处理技术,即通过改变单位时间内输出的语音信息量,达到改变语速的要求。人们有时希望能加快或减慢语音的播放速度,尤其是减慢语速,对于外语学习、报告记录、语音研究和公安侦察等方面有很大的帮助。 目前,变速不变调主要应用于外语学习和音乐播放方面,这两个应用场合中的语音基本上都是在背景噪音很小甚至没有的语音环境里录制的,语音的信噪比都很高。但是在报告记录、公安侦察等其他现实应用场合中,语音环境中通常都存在背景噪音,甚至语音环境非常恶劣,目前的变速不变调处理技术并不能很好地应用于这些场合,为此,本文通过对变速不变调算法进行详细、系统的理论研究,提出了一种能够处理带噪语音的变速不变调算法,满足了现实应用场合中的需要。根据这个算法的流程,本文作了以下一些方面的研究工作: ①对浊音段端点检测算法进行了深入的研究,在分析了各种常见的浊音段端点检测算法的基础上,提出一种新的基于语谱图的浊音段端点检测算法。实验结果表明,该算法在保证端点检测准确性的同时,具有明显优于其他常用算法的很强的抗噪能力,能够使浊音段端点检测算法应用于较低信噪比的恶劣语音环境下,扩展了浊音段端点检测算法的应用范围。 ②对基音检测算法进行了深入的研究,在分析了各种常见的基音检测算法的基础上,提出一种新的基于语谱图的基音检测算法。实验结果表明,该算法在准确描绘出基音轨迹曲线的同时,具有很强的抗噪能力,在中高噪音环境下也能够很好地找出语音波形的基音轨迹。 ③对语音变速不变调算法进行详细、系统的理论研究,把前面提出的浊音段端点检测算法和基音检测算法应用于变速不变调算法中,并分别采用基音波形叠加拉伸和基音波形复制压缩的方法来实现变快语音的不变调处理和变慢语音的不变调处理,并对不同速度的变速语音采用不同的方案进行不变调处理,实验结果表明,对0.25倍速到5倍速的变速语音,该方法不仅能很好地实现语音的变速不变调处理,且还在抗噪能力方面取得了令人满意的结果,能够在中高噪音环境下很好地进行音调的还原。
其他文献
近年来,将内容缓存到网络边缘侧逐步成为移动网络中一种减少系统传输代价和提升用户体验的有效方式。随着移动网络的不断发展,我们可以利用网络架构优势更进一步地提升移动网络
说话人语音转换技术是语音信号处理领域中的前沿分支。它通过对一个说话人(源说话人)的语音信号进行修改,在保留其所表达的语义信息的前提下,使修改后的语音信号听起来像另外一
本论文关于嵌入式多媒体系统中的Linux及相关问题的研究。本论文首先阐述嵌入式系统的概念和发展状况,多媒体应用的发展状况以及两者的结合情况。接着,本论文详细论述嵌入式操
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
网络拥塞控制是网络服务质量(QoS)的重要研究课题,尤其是Internet迅速发展的今天,网络拥塞控制在网络应用中的作用越来越重要。网络拥塞控制算法的实现是多方面的,在端到端网络
本文通过对荣华二采区10
期刊
谈到腾模的绘画,藏獒是一个绕不过的主题。历史上有“九犬成一獒”的说法,被看作西藏人的护卫犬和保护神,是世界上不怕野兽的犬种之一,故藏獒又有“东方神狗”之称。他笔下的
本文通过对荣华二采区10
期刊
本文通过对荣华二采区10
期刊
信息的数字化带来了数据量的爆炸性增长,这使信息的存储和传输变得极为困难,所以,必须对视频和音频信息进行压缩。本文回顾了多媒体数据压缩变化技术的发展,详细介绍了常用的多媒