基于语音谐波结构的语音增强方法研究

来源 :北京大学 | 被引量 : 0次 | 上传用户:sonical
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音增强技术用于减小含噪语音中的噪声干扰,提高语音的质量和可懂度,因此在语音通信、语音识别、助听器等领域具有重要的作用。本文针对语音增强中的噪声估计和噪声去除这两方面问题开展了以下研究工作。   针对噪声估计问题,本文对最小统计(Minimum Statistics,MS)噪声估计方法开展了研究。在前人工作基础之上提出了基于目标语音谐波信息动态调整搜索窗长的方法,可有效地解决原方法中采用固定搜索窗长带来噪声估计不准确的问题。实验结果表明改进后的方法相对于原方法在分段信噪比和语音质量感知评估(Perceptual Evaluation of Speech Quality,PESQ)方面都获得了一定程度上的性能提升。   针对噪声去除问题,本文对自适应梳状滤波方法进行了研究,提出了基于信噪比的自适应梳状滤波方法,用于解决原方法在高信噪比时造成语音失真的问题。本文所提出的方法在保证低信噪比时性能不下降的前提下,有效地提高了原方法在高信噪比时的性能。实验结果表明改进后的方法相对于原方法在分段信噪比和语音质量感知评估方面都获得了一定程度上的性能提升。   结合上面两种方法,本文实现了一个语音增强系统。实验结果表明该方法相对于两阶段维纳滤波方法在分段信噪比上平均提高了1.00dB,在语音质量感知评估上平均提高了0.12。
其他文献
Lmaze系统是在P2P文件共享系统Maze基础上重新构造的系统,它的目标是为了解决Maze系统在持续开发过程中遇到的可扩展性问题。在Lmaze开发过程中形成了跨平台的Lunar库,它对网
近些年随着人机接口和智能人机交互技术的发展,智能机器人技术逐渐成熟,尤其是服务型机器人逐渐走向家庭。与此同时,由于机器人的运动路径的不确定性、噪音以及混响的干扰,并
术语抽取是自动知识获取的主要研究课题,在信息抽取、知识表示、信息检索、机器翻译等领域有着广泛的应用。针对中文开展术语抽取相关研究,对中文信息处理的技术和应用发展具
目前交通视频检测技术已成为智能交通系统领域近年来的研究热点,在实际工程中得到越来越多的应用。车辆检测作为交通视频检测的重点和难点所在,占有重要的研究地位和意义。  
现代战争对战场打击效果信息收集的要求迅速提高,弹载侦察相机挂载在导弹上,在导弹攻击目标前夕与弹头分离、拍摄照片实时传回控制中心,比较弹头爆炸前后的图片,能提供有效的战场
本文针对在p2p环境下服务端由普通个人主机充当,无法保障下载者的数据传输体验的问题,提出了基于节点互动的合作下载机制。具体的研究工作如下:   首先,通过对Maze系统运行日
从传统手持设备的存储卡到嵌入式设备的永久存储介质,MMC/SD卡以其体积小、容量大、操作简单的特性被应用在日常生活的方方面面。在北大众志自主设计的系统芯片PKUnity-3上,M
因为互联网的普及与发展,如今已经进入了信息过载的时代,用户没有足够的能力和精力对海量的信息进行鉴别和过滤。个性化推荐技术,能够根据用户的个性化偏好为用户推荐其可能
随着互联网的发展,移动互联网的成熟,用户量不断增大,用户的需求也变得多样化,传统的服务器架构已经不能承受住来自海量用户的并发请求了。本文通过对Nginx服务器进行研究,掌
NAND Flash存储器以其体积小、功耗低、启动快、价格低廉和抗恶劣环境等优点,已被广泛应用于嵌入式领域作为数据存储设备。同时,基于NAND Flash存储技术的固态盘已被看做传统磁