混叠语音的计算听觉场景分析研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:luoshibo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算听觉场景分析试图利用计算机技术通过对人类听觉心理过程及听觉生理过程的模拟,使计算机具备象人耳那样处理声音(分离并解释)的能力,这是一项新兴的边缘研究课题。本论文对混叠语音的场景分析问题进行了研究,建立了一个初步完整的混叠语音听觉场景分析系统,并完成了有一定创新性的工作: 1、针对以往混叠语音听觉场景分析系统存在的分离效果差,过程复杂,计算量大等问题,借鉴MBE(Multi-Band Excitation)技术,提出了双基频多带激励场景分析模型(Double Pitch Multi Band Excitation Scene Analysis Model,DP-MBE SAM)及基于DP-MBE SAM的混叠浊音听觉场景分析系统。由于模型以基频轨迹为线索,同时考虑混叠语音参数的提取,而不是以固定频宽的滤波器阵列机械地将混叠信号分解,所以,DP-MBE SAM模型更适合语音信号的频率特性变化的要求,混叠语音的分离具有更接近人类听觉系统的鲁棒性和灵活性,我们所提出的系统不同于传统的语音听觉场景分析系统,可实现混叠语音信号的有效分离。由于模型中混叠信号的参数是对应基频而定,参数确定时就对应着分为两组,从而节省了传统语音听觉场景分析系统复杂的分组环节,大大降低了系统的计算量。另外,DP-MBE SAM机理可以推广到多于两个语音信号的场景分析。且代表语音的参数作为一组数字化信息更适合作为联系底层听觉系统和高层大脑的中层表达的要求。实验结果表明了我们的系统能有效分离基频不同的混叠语音信号。 2、针对基于DP-MBE SAM的混叠浊音听觉场景分析系统存在的问题,提出了改进的基于DP-MBE SAM的混叠语音听觉场景分析系统,包括两部分内容,第一,针对DP-MBE SAM在实际的应用中存在的求解矩阵奇异引起的参数模糊及混叠信号谐波频率相同引起的参数模糊问题,借鉴多帧内插方法,提出了改进的DP-MBE SAM;第二,在基于DP-MBE SAM的混叠浊音听觉场景分析系统加入清音分离环节,将系统的应用从浊音推广到含有清浊音的语音信号。将改进系统用于两个混叠语音信号的场景分析,实验结果表明了改进系统的有效性。 3、针对Meddis建立的基于听觉心理生理的混叠语音基频提取算法存在的问题,提出了基于听觉心理生理的混叠语音基频提取新算法,由于采取了闭环自适应提取模块及相应的潜在基频确定方法,提高了搜索潜在基频的鲁棒性,又利用潜在基频重新划分频带;有效提高了基频提取精度。实验结果证实了混叠语音基频提取新算法具有听觉场景分析所需要的较好的鲁棒性和柔韧性,所提取的基频可作为听觉场景分析系统的声音归类线索。
其他文献
[摘要] 云南是一个多民族地区,丰富的民族文化和生物多样性并存,发掘和弘扬民族传统文化中生物多样性保护的内涵,对云南各民族精神文明和生态文明建设具有积极的意义。  [关键词] 云南民族文化 生物多样性保护    生物多样性是所有生物种类、种内遗传变异和它们的生存环境的总称,包括所有不同种类的植物、动物和微生物,以及它们所拥有的基因,它们与生存环境所组成的生态系统。云南省是我国少数民族数量最多的一个
介绍了云南澜沧江功果桥水电站2×1600kN固定卷扬式启闭机的用途及性能参数。详细阐述了固卷的主要部件的设计过程,该启闭机运行稳定,可为同类固卷设计提供借鉴。 The purpo
光与物质的相互作用的研究不仅有重要的理论意义,而且有广泛的应用价值,在通信和信息处理领域也不例外。本文较详细而全面的研究了不同实现方法下全光波长变换。首先研究了光
本文通过对历届奥运会的经济价值进行了回顾,并从资金筹措、场馆建设、产业结构调整等方面分析对北京避免奥运会后可能出现的经济“低谷效应”,为其实现可持续发展提出了建议
投资者是证券市场的基石,保护其合法权益是证券市场稳定和繁荣的基础。然而由于我国证券市场的相关制度还不完善,使得股东权益尤其是中小股东权益屡受侵犯。本文正是通过阐述
为了解杭州市规模以上重点企业用工情况和企业内部人力资源管理现状,以及企业在面临转型升级的大背景下,企业用工出现的新情况、新变化,2016年5月~8月,笔者深入到杭州市某重
VDR雷达图像在采集、传输、存储等过程中存在以下三个问题:(1)图像在采集、数字化和传输过程中常受到各种噪声的干扰,不利于对图像进行分析、观察和压缩;(2)存储空间有限,图
血是生命的源泉,当今医学造血功能还不够发达,临床使用血液替代只能从一个健康的身体采集,采集血液在健康人群是一个关键的护理工作。献血过程中的不良反应是捐血经验少或献
在高速光纤通信系统中,随时间随机变化的偏振模色散(PMD)是限制系统比特速率和传输距离的重要因素之一。作为当前PMD问题唯一经济的解决方式,PMD动态补偿器的市场前景极为广
近几来国际零售业巨头的加入,加剧了该行业的竞争。越来越多的商家发现自有品牌成了一个新的经济增长点。特别是超市对自有品牌的开发越来越重视,且取得了一定的成果。但目前