基于信号稀疏特性的多声源定位及分离技术研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户：dfg4g4354yh

【摘要】

：

空间声特征提取和声场重建是三维音频信号处理的关键技术,旨在构建具有三维空间听觉感受的声音场景。现有三维音频处理技术通常对声音场景中的每个声源对象进行独立记录、处

【作者】

：

孙俊岱

【出处】

：

北京工业大学

【发表日期】

：

2018年01期

【关键词】

：

声源定位声源分离声源计数声场麦克风稀疏性

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

空间声特征提取和声场重建是三维音频信号处理的关键技术,旨在构建具有三维空间听觉感受的声音场景。现有三维音频处理技术通常对声音场景中的每个声源对象进行独立记录、处理。而在实际三维音频信号处理过程中,在原始声音场景中只能获得多个声源的混合录制信号,这使得现有技术不便于在实时处理场景中应用。因此,研究精确的定位和分离方法从混合录制信号中提取源信号和对应的空间信息显得尤为重要。针对上述问题,本文基于信号稀疏性分析开展研究工作,旨在研究复杂声学条件中的多声源定位和分离方法。为了便于实际应用,本文方法专注于研究声源数量大于麦克风数量情况下多声源定位及分离的通用方法。论文的研究工作包括以下几个方面:第一,提出了一种基于单声源区域检测的多声源定位与计数方法。本文通过对语音信号的弱稀疏性进行统计分析,得到一个更广义的稀疏性的假设,并通过实验验证了多声源发声时“单声源”区域的存在性。基于此,本文提出了一个基于“单声源”区域检测的多声源定位方法,该方法可以通过波达方向估计的归一化直方图结合峰值搜索同时估计出原始声音场景中声源的数量及对应的波达方向。实验结果表明,与现有技术相比,所提方法具有更高的估计精度。第二,提出了一种基于单声源点检测的多声源定位方法。首先,本文给出了一个“DOA收敛”假设,即,如果某个时频区域内的大部分的时频点只来源于一个声源—这些对应的时频点定义为单声源时频点,则该区域相应的DOA估计值会相对集中,并且具有较大的密度。随后本文通过统计分析验证了这一假设的合理性。基于该假设,本文将单声源点的检测问题转化为一个聚类问题,并实现了基于K-均值和基于密度的空间聚类的单声源点检测方法。最终提出了基于单声源点检测的多声源定位方法。实验结果表明,所提方法的定位精度优于基于单源区检测的定位方法。第三,提出了一个联合稀疏成分和非稀疏成分恢复的多声源分离方法,旨在从声场麦克风录制信号中恢复多个声源信号。本文将麦克风录制信号的频谱分为两类:一类是稀疏成分,对应于只有一个语音源活跃的时频成分;另一类为非稀疏成分,即剩余对应多个声源活跃的时频成分。对于稀疏成分的分离,本文提出了一个基于麦克风录制信号间相关系数的动态阈值分离方法。对于非稀疏成分,本文以分离得到的稀疏成分作为指导结合“局部区域稳定性”进行恢复。最后通过对稀疏成分和非稀疏成分的合成,得到最终的分离信号。客观和主观实验结果表明,与现有的声源分离方法相比,该方法取得了更好的语音感知质量。

其他文献

经期保健六要诀

<正> 月经虽属正常的生理现象,但由于经期阴道不断流血,身体气血相对虚弱,抵抗力较差,易受外界和内在不良因素的影响,如不注意经期卫生,便会引起月经病或其它妇科疾病经期保

期刊

经期保健气血运行经期延长

与爱同行

<正>在山东淄博市老年大学,舞蹈班的周勇堪称模范学员:同学们夸她负责任,老师赞她跳得美。周勇曾在很多舞蹈中担任领舞,这不仅因为她的舞姿优美、舒展流畅,

期刊

老年大学

基于双目视觉的行人检测算法研究及其FPGA实现

对三维环境的实时感知与识别是机器人研究领域的关键技术。而对行人的检测与三维位置感知技术,可以帮助机器人更好、更安全的服务人类,具有很大的研究价值。相比其它深度传感

学位

实时图像处理嵌入式视觉双目视觉FPGA行人检测

地方政府网站信息公开工作的评价研究

随着电子政务的发展,地方政府网站作为了政府信息公开的最主要的一个渠道。也成为了衡量地方政府工作是否透明的重要指标。政府信息公开是对行政进行的透明度进行提高的一种

学位

信息公开政府网站评价研究

论中职物流专业人才需求与教学改革

近年来,随着现代物流的逐步升温,全国各地高校、高职院校以及中职学校纷纷开设了物流专业,但是许多中职学校物流专业毕业生从事物流及相关专业的比例较低。通过对重庆市某中

期刊

中职物流人才需求教学改革

浅议火电施工企业项目成本管理

火电施工企业存在项目管理者成本意识淡薄、员工素质参差不齐、成本分析流于形式等问题,可从强化成本观念、提高员工素质,推行项目成本管理机制,加强成本预算动态分析、控制

期刊

施工企业成本管理措施

审计质量与审计市场集中度波动关系研究

文章在对以非标准意见比率表示的审计质量与事务所收入表示的集中度进行Hodrick-Prescott滤波的基础上,建立了相关计量模型,研究两者之间波动相关性及制度对审计意见的影响。

期刊

审计质量非标准意见比率事务所收入市场集中度

无水保活条件下不同温度对鲟鱼生理生化指标的影响

为研究无水保活条件下不同温度对鲟鱼生理生化指标的影响,测定了鲟鱼在5、2、-1℃无水保活温度下0、12、24 h时皮质醇（COR）、谷丙转氨酶（ALT）、碱性磷酸酶（ALP）、总胆红素（TBIL）、肌

期刊

鲟鱼无水保活温度

初中生化学实验观察现状的探查

观察是人们通过感觉器官或借助一定的科学仪器,有目的、有计划地对外界事物或人进行感知和描述,从而获得直接经验的感知活动。实验观察是观察共同体依据观察目的,采取恰当的观察规则和工具,对对象进行观察和表征观察结果的活动过程。化学实验观察作为化学实验活动实施阶段中的一个重要环节,在化学实验中具有独特的地位,对于中学生科学素养的培养也具有重要意义。但资料显示,化学教育领域有关实验观察内涵和要素的研究不够深入

学位

初中生实验观察现状探查

抗生素是把双刃剑

<正>与细菌耐药性迅速蔓延的势头相比,近10年来,全球新研制出的抗生素仅有两种。当细菌"百炼成钢"时,我们还有什么武器?耐药性与日俱增在北京协和医院感染科门诊室,一位患者

期刊

抗生素治疗细菌感染合理用药监测系统双刃剑

基于信号稀疏特性的多声源定位及分离技术研究

与本文相关的学术论文