基于传声器阵列的声源定位算法研究

来源 :广州大学 | 被引量 : 3次 | 上传用户:galen621
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于传声器阵列的声源定位近年来被广泛的应用在生活与生产中,在视频电话会议、智能家居和噪声检测系统等多个领域受到广泛地关注与研究。然而,真实环境中的噪声和混响问题、算法实时性问题和传声器的数量依旧影响声源定位算法的效果,特别在混响环境下,如何利用较少数量的传声器进行准确快速地声源定位仍然是目前研究的热点和难点。基于上述问题,论文首先设计一种改进的语音端点检测算法,能更准确地从接收信号中提取语音信号,再设计一种改进的的倒谱滤波时延估计技术对语音信号进行时延估计,最后利用十字形传声器阵列结合时延估计进行声源定位。论文的具体工作体现如以下三点:1.谱熵法端点检测对信噪比不敏感,受信号能量影响小,然而当噪声与语音信号的谱分布相近时估计性能急促下降,为此设计出一种基于谱加权的谱熵端点检测算法。算法中通过引入一种频谱加权技术,对接收信号的频谱进行不同程度的白化,以达到改变噪声与语音信号谱熵值的效果,能通过检测谱熵值大小区分噪声信号与语音信号。经实验仿真证明,相比于谱熵法,谱加权谱熵法端点检测具有更好的估计性能,在白噪声下,两者都具有较好的检测性能;在其他类型噪声下,在信噪比为0dB-5dB时,正确率提升10%-50%;信噪比在5dB以上时,检测正确率提升30%左右。2.倒谱预滤波时延估计技术能有效的抑制接收信号中的混响成分,但由于消除了最小相位分量,使全通分量信号在幅度谱上进行了白化,未能有效利用信号幅度谱中携带的有效信息,使估计的峰值降低。为此论文设计一种改进的时延估计技术,在得到全通信号的基础上,加入信号幅度谱,并结合改进的相位加权广义互相关函数法进行时延估计。最后在三种不同混响时间的环境下进行仿真,进一步验证了本文算法比广义互相关时延估计算法具有更好的估计性能。3.一维线性传声器阵列具有结构简单、数学建模容易,所需传声器数量少的优点,但定位过程中会产生定位模糊问题,无法确定正确位置。为此论文设计一种具有四个传声器的十字形阵列,利用两对传声器的时延消除定位模糊问题,并结合波达角估计模型和时延进行波达角估计。最后在真实环境下设计共60组声源定位实验进行算法验证,进一步验证了本文算法具有更准确的估计性能。
其他文献
本研究调查了中国学习者在英语习得中零主语和零宾语的习失情况。发现如下:1)学习者对英语零主语和零宾语句子的判断都随着英语水平的提高而增强,且高级学习者既能习失零主语
英语中心语T拥有很强的不可解的主格特征,要求主语必须显性出现,即主语只有一个参数值[-Null Subject];而汉语中心语T不可解的主格特征是弱特征,主语既可以显性出现,也可以隐
目的:系统评价术前与术后放疗在不同部位可切除软组织肉瘤(STS)治疗中的作用。方法:计算机进行系统的文献检索,调查研究术前与术后放疗对STS术后局部复发(LR)、无进展生存(PF
空论元是第二语言习得研究中的一个重要语言现象,它包括空主语和空宾语。由于汉语是话题突出型语言,句子中允许出现空主语和空宾语;而英语是主语突出型语言,在句法结构中主语
针对一类带有扰动的非线性系统,在它的标称系统的自由动态是一致渐近稳定和它的标称系统存在ISS—Lyapunov函数条件下,运用Lyapunov方法,得出该类系统是小信号,L∞稳定和L∞稳定
国际移民问题已成为全球性问题,移民潮流的迅速发展是经济全球化过程中生产要素国际化的具体体现。当前西方国家是国际移民的主要流向,其对移民政策的调控主要集中在家庭团圆原
目的对广州地区男性不育患者的精液进行常规分析,了解广州地区男性不育患者精液质量的现状。方法按照《世界卫生组织人类精液检查与处理实验室手册》(第5版)的标准,应用西班
<正>目的:分析峡部子宫内膜癌的临床病理特点及预后相关因素。方法:回顾性分析自1980年1月- 2005年12月收治的经手术治疗的内膜癌患者临床资料,按肿瘤部位将其分为峡部癌组(U
会议
滑膜肉瘤发病率较低,占软组织恶性肿瘤约8%~10%,主要分布在四肢及躯干关节软组织附近[1],头颈部滑膜肉瘤约占总滑膜肉瘤发病的5.6%[2]。近年鲜有头颈部滑膜肉瘤相关报告,该类
目的总结多学科联合诊治头颈部非横纹肌肉瘤软组织肉瘤患儿的临床特征及近期疗效,以指导临床诊疗。方法将2012年10月至2018年2月期间本中心收治的头颈部非横纹肌肉瘤软组织肉