基于麦克风阵列的声源定位技术的研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:acy333
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
麦克风阵列已广泛应用于音/视频会议、语音识别及增强等领域。声源定位技术是基于麦克风阵列的阵列信号处理的关键技术之一,是语音信号处理领域的一个新的研究热点。本论文针对基于麦克风阵列的声源定位技术展开研究,主要做了以下几方面工作:总结归纳了目前基于麦克风阵列的声源定位技术的几类基本方法的原理及优缺点,并利用声线跟踪法建立了混响环境下的房间脉冲响应模型。由于语音信号及室内声场环境的特殊性,提出了语音信号的预处理,包括预滤波、加窗分帧处理、语音端点检测等。在实际应用中,语音信号有可能位于近场,也可能位于远场,所以分别对近场、远场这两种情况下的声源定位技术进行了研究。在近场的情况下研究了近场可控波束定位算法和基于高阶统计量的近场声源定位算法两类。对于近场可控波束定位算法,在传统定点约束波束形成的基础上,推导出了近场定点波束新的表达式,把基于自校正的稳健的自适应波束形成应用于近场。对于基于高阶统计量的近场声源定位算法,把传统的近场源定位方法和3-D类ESPRIT算法用于研究声源定位问题,都得到了很好的定位效果。在远场的情况下研究了基于子空间的声源定位算法。基于子空间的远场声源定位分为两个步骤:估计语音信号的二维角度和确定语音信号的位置。2-D MUSIC算法能够精确的估计基于任意阵列的语音信号的二维角度——俯仰角和方位角,然后把基于子空间的测向算法和定位算法结合起来,提出了新的基于麦克风阵列的远场定位算法——垂心定位法。该方法与传统的测向交叉定位法相比精度更高,抗噪性更好。
其他文献
20世纪50年代开始,世界各国特别是主要资本主义国家,经济结构发生了重大变化,服务业就业人数及其占国内生产总值的比重持续增加,到80年代,各发达国家服务业占国内生产总值的比重都
从九十年代初期开始,基于内容的多媒体检索一直是计算机领域的研究热点。认知心理学的研究表明人脑对外界事物的认知需要跨越不同感官传递的信息以作出综合的判断,类似地,人们对
供应链服务(Supply Processing Distribution,SPD)信息系统,可与医院信息系统以及企业资源计划供货系统无缝对接,实现药品采购、供应的信息化管理。使用SPD信息系统制定、审
一“把社会成员铸造为个体,这是现代社会的特征”[1],鲍曼的这一论述凝练而准确地概括了“个体”在现代社会的特殊地位和不同寻常的意义。现代社会之所以区别于传统社会,最突
<正> (一)概况我们荊江分洪工程,在毛主席、中央人民政府政务院、中南军政委员会、荆江分洪委员会的领导下,在全国人民特别是武汉市及荊江两岸人民和两湖人民的热烈支援下,三
染料敏化太阳能电池(DSSC电池)是一种新型光电化学太阳能电池,由于它制作工艺简单、成本低和性能稳定,并且对环境无污染,具有良好的开发前景。它是解决世界范围内的能源危机
猪栏是养猪生产中必不可少的基础设施之一。在规模化猪场内,猪的一生无外乎在几个不同阶段的饲养栏中度过,因此猪栏设计的好与坏对猪生活环境的舒适程度起着重要的作用。好的
<正>目的总结儿童炎症性肠病(IBD)的临床特点和治疗经验,以提高对IBD的诊断和治疗水平。方法对1992-2011年复旦大学附属儿科医院住院诊治的56例IBD患儿的临床资料进行回顾性
会议
随着现代化进程和信息技术的高速发展,基于嵌入式系统应用的电子产品已经走进人们的生活,使传统的工业生产和服务方式的技术含量得到很大的提高。随着计算机体系结构理论的完善
随着“互联网+”上升为国家战略,成为时代新浪潮,互联网为传统传媒产业带了生机勃勃发展的新机遇。中国数字经济仍有非常大的空间可以发展,其增长速度快,规模庞大,有着无限的潜能。我国政府以文化强国战略为基点,为将文化传媒产业发展成为国民支柱产业,相继实施了一系列产业扶持政策。随着市场大环境的需求,各传媒企业也开始了一系列的并购、上市,开拓海外市场等。在此背景下,传媒企业的融资状况并没有跟上整个行业的蓬勃