基于麦克风阵列的室内语音定位算法研究

被引量 : 12次 | 上传用户:acecar
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体技术的进一步发展,阵列信号处理技术已经被广泛应用于各领域。基于麦克风阵列的声源定位技术是阵列信号处理中的关键技术之一,是语音信号处理领域一个新的研究热点。本论文运用麦克风阵列技术对室内语音定位展开研究,主要做了以下几个方面的工作:1、对基于麦克风阵列的声源定位技术的研究背景、研究现状、研究意义、研究难点和影响因素进行深入研究,并给出语音信号预处理的方法。2、在分析了传统的的定位算法存在定位精度低、实时性差等问题的基础上,提出了一种基于PHAT的三维七元麦克风阵列声源定位算法。通过到达时差方法计算声源的方位角、俯仰角、距离,最后通过几何方法结合角度与距离计算声源位置,并与传统的四元十字形阵列进行对比。3、针对波达方向估计中,传统互功率谱相位的声源定位方位被存在估计准确性差、方位模糊的问题,提出了一种基于圆形集成互功率谱的声源定位算法,在该算法中,通过在互功率谱中引入相位旋转因子,得到圆形集成互功率谱,结合十二元麦克风阵列,进行声源方位估计,能有效提高方位估计性能。4、针对现有的多声源定位方法中定位结果不准确、稳定性不好等问题,提出了一种基于一致聚焦变换最小二乘法的麦克风阵列双声源定位算法,运用基于一致聚焦变换最小二乘法的宽带信号MUSIC算法,对室内近场双声源进行定位。定义中心频率点,然后通过一致聚焦变换,结合最小二乘法,求得每个中心频率点所对应的信号空间谱,利用频率点均值和时间快拍估计的方法求得信号空间谱平均估计值,进而估计求得声源方位,提高了定位的精确性。5、分析前面提出的声源定位算法,并对第四、五章的算法进行语音定位系统实现。实测实验结果表明,本文提出的语音定位算法定位精度高,能满足实际定位需求。最后,总结本文所做工作,对可能的改进之处做出展望。
其他文献
近年来我国城市化进程不断加快,城市公共空间设计受到了各界的广泛关注.但公共空间的嗅觉设计仍未能得到应有的重视,相关研究的缺乏便能够证明这一认知.基于此,文章将简单分
体育强国是时下中国体育战略之一,大学体育的成功与失败关乎战略目标的实现与否.大学体育课在发展过程中业已显现诸多诟病,难于适应时代与个体发展的需要.本文通过文献资料法、逻
任何一个商业企业不管他是多么知名的品牌,不管它的商品多么的物美价廉,它的项目选址必须准确。好的商业项目位置能够形成优秀的商圈,而商圈好坏又是企业成功的关键因素之一
本论文拟从严歌苓小说中的边缘人生入手,结合严歌苓的生存环境,自身经历等方面对其笔下边缘人物进行诠释,继而升华到对严氏笔下人物人性的善良与丑恶的探讨。接着从东西方文
简要介绍了目前汽车轻量化技术的背景和意义,阐述了油罐车罐体实施轻量化的基本要求和途径,最后通过实例说明油罐车罐体轻量化研究是可行的。
目前,对已有建筑结构的鉴定、维修、加固和改造是国际上普遍关注的问题。随着我国经济建设的飞速发展,我国建筑业在经历了大规模的建设后也开始迈向新建与维修并重时期,建筑
研究基于数字高稳定航拍系统,实现在相对噪声环境不佳的外界环境下实现高质量拍摄有着重要研究意义。本文在总体设计的角度出发,着重研究航拍时产生噪声原因并通过数学计算方
流行性出血热又称肾综合征出血热,是由汉坦病毒引起的以发热、出血和肾脏损害为3大主症,并有发热、低血压、少尿、多尿及恢复期5期临床经过的急性传染病。其基本病变是全身毛细
科学技术的发展促使以网络技术为主要载体的生活已经渗透到生活中的各个方面,对媒介的生态环境产生影响,传统媒介受到极大的冲击,各类型媒介的融合已经成为发展的必然趋势。
默顿的社会失范理论是一种从社会学的角度解释犯罪的理论。它是默顿在继承了前人的失范论的基础上发展而来的,在美国犯罪学史上产生过重要的影响。默顿认为犯罪有着深刻的社