基于麦克风阵列的说话人定位技术研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:szlucky
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于麦克风阵列的说话人定位技术是近年来新兴的一个研究方向。目前还存在着许多问题,其中关键的难题是如何在噪声和混响同时存在的环境下进行说话人定位。  本文以基于到达时间差(TDOA)的定位技术为基础,对噪声和混响同时存在的环境下基于麦克风阵列的说话人定位方法进行了系统地研究,主要做了以下工作:  1.研究分析了广义互相关时延估计法、LMS自适应时延估计法、基于小波变换的时延估计法和基于四阶累积量的时延估计法,并用MATLAB进行了算法仿真。  2.提出了谱相减结合多通道互相关系数的时延估计算法。实验结果表明该算法的性能优于一般的多通道互相关算法。  3.考虑到谱相减结合多通道互相关系数的时延估计算法需要多个麦克风来估计一个时延,不利于实际应用。本文将产生语音的激励源特征应用到时延估计,提出了基于声门脉冲的自适应时延估计算法。并通过实验验证了该方法对噪声和混响均具有很好的鲁棒性。  4.研究分析了线性插值法和线性修正球形插值法等定位方法,在此基础上提出了一种平面四元T形阵列几何定位法,并推导了其定位方程。  5.提出了一个基于声门脉冲的自适应时延估计结合平面T形麦克风阵列几何定位方法的说话人定位系统,并分别在模拟房间环境下和实际房间环境下进行了相应的实验,取得了良好的定位效果。
其他文献
任建业,1958年生于曲阜,1982年毕业于曲师大美术系,获文学学士学位,曾于母校任教十余载。现为中国美协会员、中国书协会员、国家一级美术师、国务国宾礼特供艺术家、美国芝加哥大学客座教授、中国孔子书画院院长。  数十年来,书画兼修,书画堪称真、草、隶、篆四体皆能,路数属传统一路,擅长行草和秦汉隶书,结体严谨,用笔松动流畅,扎实丰厚,别具底蕴和风采。草隶已成自家风貌,行、草师法二王如行云流水、自鸣天
1998年,Huang等人提出:在对信号进行Hilbert变换之前,先把信号做一个经验模态分解(empirical mode decomposition,EMD),基于Hilbert变换的信号处理方法,能够有效提取出非线性、非平
随着计算机应用系统的飞速发展,应用环境、实现流程和组成模块日趋复杂,用于记录、分析和管理应用系统运行状态的日志功能越发重要。在分析了国际上几个主流日志系统的基础上,本
高帧频、高分辨率图像传感器(如CCD、CMOS等)在目标探测、目标测量等多个领域得到越来越广泛的应用,相机提供高清晰图像的同时也产生了高速、海量的图像数据。必须开发具有更
随着社会经济的快速发展,人们对无线定位服务精度的要求越来越高。与此同时逐渐成熟的超宽带(UWB)技术得到了人们的关注,基带窄脉冲方式超宽带系统具有更好的定位性能;在定位
信息化是实现ITS各项功能的核心或关键,构建开放的ITS信息平台是ITS进行信息交互整合的基础技术设施。在信息技术高速发达和迅猛发展的今天,由于ITS信息系统多模式、多元化业务
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
随着通信网络的发展,网络安全需求也趋于多样化,能够防御来自多技术层面安全威胁的网络设备显得越来越重要。集成了虚拟专用网(Virtual Private Network,VPN)的网络防火墙是
微小RNA(mi RNA)是近年来发现的在进化上高度保守的一种只有约为21~25个核苷酸(nt)的内源性非编码小RNA,它通过与靶m RNA的3’-UTR互补结合,使靶m RNA被剪切或转录抑制,从而
限于键盘的面积,常用的拼音和五笔汉字输入在嵌入式系统受到很大影响,手写体输入是解决这个困难最好的方法之一。但嵌入式系统的硬件资源有限,因此手写体汉字识别应考虑到嵌