基于麦克风阵列的仿人智能机器人声源定位技术的研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:a36020a
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
声源定位是许多领域里的一个基本问题。声源定位技术的研究一直是个研究热点,涉及到很多技术领域,如声学、信号检测、数字信号处理等,有着广阔的应用前景。目前,该技术在仿人智能机器人上的应用还不是很多。而其作为一种重要的人机交互方式,能够与视觉交互完美结合,弥补其不足。通过对各种声源定位技术的研究和比较,基于到达时延差(TDOA,Timedelay of arrival)的声源定位技术比较适用。该技术方法的原理不是很复杂,无需很大的计算量,而且实现这种技术的困难较小。对这种技术的研究目前也比较成熟,有着大量的应用。因而对于本课题的研究而言,是一种不错的选择。使用TDOA技术,需要完成两个阶段的工作:前一阶段运用时延估计算法估算出声源信号到达各个麦克风之间的TDOA值,即时间差;第二阶段根据得到的TDOA值,结合阵列几何结构关系和空间位置关系,使用空间定位方法来估算声源的位置。能否得到高精度的TDOA值对整个过程的正确完成相当重要。传统的GCC算法就是该技术中的一种比较经典的方法。该方法能够快速有效的对声源进行定位,但是定位精度和准确度不是很高,且易受环境和噪声的影响。针对传统GCC时延估计算法的不足之处,本文对其做出一些改进,提高了时延估计的精度,对GCC时延估计算法的改进是本文的关键和核心。在本课题中,麦克风阵列采用了二维平面结构。结合相应的时延估计算法和空间定位方法,最后设计和实现了声源定位系统。用四个麦克风模块组成麦克风阵列,配以数据采集卡和PC,完成系统的构建,之后在PC上实现声源定位算法,完成系统软件程序,最后将系统安装在机器人上。系统实现后,进行了大量的实验,对系统进行测试和验证。实验结果验证了在仿人智能机器人上实现声源定位系统的可行性,该系统能达到一定的声源定位效果并能根据定位结果控制机器人的动作,从而实现友好的人机交互。
其他文献
Web是一个巨大的、广泛分布的全球化信息仓库,它提供了新闻、财经、广告、商务、文化、教育等多方面的信息服务。如何有效地帮助用户从Web上发现他们感兴趣的资源,已经成为一个
伴随着自然语言处理技术的蓬勃发展和英语教学方式的多元化需求,计算机技术与英语教学的结合越来越密切,教学辅助软件如雨后春笋般层出不穷。由于语言体系的差异,英语和汉语
本文首先回顾了网络管理技术的发展历程,介绍课题相关的研究概况,对SNMP网络管理的相关内容做了阐述,引入移动代理技术,对其概念、原理、特点和标准化等进行了详细介绍,并考察分析
互联网络的普遍应用使得人们希望能够以一种更加灵活的方式接入到Internet 中去,而不受时空的限制。传统IP 技术不能满足这种需求,而移动IP 技术正是适应这种需求而产生的。
数据挖掘是近年来发展起来的新技术,通过数据挖掘,人们可以将知识发现的研究成果应用于实际数据处理中,为科学决策提供支持.目前数据挖掘逐渐发展成为一个多学科领域,涉及到
本文在分析了对面向对象软件进行测试所面临的问题和已存在的测试策略、方法的基础上,基于UML模型进行面向对象的软件测试,并介绍了一个作者参与实现的面向对象软件测试工具—
自从1998 年电力系统改革以来,我国电力系统逐渐进入一个开放的市场。在开放的电力市场中,企业必须更加深入地了解客户才能在市场竞争中获胜。企业深入了解客户的一个有效途径是数据挖掘。本文在深入研究了粗集理论之后提出了一种基于最高可信度的补齐算法(MCC),并用实例证明了其有效性。提出了一种新的基于信息熵的属性约简算法(IEAR),并用UCI 数据证明了该算法能有效减少属性约简后的属性个数。在分析了粗
随着当代计算机科学与技术的高速发展,计算机视觉及其相关领域的研究越来越热门。视频中的人体动作识别作为计算机视觉领域的一个重要分支,也越来越引起研究人员的重视。虽然现
GSM(Global System for Mobile Communication)是全球移动通信系统的简称。在GSM中,唯一不需建立端到端通道的业务就是短消息业务(SMS),在移动设备处于点与点通信状态下,还能
本文主要针对12导联的心电信号,提出了一个基于半监督判别分析(Semi-supervised DiscriminantAnalysis, SDA)的心电分类方法。多导联心电判别分析研究主要包括对心电信号预处理,