论文部分内容阅读
鉴于救援机器人在减灾和救援所发挥的巨大作用,救援机器人将成为社会基础设施中重要组成部分。救援机器人工作效率的高低很大程度决定于其智能程度的高低,要提高其智能程度,必须提高其感知外部世界的能力。现在对救援机器人的研究主要集中在其生存能力、运动能力和作业能力等方面,而对其感知能力的研究相对较少。本文紧密结合课题背景需求,针对机器人平台计算资源有限的问题,以提高救援机器人的感知能力为主要目标,对救援机器人仿生感知关键技术的有关方面做了较为深入的研究。本文的研究工作主要有以下几个方面:(1)为解决灾难环境中幸存者求救声的检测问题,将求救声音分为语音求救声和利用工具进行击打所发出的类周性敲击声分别处理,研究了对应的检测算法。对于语音求救声音,研究了基于自适应子带谱均方差的语音检测方法。利用语音在频谱上的统计特征,提出以谱均方差作为语音的检测特征,并从理论上证明了谱均方差对噪声的鲁棒性。进一步地,将多子带分析技术与谱均方差相结合,形成子带功率谱,有效地降低了噪声对单个谐波能量的污染。针对类周性的敲击求救声音,结合人的生理特征,分析了敲击在时间上的统计特性,研究了基于最大值截波的检测方法。该算法充分注意了敲击的类周期性、类周期时长的统计特性、呼救的时长性、算法的简洁性和自应性。最后用实验证了算法的有效性。(2)为解决救援机器人声源定向问题,研究了基于时延的声源定向方法。首先,为了缓解机器人计算资源紧张的问题,在对传统的快速互相关时延估计的深入分析基础上,结合声源定向中时延估计的特殊性,对传统的快速互相关时延估计方法进行了改进,降低了时延估计的复杂度;然后,为解决机器人噪声对时延估的影响,在广义互相关时延估计的框架下,基于谱减法的原理,研究了一种新的频域预加权函数,解决了时延估计中相关噪声干扰的问题,提高了时延估计精度;最后,通过增加麦克风和对时延估计值进行筛选的方法,对基于双耳模型的声源定位方法进行了改进,使得声源方位角的估计值更为稳定和准确。实验表明方法行之有效。(3)为解决救援机器人在某些情况下需要对特定人进行识别的问题,如劫持人质活动中对犯罪分子的身份识别问题,本文研究了基于核空间邻域保持鉴别嵌入的两种人脸识别方法。两种识别方法都是基于邻域保持鉴别嵌入的基本原理,针对数据的高阶非线性,引入核映射的方法,将低维线性不可分数据映射到高维空间中,使得数据在高维空间中线性可分。两种方法分别对核空间的基向量增加正交约束和不相关约束,由于消除了向量空间中的冗余信息,使数据的维数降低,降低了算法的复杂度,提高了算法的鉴别能力。(4)研究了一种基于仿生感知的救援机器人多模式导航方法,该方法可以根据机器人所处的状态,利用多种感知信息实现对机器人的导航,较为迅速的发现幸存者。特别地,对机器人利用声音线索进行导航的方式进行深入分析,提出了基于累积统计的声源方向数据处理方法,该方法充分考虑了机器人的移动性特点,将由声源定向模块给出的相对机器人的声源方向,转换为物理世界中的绝对坐标,解决了机器人转动过程中历史声源方向数据失效的问题,然后,对声源方向进行累计统计的基础上,输出声源方向以驱动机器人,解决了由于声音定向的偶然错误导致机器人在运动过程方向容易抖动的问题。最后,在构建的非结构仿灾难环境中,对救援机器人进行了集成实验,实验验证基于仿生感知的救援机器人多模式导航方法的有效性。