论文部分内容阅读
随着科技的不断进步,研究在灾害现场的环境中能够代替人类工作的机器人具有值得重视的现实意义。而作为重要的组成部分之一的听觉系统,也越来越受到重视。语音识别和声源定位都是语音信号处理的的主要组成部分,同时两者之间又有许多交叉研究部分,具有很高的研究价值。声源定位具有很高的应用度,兼具易实现、成本低等优点,凭借这些优点也使得声源定位的研究成为热点,更加具有良好的应用前景。本论文在国家863计划项目“地面自适应灾害现场信息采集机器人”(项目编号:2012AA041508)的支持下,针对语音识别和声源定位进行了具体的深入研究。本文的主要研究工作包括:1、对语音识别方面进行了研究。对接收到的语音信号进行预处理,通过实验得到了最合适的窗函数,双门限比较法实现了对声音的端点检测,明确了声音的起始结束点。克服了无效的声源定位问题。2、对整个系统的硬件系统和软件系统进行了研究。通过对麦克风选型原则和麦克风阵列设计要求的研究,结合麦克风近场远场模型的划分,选定了DELL长柄炮台麦克风组成四麦克风一字型的麦克风阵列。采用NI公司的USB-9234型号数据采集卡作为麦克风搭载的连接装置与上位机相连。软件部分采用了MATLAB和LabVIEW语言混合编程,充分发挥各自优势。完成了整套系统的软硬件结合。3、对麦克风阵列的声源定位方法进行了研究。对三种声源定位方法都做了比较分析实验,重点分析了广义互相关时延估计算法,并对其主要影响因素加权函数进行了详细比较实验,通过MATLAB对不同加权函数在不同信噪比下对定位结果的影响进行了仿真,最终选择合适的方法,很大程度上提高了时延估计定位算法的精度。4、利用软件编程通过硬件装置进行了实验室环境的实验测试。以图形和数据的形式显示了实验结果,结果表明本实验实现了对实验室环境的声源进行识别和定位。然后对实验结果的误差进行了分析,找出不足之处,并对未来需要进行的研究和改进提出了建议。为以后的研究奠定了基础。