人机交互中的声源定位与增强方法研究

被引量 : 0次 | 上传用户:liongliong431
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音是人机交互中最自然的方式,既不需要接触或佩戴数据设备,也不存在视觉盲点。在基于语音的人机交互系统中,由于噪声的影响,特别是交互环境中其他无关说话人语音的干扰,严重降低了交互系统的性能。本文对人机交互系统语音信号信噪比的提高展开研究。交互目标声源的定位是基于麦克风阵列的多通道语音增强法的关键,本文采用基于时延估计的声源定位方法。针对信号时延估计问题,采用先通过适当阈值过滤噪声再做相关处理的方式,提出一种基于阈值判决的声达时延差估计方法。仿真实验表明该方法优于广义互相关法,为进一步目标声源的空间定位提供更加准确的时延参数。为更好地模拟实际声源所在的空间场景,基于麦克风线性均匀阵列,采用双阵列空间三维定位的方法,提出了一种由六个麦克风构成的平行均匀线阵接收模型。结合基于阈值判决的声达时延差估计方法实现目标声源的三维定位。在目标声源的定位基础上,通过波束形成法来增强目标语音。并对固定波束形成法中各通道的权重设置提出改进方案,更好地实现目标语音的增强。本文通过MATLAB对所提出的算法进行了详细地仿真实验,结果表明环境信噪比大于1.5dB时,目标声源的定位精度即可达到98%以上,信噪比达到5dB左右的改善。同时算法使用的麦克风数较少,原理简单、易于硬件实现。
其他文献
网络犯罪案件的侦查存在身份的复杂性、系统的依赖性、技术的对抗性等问题,破案重点在于查明“真实”的犯罪嫌疑人,其核心问题是网络身份和现实身份的同一认定。现已证实,在
同位素被广泛用于环境科学研究中。本文主要介绍了C、S、N、Pb和Hg等同位素在大气环境研究方面的应用和发展。
介绍了河南省铝土矿资源概况和煤下铝勘查开发现状,强调了煤下铝资源对铝工业发展的重要作用。并针对当前煤下铝地质勘查开发中存在的主要问题,提出了找"煤下铝"探索煤铝资源综
最小发车间隔是确定现代有轨电车开行密度和运输能力的参数。现代有轨电车作为一种新型的中低运量的地面快速轨道交通系统,其最小发车间隔的确定与地铁、BRT(快速公交)等其他交
采用国际上通用的非生物学评价方法,研究了不同供锌水平对猪肚菇子实体蛋白质营养价值的影响,以期为猪肚菇栽培技术的改善和完善提供科学依据。结果表明,氨基酸总量以40mg&#1
镁合金的密度一般在1.75-1.90g/cm3,大约是钢的1/4,铝的2/3,是最轻的工程材料。拥有高比强度和比钢度,均要优于钢和铝合金,具有远大的发展前景。但由于镁合金的耐腐蚀性及加工成
碳纤维复合材料是航空航天部件中重要构建材料,复合材料在超高温的工作环境下易被烧蚀氧化,为了防止由此导致的部件失效,因此在复合材料的基体表面涂镀一层碳化硅涂层材料(厚度约
本文采用无压溶渗方法制备Si/Al复合材料,通过光学显微镜、SEM、EDS等分析手段研究基体合金、溶渗工艺及增强体Si颗粒粒径对Si/Al复合材料溶渗组织的影响,探讨溶渗组织的形成机
目前有限责任公司是最常见的企业组织形式,其股东以认缴出资对公司承担有限责任的特点,让它在市场经济中备受欢迎。但是任何事情有利就有弊,它的人合性和封闭性也使得公司僵局往
镁合金凭借密度小、比强度及比刚度高的综合优点,在航空航天、汽车交通等领域具有广阔的应用前景。然而由于镁合金结晶区间宽、热容小、结晶潜热低,采用传统铸造方法获得的镁合