有混响条件下的室内语音定向研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:sswang111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文对室内有混响条件下的语音定向问题进行了系统的研究,从听觉仿真、室内声学、信号处理、语音特征等各个角度较为全面深入地分析研究了影响语音定向及其定位精度的各种问题.该论文主要作了以下有特色的研究工作:1)通过试验证实了混响情况下采用高频分量比采用低频分量的定向识别率要高,进而根据人类听觉对高频分量主要依靠强度信息来定位这一特征,优选了数字波束合成法来完成联合算法中的时延估计.2)初步设计和完成了一个用于语音定向系统研究的硬件系统.该系统配有程控可3维自由转向的摄像头以及和PC进行通讯的USB接口.从而为听觉、视觉联合研究提供了一个理想的硬件平台.3)首次将语音特征的分析运用到室内语音定向中来,并取得了良好的效果;提出了一种新的语音定向方法即联合算法,该算法利用由室内脉冲响应模型得到的回波强度因子,检出受混响影响较小的信号片段,再利用语音处理技术中基于短时能量分析的端点检测、清浊音判别等技术将检出片段中无声片段进行剔除,以获得有效语音片段,最后根据人耳定向基于强度和时间差的特点,选择了数字波束合成时延估计法对有效语音片段进行方位角估计,并利用先截尾后加权算术平均的方法对输出结果进行处理,从而使得在有混响室内条件下的水平方向定位精度接近人耳定位的精度.4)首次探讨了将说话人识别技术用于语音定向的可能性,指出了利用我们提出的联合算法的计算结果作为训练和测试数据,用于完成目前对主要说话人的识别算法所需要的训练和测试过程,在理论和技术上是完全可行的.
其他文献
利用溶胶—凝胶法制得纳米二氧化钛(TiO2)胶体,用红外光谱(IR)、X射线衍射仪(XRD)等对其进行了表征。抗菌试验结果表明,纳米TiO2具有良好的抗菌特性。同时,在不同条件下制备了纳米羟基
根据锂离子及锂离子薄膜电池材料的研究现状及发展趋势,该论文围绕LiMnO这种很有前途的锂离子电池正极材料,以及具有高的离子电导率和较宽电化学窗口的LiAlTi(PO)锂离子固体
这些年,随着移动数码设备的迅猛发展,手机作为一种日渐强大的移动数码设备,正在为人们提供越来越多了服务。这些服务也会涉及大量的用户隐私,从而带来日益严重的安全隐患。为
我们一生中要花三分之一的时间去睡眠,睡眠可以帮助我们存储能量,恢复体力,舒缓压力,也可以巩固记忆。但是随着现代社会人们的生活压力增加,公司加班文化浓厚,严重的缩短了人
医学图象的三维重建与显示是科学计算可视化的一个重要研究领域,本文对医学图象三维重建与显示做了深入的探讨,同时介绍了三维重建的一些常用方法和这一领域的最新发展概况。通
海洋生物附着在船舶和海洋设施的表面形成污损,将增加船体自重和船体摩擦阻力,从而增加燃料消耗,加速船体腐蚀,缩短船舶使用寿命。解决海洋生物污损的方法中,以使用防污涂料最为广
DNA芯片技术作为一种高通量DNA分析检测方法,近年来备受关注.DNA芯片把大量已知序列探针集成在基片上,通过与标记的若干靶核酸序列杂交,可以对生物细胞或组织中大量的基因信
本论文针对包头混合稀土精矿的资源特点,开展了无污染、有价元素全组分利用的工艺研究,为环境保护和资源合理利用开辟了新途径,具有重大的经济及社会效益。 本论文主要分四个
DNA芯片技术是一种新的高通量DNA分析检测手段。DNA芯片把大量已知序列探针集成在基片上,通过与标记的若干靶核酸序列杂交,可以对生物细胞或组织中大量的基因信息进行检测和分
阿尔兹海默氏病(Alzheimer’s disease,AD)是一种中枢神经退行性疾病,该疾病主要影响老年人脑部的中枢神经,使其发生退行性改变,进而使老年人出现记忆明显衰退、认知功能下降