基于麦克风阵列的说话人数目估计

被引量 : 0次 | 上传用户:yiwangcom
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
麦克风阵列可以同时获取声源的时域、频域和空域信息,与单麦克风相比,具有抗干扰能力强、信号增益高及应用灵活等优点。目前,麦克风阵列广泛用于解决声源定位、语音增强、语音识别及盲源分离等问题,并在通信、计算机、多媒体、数字娱乐等领域得到了应用。精确已知的信源数目是麦克风阵列信号处理算法实现高性能的前提条件,说话人数目估计是语音信号处理中的重要课题。本文研究基于麦克风阵列的说话人数目估计方法,主要工作如下:(1)介绍了用于窄带信源数目估计的信息论准则方法和盖尔圆方法;(2)将处理宽带信源的非相干信号子空间方法对语音信号进行窄带化处理,并将信息论准则方法和盖尔圆方法引入麦克风阵列中,应用于窄带化处理后的语音信号,提出了麦克风阵列的说话人数目估计方法;(3)对宽带信源,分析了相干信号子空间的聚焦矩阵构造方法,将协方差矩阵相关变换聚焦矩阵构造方法与信源数目估计算法结合,实现了说话人数目的估计。(4)研究了折叠重采样方法及其在阵列信号处理中的应用,将其引入麦克风阵列说话人数目估计中,提出了基于折叠重采样的说话人数目估计方法,通过仿真实验验证了该方法的有效性。
其他文献
联合国开发计划署提出的人文发展指数(HDI)是由人类健康、教育水平和生活质量三项基础指标合成的一个综合评价指数,摒弃了过去以单一经济指标来进行国际比较的作法。2005人类
发酵度的高低,不仅影响着啤酒的感官质量,更是影响啤酒爽口性的重要因素之一。影响发酵度的因素有很多,包括原料、糖化工艺、酵母质量、发酵过程控制等。本文就上述因素结合
<正>西河大鼓,河北曲种。20世纪20年代在天津演出时,定名为"西河大鼓"。兴起于保定、河间至沧州一线为轴心的冀中地带。以说唱中、长篇书目为主,也有少数演员专工短篇唱段。
<正> 法国的让——保尔·萨特(1905——1980)是当代西方杰出的哲学家、文学家,生前声名卓著,逝世后数万人自发送殡。他留下的精神财富,除了哲学名著《存在与虚无》、《辩证理
目的:了解社区护士的家庭护理安全相关知识与行为,探讨家庭护理中存在的安全隐患。方法:采用自设问卷,对94例社区护士的家庭护理安全知识与行为进行调查。结果:社区护士的家
<正>人口、资源、环境是可持续发展的三大要素,人口均衡、资源节约、环境友好,是可持续发展战略的主要内容。在充分强调资源节约型、环境友好型社会建设的同时,不能忽视人口
人才资源是旅游业发展的第一资源,而目前山西省涉外导游的紧缺已成为制约其旅游经济发展的瓶颈,文章分析了山西省涉外导游人才培养现状及问题所在,并提出适合山西省的涉外导
<正>特色小镇不是单纯的开发区等产业集聚区建设升级版,也不是简单的中心镇等城市化载体打造升级版,它需有着并能坚持基本内涵、理念、路径上的大胆创新,需积极培育并形成自
民族服饰具有款式形制复杂,装饰品繁多,装饰性、审美性强的特点,与我们现代简洁高效的生活节奏和趋从同众的大众心理需求存在差异。然而,其丰富绚丽的色彩,独特的款式造型,意
针对铁路道床吸污车吸污效率不足和二次污染问题,建立吹吸装置仿真模型,选取钢轨打磨后道床上常见且密度大的铁屑作为研究对象,运用计算流体力学方法对不同吹风速度情况下的