麦克风阵列语音增强方法的研究

被引量 : 0次 | 上传用户:yaci
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在获得语音信号的同时,不可避免地会受到噪声干扰,语音增强是抑制干扰的一种有效途径。采用单麦克风技术,虽然可以对噪声进行一定的抑制,但由于仅可利用时/频信息,因此,在强混响环境以及非平稳噪声场情况下,其干扰抑制效果并不理想。利用多个麦克风提供的空域和时/频信息,则有可能较好地解决这一问题。因此,本文主要研究基于麦克风阵列的语音增强方法。时延估计和语音活动检测(Voice Activity Detection,简称VAD)技术是阵列增强的重要组成部分,其准确性直接影响到语音增强效果。独立分量分析(IndependentComponent Analysis,简称ICA)能够仅由观测信号恢复出各个统计独立的源信号,利用它可以一定程度上将语音与噪声分离,将其与现有算法相结合则有可能达到更好的增强效果,因此本文重点做了以下几方面工作:(1) 研究了互功率谱相位(Crosspower Spectrum Phase,简称CSP)时延估计方法的性能,针对该方法在低信噪比和强混响情况下性能下降的问题,给出了两种改进方法。实验结果证明了两种改进方法的有效性和可靠性。(2) 给出一种对麦克风阵列各通道信号同时进行VAD的算法。经ICA分离出的相对纯净的语音信号作为参考信号,其VAD结果用于指导阵列信号的语音检测,实验结果表明该方法在恶劣的噪声环境下仍可以获得准确的检测结果。(3) 针对实际环境下噪声和混响对语音增强系统性能的影响,在广义旁瓣抵消器(Generalized Sidelobe Canceller,简称GSC)基础上,将带参考信号的ICA(ICA withreference,简称rICA)算法与鲁棒性广义旁瓣抵消结构(Robust GSC,简称RGSC)相结合,给出了一种改进的GSC算法。通过实验表明,该算法综合了rICA的抗混响性能和RGSC方法对噪声的鲁棒性,更适用于实际环境下的语音增强系统。
其他文献
《論語》學濫觴於西漢,特指關於《論語》的學術研究,其内容包括對《論語》的作者、成書年代、版本源流、學脈傳承、歷史作用的研究,以及《論語》文字訓詁、義理闡釋和《論語
随着我国经济体制的转换,以及加入WTO之后与全球经济一体化的相关性增强,企业竞争日益激烈,成本已不仅仅是影响利润高低的一个因素,而是一个影响到企业竞争力大小、生存发展
肝脏是最重要的药物代谢器官之一,肝微粒体孵育试验可在亚细胞水平确定药物代谢稳定性、药酶抑制、活性代谢物生成等重要特性[1].对孵育液中药物进行定性定量检测是一项关键
医药产业是国家社会经济发展的重要产业部门,是关系到国计民生的支柱产业。制药工业属能源和资源密集型产业,资源能耗消量大,污染物排放量也大,在刺激国民经济快速增长的同时
《画梦录》是最能体现何其芳才情和艺术创造力的散文集。这是一本雕绘梦的书,它的主要价值在于对散文艺术的自觉追求与散文的抒情美、形式美的创造上。在三十年代曾风靡一时,
慢性前列腺炎(the Chronic Prostatitis),简称CP,是男性患者的一种常见病、多发病,主要表现为排尿异常,尿频不畅,尿道灼热,尿初或尿末疼痛,疼痛放射到阴茎头、会阴部、腹股沟
三维模型建造是数字景观构建的基础之一。本文研究了园林景观构成中的植物、水体、地形、园林建筑等要素的三维模型建造及应用。重点对植物和园林建筑三维模型建造及应用进行
美国的建筑师注册制度是世界上建立最早、最完善的建筑师注册体系之一,主要包括专业教育、实习经验、注册考试、注册登记、继续教育5个环节。政府机构和相关职业团体在各个环
本文首先对虚拟现实(Virtual Reality)技术进行了概括性介绍,阐述了虚拟现实系统的基本要素、基本特征以及虚拟现实的硬件实现和软件实现。概括介绍了 VRML(Virtual Reality
我国啤酒产业和畜牧业快速发展带动了国内大麦需求的持续增长,但由于产业扶持政策缺乏、科研基础较为薄弱、国内价格高于国际价格、进口关税水平非常低等原因,国内大麦产业特