基于EM的多通道去混响和降噪算法的改进

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:l541306072
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音去混响和降躁是语音识别系统中前端声学处理技术中的重要部分。对于智能会议转写系统、声控家具操作系统以及机器人小助手等应用场景,为了提高获得语音的质量,实现高噪声、有混响、距离声源较远的情况下获得符合语音识别需求的声音信号,通常利用麦克风阵列进行语音处理。因而远场条件下的麦克风阵列降噪和去混响是语音处理技术中的研究热点。多通道语音去混响和降噪利用按一定几何结构(常用线性、环形)摆放的麦克风组采集到的不同空间方向的声音信号进行空时处理,实现噪声抑制和混响去除,进而提高语音信号处理质量,以提高真实环境下的语音识别率。实现联合多通道语音降噪和去混响常用的技术有:谱增强技术、基于概率模型技术和声多通道均衡技术。期望最大化(EM)算法已经被不少人应用到语音去混响技术中。在对多通道EM去混响和降噪算法的调研分析中发现,以往学者要么是将晚期混响直接用一个理想扩散声场代替,要么通过接收语音直接估计噪声作为已知变量。为了提高EM算法的降噪和去混响能力,我们定义噪声差量变量,并将噪声差量变量也设为隐藏变量,将估计出来的噪声作为算法迭代的初始值,通过EM迭代对其进行求解。为了进一步提高算法的适用性,解决高噪声条件下语音去混响和降噪问题,利用原有算法在高信噪比条件下的去混响和降噪功能很好的特点,结合谱增强技术,先对混合语音使用最小方差无失真响应(MVDR)波束形成器(BF)降噪,然后用EM算法进行去混响。在近似无噪条件下,为了防止出现EM算法不收敛或收敛过慢的现象,此时只将消声语音作为隐藏变量。通过仿真实验对上述两点思想进行测试和验证,评价指标为主观语音质量评估(PESQ)、对数谱距离(LSD)和分段信噪比。实验证明在高信噪比条件下,将噪声差量变量设为隐藏变量能够获得更高的PESQ得分和更小的LSD数值;在低信噪比条件下,结合谱增强技术的EM算法能获得更好的PESQ分数和更高的分段信噪比。
其他文献
根据比较优势调整农产品贸易结构这一思路,本文运用散点图、非参数核密度估计统计方法分析了中国农产品的比较优势变化。研究显示,1996到2010年中国农产品整体比较优势没有明
海洋环境立体监测信息服务系统是海洋环境立体监测系统中最重要的子系统之一,其目的在于集成整合由海洋环境立体监测网络获取的海洋环境信息以及各种海洋专题应用信息系统,提供全方位、多层次的海洋信息服务.本文首先介绍了福建海洋环境立体监测信息服务系统的结构设计,然后讨论了系统的建设与实施,接着介绍了福建海洋环境立体监测信息服务系统提供的信息服务内容与功能,最后总结得出结论认为系统的建设为决策者整体把握福建海
品牌开始是与商品联系在一起的,原是经济学领域的一个名词。20世纪50年代,品牌概念开始被引入国际贸易与国际关系领域,于是出现了国家品牌。在国际关系视域,国家品牌含义与国
近日,经福建省科协第四届优秀科技期刊评审委员会评审,福建省科协作出了“关于表彰福建省科协第四届优秀科技期刊的决定”,《台湾海峡》期刊再次荣获福建省科协优秀科技期刊二等
目的:研究牛磺酸(taurine,Tau)对睡眠剥夺(sleep deprivation,SD)大鼠学习记忆的影响。方法:用小平台水环境(flower pot)法建立SD大鼠模型,SD72h后用Morris水迷宫测定大鼠学
介绍照明装置的电气安全
<正> 金秋的沈阳,越来越多的人们脸上露出了灿烂的笑立容。当亿万中国球迷几代人44年的憧憬与期望就将在沈阳画上完满句号,当中国足球走出亚洲、冲向世界这一愿望将于10月7日
水利事业单位需要建立合理的内部会计控制制度,这样才能保证经济活动的合法合规性及其资产的安全性,水利事业单位内部控制机制要和单位的运行机制相结合,强化预算管理,加强会
扩散硅压力传感器及变送器,因为其良好的性能特性被广泛的应用在工业过程控制系统中。由于半导体材料对温度敏感,因此压力变送器存在比较明显的温度漂移,需要进行补偿以后才
杭州顺豪橡胶工程有限公司近日成功地开发出室温自硫化丁基橡胶衬里技术,并发挥了高新技术产品的优势,为我国的防腐工业作出了卓有成效的贡献。橡胶衬里是化工防腐技术的一个