电话和语音识别系统的语音增强

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:aifeideyuo0O
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文在电信和语音识别系统中考虑了自适应滤波算法的语音增强和降噪问题。在真实嘈杂的环境中存在这些系统会降低其效率并降低其性能。例如,对于电信系统,背景噪声信号破坏传输的语音信号并使其可懂度和质量降低。对于语音识别系统,它们使测试和训练语音信号之间不匹配。过去已经提出了几种单麦克风增强技术,这里将对其进行讨论。这些技术中的大多数基于噪声平稳性的假设,但是在现实生活环境中,该假设未被广泛验证,这使得这些技术通过许多失真影响语音信号。此外,这些技术受到低输入SNR(<=5dB),噪声水平和噪声类型的低性能限制。这些限制导致我们使用第二个麦克风,它允许获得信号特性并使我们摆脱噪声平稳性的假设。然而,两个麦克风的存在提供了两个观察信号。这里的问题是我们如何通过仅使用观察信号来分离两个源信号(语音和噪声)而没有关于源信号的任何先验信息?这个问题在名称盲源分离(BSS)下是已知的,这是语音增强领域中最重要的问题。本文首先介绍了关于语音增强技术的历史和文献综述。其次,为了能够加深对于这个领域实际问题的理解,对自适应滤波算法的理论基础进行了详尽的学习与研究。在展示对于创新算法的主要贡献之前,先讲解并分析了三种传统的TM-BSS算法。而研究的创新算法被称为双传声器缩小尺寸简化快速横向滤波器(TM-RSMFTF)算法,是之前提出的经典算法的创新替代方案。该算法是已知前向盲源分离结构与能够减小尺寸和简化快速横向滤波器(R-SMFTF)的自适应滤波算法的结合。最后,在不同的条件和情况下进行了数值模拟,结果表明该算法在计算复杂度和分段信噪比,系统失配和分段均方误差等目标指标方面具有良好的性能和有效性。本文还对各种TM-BSS算法进行了比较研究从而得出结论,并提出了今后的工作方向。
其他文献
大白菜三体的n+1配子传递率,是利用三体进行遗传分析的重要参数。以大白菜初级三体系为亲本,分别与二倍体正反交,测定n+1雌雄配子传递率,并对各三体雄配子形成过程中染色体的减
随着我国市场经济的发展,客观经济的危险性越来越高,稳健的会计原则在理论和实践方面都有重要意义,特别是在会计实务领域范围内,建立健全相应制度更是首要任务。会计原则中占
目的:评估18F-FDG PET/MR-IVIM诊断盆腔恶性肿瘤淋巴结转移的价值。确定PET、IVIM序列诊断淋巴结转移的效能。探索淋巴结代谢、弥散参数的内在联系从而寻求转移淋巴结的微观
原型范畴理论是认知语言学的重要核心理论之一,它在语言分析中的应用主要包括词与词缀,词性,所有格构造,时态和语态等,而原性范畴理论在语言习得及研究中涉及最多的便是词汇与时态
中国实体零售业在线上线下协同的过程中,遇到了资源协同、价格体系、广告力度、物流能力、品牌老化等方面的协同困境。银泰百货的经验表明,中国实体零售业应重点从资源整合、
Sustainable development is one of the most important ideas,and goals of our time.It is defined as&#39;development which meets the needs and aspirations of the c
In this paper, we construct a model in which the impact of pollution on health is exerted through both direct and indirect channels. The indirect channel is cap
经江西省环保厅及赣州市、章贡区环保局相关专家组成的验收专家组的全面、认真审核,江西江钨钴业有限公司4000吨/年钴项目一期工程近日顺利通过了竣工环保验收。
上海市红领巾理事会的一份报告列举了世界各国儿童平均每日参加体力劳动的时间:美国1.2小时;韩国0.7小时,法国0.6小时,英国0.5小时,日本0.4小时……而中国 A report by the
期刊