【摘 要】
:
人类听觉系统对语音信号的感知能力大大超过了目前的信号处理水平。计算听觉场景分析(Computational Auditory Scene Analysis,CASA)通过模拟人对语音信号的处理,分析语音成
论文部分内容阅读
人类听觉系统对语音信号的感知能力大大超过了目前的信号处理水平。计算听觉场景分析(Computational Auditory Scene Analysis,CASA)通过模拟人对语音信号的处理,分析语音成分,最后达到将不同声源语音分类的目的。
本文尝试将这种技术引入抗噪声语音识别。覆盖一个抗噪声识别器的各个方面,包括特征抽取,训练,对噪声处理,以及最后识别。分析了一个较成功的CASA模型-HuWang模型的结构和过程,对模型进行修改并利用此模型对带噪声语音进行处理,分离出目标语音。对于CASA给语音信号频谱造成的不连续,本文提出了一种改进的听觉外围特征算法,抽取干净语音的特征。此特征考虑了听觉外围的特点和CASA算法的输出,寻找并且保留了语音信号中能量最强的部分(基频和谐波),舍弃了语音信号中能量较弱较容易给噪声掩盖的部分,达到抗噪声并且符合CASA匹配的目的。实验证明:虽然此特征对干净语音识别的结果跟流行的MFCC有差距,有待提高,但是在噪声环境下体现出很强的抗噪性,是一种很有前途的鲁棒的语音特征。
其他文献
我国汽车检测行业经过二十多年的不懈努力,无论从检测技术、检测设备还是从检测标准等各方面都已经得到了长足的发展。目前,汽车检测行业的研究重点还是主要集中在检测技术和检
蚁群算法(ant colony algorithm简称ACA)是最近几年才提出来的一种新型的模拟进化算法,它来源于对真实蚂蚁群体寻找从巢穴到食物源最短路径方法的模拟,体现了真实蚁群的协作
X光投影技术自从上个世纪70年代以来获得了迅速的发展,可以检测出物体的二维、三维密度分布图像,以此来确定物体内部的几何结构、性质、位置、大小等,被国际无损检测界公认为最
随着机器学习研究的不断深入,学习算法所能处理的数据规模越来越庞大。然而,对数据进行标注一般仍需要人工完成,所消耗的成本日益成为限制机器学习发展的瓶颈。主动学习通过让机
铅锌烧结过程是密闭鼓风炉还原熔炼的原料准备过程,其目的是为还原熔炼提供成分合适、具有一定机械强度和还原性的烧结块。烧结配料过程是铅锌烧结生产的首道工序,是烧结炉料
移动机器人在未知环境中自主完成任务在工业、民用以及军事等领域具有广泛的应用前景。自主式移动机器人在未知环境下工作,必须具有对未知环境进行探测和环境地图创建的能力
目标跟踪是计算机视觉领域的研究热点,在行为识别、智能监控和人机交互等民用和军事领域上具有广阔的应用前景。近年来视觉跟踪领域已经取得了显著的成果,但是仍然存在一些问题
无线传感器网络由于具有成本低、易于部署、自组织等特点受到了广泛的关注,并且在军事、环境、家居和工业监测等方面得到了很好的应用。认知无线传感器网络利用动态频谱接入
云计算以“一切皆为服务”的思想和形式向用户提供虚拟化的应用计算资源、开放的标准、可伸缩的系统和面向服务的架构,使云服务提供商以灵活且实惠的方式提供可靠的、随需应
电子鼻是模拟生物的嗅觉系统而设计的一种智能电子仪器,近年来在环境监测、化工、医疗、能源、食品、毒气检测等领域获得了广泛的应用。本文对电子鼻系统的原理、构成、实现和