论文部分内容阅读
中耳植入式助听装置,即人工中耳,作为一种新型的助听装置成为当下研究的热点。人工中耳的工作原理是首先通过麦克风将声音信号转换为电信号,然后经过数字信号处理器进行处理,最后由作动器将接收到的电信号成比例地转换为振动信号传入内耳,引起听觉。其中,信号处理算法尤为关键,而位于信号处理前端的语音增强性能的好坏直接影响着其他后续算法的实现效果。传统的语音增强算法会产生较多的残留噪声,并且极难对低信噪比以及非平稳噪声下的带噪语音进行处理,对处理噪声的泛化性也较差。为此,本文对人工中耳的语音增强方法进行了研究,提出将深度神经网络应用于人工中耳的语音增强中,并对其可行性及性能进行了测试,论文的主要工作及研究成果如下:1)确定用于所提人工中耳语音增强方法的深度神经网络类型以及语音信号特征。选用全连接深度神经网络作为人工中耳语音增强模型,为解决在使用误差反向传播方法训练全连接深度神经网络模型时常出现的梯度弥散、过拟合以及局部最优等问题,提出先对模型进行基于受限玻尔兹曼机方法的预训练,并对整体训练方法进行了详细说明。基于对语音产生机制以及人耳感知特性的描述,确定了能更好反映语音特性的组合特征。2)设计并实现所提人工中耳语音增强方法中的语音活动检测以及噪声分类算法。为解决在低信噪比条件下识别准确率低的问题,提出了基于深度神经网络的语音活动检测方法。同时,将深度神经网络用于噪声分类工作。最后,通过选用语料库与噪声库对以上所提语音活动检测和噪声分类算法进行性能测试,结果表明所提算法均取得较好效果,且都比传统方法更加优越。3)设计并实现所提人工中耳语音增强方法中的语音降噪算法。为弥补传统语音降噪方法易存在残留噪声、极难处理非平稳噪声等缺点,将深度神经网络用于语音降噪中。选用较优的训练目标以及语音综合质量评价指标,在选定的语料库与噪声库中对所提语音降噪算法进行性能测试,结果表明使用深度神经网络进行语音降噪能取得较好的降噪效果,也不依赖于语料库的选择,适用性较好,并且所提语音降噪方法比未进行噪声分类的相同算法性能更优。4)对所提人工中耳语音增强方法进行实验验证。根据人工中耳的工作原理,简化设计并搭建了人工中耳语音增强实验台,并基于该实验平台对所提整套人工中耳语音增强算法进行可行性及性能测试。包括对选用作为人工中耳作动器的压电叠堆进行动态特性测试以及对所提整套语音增强算法进行实验研究。结果表明所选压电叠堆的输出具有较好的稳定性和保真性,能够作为人工中耳作动器工作。所提整套语音增强算法能够用于人工中耳的语音信号处理,并且性能较优。