论文部分内容阅读
随着互联网技术的快速发展,在越来越多的领域内都应用了语音信号处理技术,其中一个重要分支为说话人识别技术,它是目前语音信号处理技术领域中的一个研究热点。说话人识别是对说话人身份进行认证的一种技术,包括语音录入、预处理、特征提取、模型训练以及模式匹配,它是通过从经过预处理后的语音中获取语音特征进行模型训练与模式匹配从而确定说话人身份。从该过程可知特征提取是其他步骤的基础,它是说话人识别中最重要的一个环节,因此本文分析了特征提取方法的优缺点并提出了一种基于改进参数设置的深度置信网络的特征提取算法。影响特征提取的因素有很多,其中噪声是最为直接的因素,从而必须在特征提取前对语音进行滤波操作,因此本文也分析语音滤波方法的优缺点并提出一种多层自适应形态滤波算法,并且以此为基础设计实现一个说话人识别的原型系统。本文的主要工作为:(1)归纳了语音滤波算法和特征提取算法的特点和难点,对比分析了目前常用的语音滤波算法和特征提取算法的优缺点。(2)现有的大多滤波算法在进行语音滤波时损失了较多的纯净语音信号从而使得语音质量下降,利用形态滤波算法进行滤波时既可以很好的滤除语音中的噪音同时也可以减少纯净语音信号的损失,然而现有形态滤波算法还存在结构固定、预设结构元素和偏倚校正系数等问题,针对该问题,提出一种多层自适应形态滤波算法。该算法面对复杂变化的噪声时,可以灵活选择不同的结构元素、优化设置偏倚校正系数向量来减弱形态开运算和形态闭运算所带来的偏倚现象。仿真结果表明该算法改善了形态滤波的性能,具有设计简单、实用性强的特点。(3)现有的特征提取方法中对初始特征的处理大多是进行简单的组合、微分、筛选或加权等,所提取特征表征能力较弱,用其进行说话人识别时正确率较低。针对此问题,将深度置信网络用于特征提取并对其参数的设置进行改进使得所提取特征具有更强表征能力。仿真结果表明该算法所提取的特征能有效的降低说话人识别的误识率。(4)对说话人识别原型系统的需求进行了分析,根据说话人识别的处理流程进行了功能划分,并给出了说话人识别的系统结构,对其中的核心模块进行了详细设计并予以实现,最后对系统的功能和性能进行了测试并对测试结果进行了相应的分析。