论文部分内容阅读
说话人识别是指通过语音来识别说话人的身份。作为一种基于生物特征信息的身份识别方法,它在电子商务、消费、银行等远程客户服务的身份认证、军事安全领域的说话人身份自动检测和认证中具有极大的应用价值和广泛的应用前景,是当今语音信号处理和生物特征信息检测和识别领域的重要研究方向。由于说话人的个性以及实际应用环境的复杂性,说话人识别技术虽然取得了一定的进步,但识别率、系统稳定性、噪声鲁棒性还不是很理想,其瓶颈效应也逐步显现,进一步提高比较困难,离真正的实用化还有相当一段距离。蚁群算法是一种随机搜索算法,与其它模拟进化优化算法一样,通过由候选解组成的群体的进化过程来寻找最优解。它通过信息素利用了正反馈原理,在一定程度上可以加快进化过程,它还是一种本质并行的算法,不同个体之间不断进行信息的交流和传递,从而能够相互协作,有利于发现更好的解。由于它的这种优点,在TSP、函数优化等问题上得到了广泛的应用。本论文在分析了说话人识别以及蚁群算法国内外研究现状的基础上,将蚁群算法引入到混合高斯模型的参数训练中,采用TopN方法对特征矢量作识别计算,并以此为基础实现了一个说话人识别系统。论文完成的主要工作有:1、分析了说话人识别的国内外研究现状,阐述了说话人识别系统的基本结构以及说话人识别的性能评价标准等。2、分析了蚁群算法的国内外现状,在深入研究蚁群算法和混合高斯模型的原理和特点后,提出了将蚁群算法引入到混合高斯模型的参数训练的新方法。利用蚁群算法对输入说话人的语音帧信息聚类来估计出模型的参数,从而为每一个说话人建立起相应的模型。3、针对有限的训练数据和语音信号的变异性等问题,论文提出了采用TopN的方法,该方法只取最相似的前N%的特征矢量作识别计算,从而有效地降低了语音段中无效语音段对整体语音的影响。4、在上述提出的新算法的基础上利用Visual C++实现了一个说话人识别系统,该系统能实现录音、训练、识别等一系列功能。实验结果表明,基于蚁群算法的说话人识别系统有着较高的识别率,是说话人识别的一种有效的新方法。