论文部分内容阅读
语音识别技术近年来取得了长足的发展,伴随着计算机和手机等体积小巧的便携式设备的普及,尤其是进入网络时代以后,各种基于语音识别的应用不断涌现。特别的,孤立词识别作为语音识别的一种由于其具备计算效率高、存储空间小和易于实现的优点,尤其是在实现中小词汇量的系统时既简单又高效,在特定场合中拥有广泛的应用。但是在实验室环境中表现良好的自动语音识别系统,在实际应用中却不得不面对由通道特性改变、背景噪音的干扰以及说话人特性变化等语音变化因素引起的系统性能严重下降的局面。因此语音变化对于语音识别系统影响的研究已经引起了学术界和工业界的关注。本文在调研引发语音变化的主要因素、孤立词识别技术及鲁棒性语音识别技术研究现状的前提下,在满足语音变化条件的语料库上分析通道特性和说话人情感状态对于语音识别三个层面:特征层、模型层和得分层的影响。然后本文在基于模板的和基于隐马尔可夫模型(HMM)的孤立词识别框架下研究对通道特性和说话人情感状态具备鲁棒性的孤立词识别技术。在基于模板的方法中本文通过基频修正算法、聚类选择模板的方法和通用向量方法(CVA)来提高系统对说话人情感状态的鲁棒性。而在基于HMM的方法中我们通过在特征层进行倒谱均值减和在得分层进行得分规整来提高系统对于通道变化的鲁棒性。实验结果表明这些方法不同程度的提高了孤立词识别系统对于通道变化和说话人情感状态引发的语音变化的鲁棒性。最后我们将鲁棒性孤立词识别技术在实际领域中进行了初步应用。本文的主要工作包括:1.采集与制作了汉语孤立词库MIWAC。2.在不同的语料库上通过多种手段分析了通道特性和说话人情感状态影响语音识别系统的特征分布、模型区分性和得分分布的规律。3.利用语音变化分析结果,在基于模板的和基于HMM的框架下研究了对于通道特性和说话人情感状态具有鲁棒性的孤立词识别技术。4.将提出的鲁棒性孤立词识别技术在移动媒体信息检索和家用电器控制领域实现了初步应用。