论文部分内容阅读
人类一直有一个梦想,就是期望有一天能够和机器进行无障碍的交流,如果人类能够和机器进行顺畅的交流,那么人类的工作效率将得到空前的提高。而对语音识别技术的研究则能够帮助人类实现这个梦想。并且随着计算机技术不断的进步,计算机已经越来越向智能化和微型化的方向发展,而且随着移动互联网的到来,计算机将大量的计算工作交到云上进行处理,而这时如何提高人类和计算机的交互性能就显得尤为重要。语音输入方式在人类与机器的交互中将起着越来越重要的作用。而这一切的实现都要基于对语音识别技术的研究。本文的工作正是基于这一研究背景而进行的。随着移动互联网的普及,本文的另外一个重点是研究了如何将语音识别技术应用到移动互联网中,让语音识别技术真正的达到普及使用。本文围绕语音识别技术做了如下几个方面的工作:1、深入理解研究了语音识别技术,着重研究学习了语音识别技术的要点,以及学习了语音识别的主要处理过程,包括语音识别过程中的分帧加窗,预处理,端点检测,特征提取,模型训练以及对语音的识别技术等。2、对隐马尔科夫模型进行了深入学习,包括研究了前向算法,Viterbi算法,以及前向-后向算法,它们是在基于隐马尔科夫模型的语音识别系统中的重要算法。3、对已经存在的多种语音识别技术,进行了学习比较,并且通过后验概率联合模型对HMM模型进行了改进,以提高HMM进行语音识别时的鲁棒性。4、进行编码实现出了基于改进型HMM的语音识别系统,并能够对一串连续的数字串进行识别。5、并且考虑到移动互联网的普及,以及现在基于Android系统的智能设备越来越普及,所以论文的最后会将实现的改进型的语音识别系统移植到Android平台,并且实现一个在Android平台上的语音识别应用程序。6、最后还对通过后验概率联合模型进行改进的语音识别程序与基于普通的HMM模型的语音识别程序在识别率上进行了比较分析。