论文部分内容阅读
随着信息科学的迅猛发展,智能化工具逐渐走进人们的生活,人们越来越渴望实现人机之间的交互,并且希望达到更加自然的水平。语音识别正是实现人机交互的途径之一,并且已经在诸多行业取得了很大的成就,但是面临实用化时仍存在一系列问题。要实现性能优良、实用化的语音识别系统,人们仍需要不断对语音识别的理论、算法进行研究,解决和完善语音识别中所存在的各种问题。
本文是以手机自动语音录入为目标进行的尝试性研究,希望能够实现特定人汉语语音识别系统,并且移植到手机中,为手机的短信自动录入做了一个基础性工作。本文详细阐述了语音识别的基本原理,介绍了三种时域特征参数、美尔倒谱系数等特征参数的计算方法,并对语音的端点检测算法及识别算法进行了研究。在实验部分还对系统的各个环节进行了仿真,通过比较所采用的方法,选择了简单高效的识别途径及参数,编制了一个特定人小词汇量汉语语音识别系统软件。具体的研究工作为:
1、利用已有算法实现了语音信号的预处理和特征参数提取。涉及语音信号的数字化、加窗处理、预加重滤波、端点检测及时域特征向量和变换域特征向量。
2、研究特定人孤立词与连续词识别算法,包括DTW识别法、HMM识别法以及神经网络识别法,实现了DTW算法,并进行了语音识别的仿真。
3、识别孤立词时,增加了声韵母信息对识别结果影响的分析;连续词识别时又充分考虑到上下文词与词之间的先验知识。实验表明最终结果还是得到了一定的改进。
4、设计并实现了一个完整的语音识别系统。进行了相关实验,对实验结果进行了统计和讨论。