小语音库语音识别的研究及应用

来源 :中山大学 | 被引量 : 0次 | 上传用户:allanvte001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息科学的迅猛发展,智能化工具逐渐走进人们的生活,人们越来越渴望实现人机之间的交互,并且希望达到更加自然的水平。语音识别正是实现人机交互的途径之一,并且已经在诸多行业取得了很大的成就,但是面临实用化时仍存在一系列问题。要实现性能优良、实用化的语音识别系统,人们仍需要不断对语音识别的理论、算法进行研究,解决和完善语音识别中所存在的各种问题。   本文是以手机自动语音录入为目标进行的尝试性研究,希望能够实现特定人汉语语音识别系统,并且移植到手机中,为手机的短信自动录入做了一个基础性工作。本文详细阐述了语音识别的基本原理,介绍了三种时域特征参数、美尔倒谱系数等特征参数的计算方法,并对语音的端点检测算法及识别算法进行了研究。在实验部分还对系统的各个环节进行了仿真,通过比较所采用的方法,选择了简单高效的识别途径及参数,编制了一个特定人小词汇量汉语语音识别系统软件。具体的研究工作为:   1、利用已有算法实现了语音信号的预处理和特征参数提取。涉及语音信号的数字化、加窗处理、预加重滤波、端点检测及时域特征向量和变换域特征向量。   2、研究特定人孤立词与连续词识别算法,包括DTW识别法、HMM识别法以及神经网络识别法,实现了DTW算法,并进行了语音识别的仿真。   3、识别孤立词时,增加了声韵母信息对识别结果影响的分析;连续词识别时又充分考虑到上下文词与词之间的先验知识。实验表明最终结果还是得到了一定的改进。   4、设计并实现了一个完整的语音识别系统。进行了相关实验,对实验结果进行了统计和讨论。  
其他文献
符号模式矩阵的研究起源于研究线性系统的符号稳定性与符号可解性,是由P.A.Samuelson在他的著作(Foundations of Economic Analysis)中首先提的R.A.Brualdi和B.L.Shader的专著(文
《艺术财经L’Officiel Art》委托陈轴和Dick Ng完成一组接龙作品:先由陈轴拍摄一张图片,然后Dick Ng根据图片绘制一幅漫画,最后陈轴再根据漫画拍摄一张图片。陈轴在北京,Dic
Type-2 fuzzy controllers have been mostly viewed as black-box function generators. Revealing the analytical structure of any type-2 fuzzy controller is importan
首先我们对CAGD中参数曲线曲面发展历史进行了回顾,并对带形状参数的曲线曲面已有研究成果作了简要介绍。然后我们在其后章节对带形状参数的曲线曲面作了深入研究。主要有以
随着科学技术的进步和生产力的发展,控制系统变得越来越复杂,往往缺乏精确的数学模型,且具有高度的非线性和不确定性,而控制系统的稳定性是评价控制系统的重要指标。然而,由
低渗透油气藏的勘探和开发,在我国具有比较广阔的前景,科学合理地开发低渗透油藏是我国石油工业发展的重要战略之一,提高其开采效率对于发展我国的石油行业、缓解能源紧缺具有重
本课题将重点研究在系统控制领域中经常遇到的几类分块矩阵问题。而在系统控制理论中研究主要对象为广义系统,广义线性系统是动力系统——比正常的线性系统更具有广泛形式。但
时间尺度上的动力方程是一个新的有着广泛应用前景的数学分支,振动性理论是动力方程的一个重要的研究方向。本文分四章研究了在时间尺度上几类二阶时滞动力方程的振动性,所得结
随着科学的快速发展,社会的不断进步,在科学研究和实际工程中遇到的问题也日益复杂化,优化问题便是生产实践中经常碰到的一类问题。在解决优化问题时,往往存在维度高、计算量
无线传感器网络(WSN)是一种依赖传感器节点进行区域监测,并且以无线数据传输的方式进行数据传输的新型网络。由于传感器节点自身携带的能源有限,并且通常被撒布于无法在部署