语音识别技术的研究及基本实现

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:vvchan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别就是让电脑听懂人的话,并做出正确反应。语音识别技术是计算机技术重要的发展方向,语音识别已经形成了完整的理论体系,基于PC平台的语音识别系统的研究也在技术上获得了一些成功,尽管目前语音识别的研究已经进入了商品化阶段,基础性理论相当完善,各种各样的产品也相继涌现,但在许多特定领域,由于其环境和行业的特殊性,往往需要专门进行开发,以适应实际需要。 本文首先介绍了语音识别技术的国内外发展状况,分析了语音识别系统商品化过程中面临的困难,在此基础上阐明了本课题的研究背景和意义。 其次,根据语音识别系统的基本构成模型,介绍了预处理、端点检测到模板生成及模板管理和模板匹配各部分所涉及到的语音数字信号处理、模式识别等方面的基本原理,并讨论了在PC机上实现语音识别系统的几种途径。 接着,本文介绍了使用Visual C++6.0根据DTW(动态时间弯折)模型的语音识别训练和识别的基本方法,在Windows操作系统上实现的一个简单的非特定人、小词汇量、孤立词语音识别系统(模拟航线查询系统的语音识别控制接口部分)。系统的组成模块与语音识别系统的基本构成模型基本一致,在训练过程中,通过调用MCI(MCI Multimedia Control Interface)提供的函数从语音库中的波形文件中读取采样数据,分帧计算出由12维线性预测系数和12维线性预测倒谱系数构成的特征矢量,并按照聚类的方法进行训练,得到后续语音识别时需要的模板,存放于模板库中。识别时,计算出输入语音的特征矢量参数,依据模板匹配的方法与模板库中的语音模板逐一进行比较,得出最佳的匹配模板,或作出拒识判断。在此基础上本文还针对特定的应用领域提出了系统的一些改进方案,如适应低信噪比环境的线性预测方法,改进的DTW算法,以及用人工神经元方法进行端点检测两级判别法的阀值确定。最后对系统性能进行了小结,指出了该系统的改进方向。 本文通过对实际语音识别系统的测试和研究,为进一步开发实用性语音识别系统的工作做了基础和探索性的工作。
其他文献
<正>蛋壳质量的好坏一直是影响禽蛋业经济效益的重要因素。衡量蛋壳质量的指标主要有:蛋壳厚度、密度、壳重、蛋壳变形值、蛋壳袭强度和单位表面积的壳重等。常见的蛋壳异常
<正>小船渡河的问题,一般有小船渡河的时间最短,位移最小两类问题.1小船如何渡河时间最短,最短时间为多少?设河宽为d,小船在静水中的速度为v船,水流速度为v水,如图1.将船对水
<正>本刊2013年8月刊登了《物体的速度究竟多大?》一文,笔者拜读之后,深受启发,感触颇多,有共鸣也有疑惑.原文作者听课时,上课教师分析了一道题,如图1所示,物体A、B以相同的
<正> 1.概述 核桃壳过滤器用于含油污水处理工艺中,虽然过滤效果比较好,但也存在容易堵罐和跑料的现象。通过对核桃壳过滤器的改造,采用泵洗式滤料再生技术代替搅拌式滤料再
燃气发电机组包括燃气发动机、工频交流发电机、机组控制系统及配套冷却系统。机组具有刚性的公共底盘,可以整体发运,落地固定即可使用。燃气发动机技术特点是外混式天然气机
本文作者基于对我国城市基础设施建设资金短缺及我国现行城市基础设施融资方式中存在的一系列问题的思考,就如何依据城市基础设施建设项目的性质确定融资方式,如何在借鉴国外经
近年来,随着不同学科领域之间的相互渗透,民居研究的内容也突破了原先相对狭隘的范围。在全球性文化的共存环境中,对民居建筑的研究已远不仅仅只是一个建筑形式问题,而是要求不断
随着世界经济的快速发展和现代科学技术的进步,物流产业作为国民 经济中一个新兴的服务部门,正在全球范围内迅速发展。物流产业的产生 和发展是经济发展到一
随着多媒体的技术发展,物理教师们越来越多地关注现代技术的应用,但也有教师忽视了自身教学基本能力的提升.在现代教学技术手段发展的今天,如何将现代技术与传统教学手段有机