基于小波变换的语音识别的研究和应用

来源 :桂林理工大学 | 被引量 : 0次 | 上传用户:l1otus
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别是一门交叉学科,它与语音学、语言学、数字信号处理、模式识别、最优化理论、计算机科学等众多学科紧密相连,是一门既有理论价值又有实际意义的学科。语音识别发展了几十年,取得了很大的进步。语音识别在某些方面还是存在一些问题:如对自然语言的识别和理解还属于初级阶段;语音信息量大不易存储;语音的模糊性;单个字母或词、字的语音特性受上下文的影响,以致改变了重音、音调、音量和发音速度等;环境噪声和其它干扰对语音识别有严重影响,致使识别率低。因此,解决以上问题是语音识别发展的重点。   本研究主要内容包括:第一,简单介绍语音识别基础知识和语音识别的国内外发展状况以及文章的整个结构划分。第二,在语音信号处理过程中,一方面在时域和频域中对语音信号进行分析,分析出语音信号的参数;另一方面利用传统的小波阈值函数对语音信号进行去噪,效率低,而且效果不好,本文结合了小波软硬阈值的优点,改进了小波的阈值系数,利用改进后的小波对采集的语音信号进行处理,效果有了明显的提高。本文结合语音信号的数学模型以及语音信号的本身特征,提取出了语音信号的特征参数。第三,本文的重点是以DTW和HMM等识别算法为基础,对这两种算法提出了改进。对DTW算法的改进主要体现在:在数据帧的两端开放δ帧的自由,缩短帧与帧之间的距离,提出声刺激法:对HMM算法的改进主要体现在:改进HMM模型的分类和统计能力,原始的HMM模型不能很好地表现语音信号的时域特性,改进后的HMM模型基本上能体现语音信号的时域特性,解决原始HMM模型不能解决的语音信号的下溢问题。第四,根据语音识别的具体方法,基于改进的小波去噪、改进的DTW和改进的HMM算法。我们首先在MATLAB软件中进行特定人语音识别的仿真试验;其次,在VC编程环境中实现了特定人语音识别和连续语音识别系统,在处理语音信号和识别方面都获得了成功。最后,我们对小型语音识别系统进行试验验证,采用改进后小波阈值去噪以及改进后的DTW和HMM算法,在不同条件下测试语音识别率和稳定性,结果都有了很大的改善。
其他文献
模式匹配技术是计算机领域的研究热点之一。随着网络的发展,模式匹配技术应用广泛于搜索引擎、网络安全和计算生物学等方面。   本文先介绍了当前模式匹配算法的研究现状以
实时操作系统具有对重要性各不相同的任务进行统筹兼顾、合理调度的特点,因此近些年被大量用于嵌入式开发中。在整个实时系统中实时调度算法往往担负着关键控制系统的角色,实
本论文主要提出了一种改进的快速三维凸包构造新算法。在过去几十年凸包算法的研究取得了一系列的进步,如二维的Graham扫描算法,Javis卷包裹(wrapping)算法等等,基于排序的算
随着人工神经网络理论研究的不断深入,因其具有存储、计算和自适应学习等能力,已在许多领域得到广泛应用,利用神经网络模型与算法进行信息处理更是随处可见。MATLAB是当前最
随着我国城市化进程的不断加快,尤其是二十一世纪以来,城市公路交通系统的压力不断加大,传统的人工监控已经不能满足时代发展的需要。因此,智能交通系统的重要性日益显著,特
建筑节能是当今社会普遍关注的热点问题之一,建筑节能控制系统的建立为实现建筑物有效节能提供了一个新的方向。建筑节能控制系统是伴随着智能建筑的发展而产生的,特别与智能
颅骨是人体骨骼中最重要的部分之一,对脑组织起到保护和支撑作用,一旦颅骨缺损或畸形,将给患者的各项生理功能造成障碍。临床上广泛应用的颅骨缺损修复技术主要步骤为借助患
文本聚类是数据挖掘领域中的一个重要分支,尤其在信息量迅速增长的当今社会,文本聚类能够在人们日常的生产生活中起到重要作用。国内外围绕着文本聚类这一课题进行了大量的研
算法与协议成为应用密码学研究的两大重要的组成部分,算法的研究就是通过数学的理论对数据进行加/解密的运算以及对其运算方法进行改进,使其达到现代快速发展的计算机及网络
随着互联网的迅速发展和网络经济的不断繁荣,Web2.0的到来,个人计算机的普及,并行计算、分布式计算、网格计算、P2P计算的发展和融合,一种新的计算模式----云计算应运而生。