基于统计模型的语音识别系统研究及DSP实现

来源 :电子科技大学 | 被引量 : 5次 | 上传用户:cheng8023jiajia
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别是通过人类说话声音的各种特征,来辨别人类自然语音的语义,或者用来辨别说话人是谁等。随着语音识别系统的发展,语音识别技术被广泛应用到医疗、军事、航空、移动互联网等领域。近年来,随着各项技术的不断突破,嵌入式语音识别系统发展得很快,已经在许多消费电子类产品中出现,它深刻地改变了传统的人机交互模式。识别准确率和鲁棒性是语音识别系统的关键,本文主要从这两个角度来研究孤立词语音识别系统的基本算法和OOV拒识算法的实现,以及系统在DSP平台上的实现。首先,本文对语音识别系统中基本原理和实现技术进行了详细的描述,主要讨论了语音信号的前端处理,前端处理的重点是端点检测,提取语音特征参数。然后论述了语音模型的建立与实现,并重点讨论了HMM的初始化以及如何合并模板参数。其次,语音识别系统的识别结果总是难以避免误识,这会严重影响到系统的鲁棒性和识别准确率,所以需要拒识OOV语音。考虑到在嵌入式平台上系统实现的复杂性和成本,本文选择了基于后验概率特征和LVQ的拒识算法来完成拒识,并提出了用于拒识的特征参数,这几个特征参数能比较好地诠释OOV与IV在后验概率上的不同之处。将类标签和特征参数组成的向量作为输入向量,输入到LVQ网络进行训练,使得LVQ网络具有区分OOV和IV两个类的能力。最后通过不同输入向量训练的网络以及不同的测试集合来测试系统的拒识能力,并给出系统在不同情况下的IV拒绝率及OOV接受率。结果表明,系统在拒绝约2.6%的IV语音的同时,可以拒绝98%以上的OOV语音。最后,在系统相关的算法在PC平台上实现后,研究了孤立词语音识别系统在DSP平台上的实现。首先研究了DSP平台的处理器架构、存储器架构、DSP内部各个芯片之间的连接以及各接口的设置,并特别详细阐述了音频处理芯片的使用方法。然后给出了系统软件的设计流程,并描述了语音识别算法如何从PC平台移植到DSP平台。接着,研究了系统的自举,使得系统能在脱离仿真器和开发环境的情况下运行。最终建立了一套基于DSP的通用孤立词语音识别系统。
其他文献
近些年来无线通信网络高速发展,智能移动终端设备也迅速普及,提供基于位置的服务也逐渐成为这些移动设备的基本功能之一。通过移动终端查找最近邻目标,即最近邻查询,逐渐成为位置
网格中数量众多的资源可能分布于多个不同的信任域中,运行于多种不同的平台和系统之上,采用多种不同的安全机制,如何保障网格环境下安全的互操作是网格安全研究的重要内容之
随着移动互联网以及计算机等相关技术的快速发展,智能移动终端在各行各业得以不断深入和普及。Android操作系统凭借着出色的稳定性和源代码的开放性,不断地提高在智能终端市
入侵检测是一种动态的安全防护手段,它能主动寻找入侵信号,给网络系统提供对外部攻击、内部攻击和误操作的安全保护。入侵检测系统可以记录和禁止网络活动,所以入侵检测系统是防
基于图像的建模与绘制是近些年来兴起的一种新的真实感图形生成技术。IBMR技术是计算机视觉和计算机图形学等学科的综合技术,因此与立体视觉有着密不可分的关系。本文重点研究
VPN(虚拟私有网络)是一种以开放公共网络(Internet)为基础,通过专门的隧道加密技术在公共数据网络上仿真一条点到点的专线技术。利用VPN技术,企业只需要租用本地的数据专线,连接
学位
ATM技术是ITU-T定义的作为B-ISDN的交换技术,具有快速分组交换和统计复用技术的特点,可以有效地支持多种业务(如语音、图像、数据等)。ATM网络优于其它通信网络的一个显著特征
入侵检测技术就是检测企图破坏计算机资源的完整性、保密性和有效性的技术。入侵检测技术已经有20多年的发展历史,在Dorothy Denning提出的通用模型的基础上,人们已经将诸如自
蛋白质构形预测问题就是根据组成蛋白质的氨基酸序列来预测其空间折叠结构。蛋白质是一类重要的生物大分子,是生命活动的主要承担者。只有当组成蛋白质的氨基酸序列折叠成正
Peer-to-Peer技术,也叫P2P计算,是一个新出现的有可能改变下一代Internet架构的研究热点.在P2P系统中,数量巨大的节点(连接在互联网上的电脑)可以聚集在一起共享它们的资源、