基于HMM和ANN的汉语语音非特定人识别

来源 :中国地质大学(武汉) | 被引量 : 0次 | 上传用户：gailuen

【摘要】

：

随着现代计算机技术的发展，人与计算机之间交流的界面早已不局限于鼠标和键盘。越来越多的新的交流手段被引入到计算机中来，而语音数字处理和语音识别技术的进展使语音逐渐成为

【作者】

：

王倩

【机构】

：

中国地质大学(武汉)

【出处】

：

中国地质大学(武汉)

【发表日期】

：

2007年期

【关键词】

：

语音识别隐马尔可夫模型神经网络语音特征参数混合网络

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着现代计算机技术的发展，人与计算机之间交流的界面早已不局限于鼠标和键盘。越来越多的新的交流手段被引入到计算机中来，而语音数字处理和语音识别技术的进展使语音逐渐成为了一种有效的计算机输入手段。与机器进行语音交流，让机器明白你说什么，这是人们长期以来梦寐以求的事情。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高级技术。语音识别技术关系到多学科的研究领域，包括声学，语言学，数字信号处理，计算机科学，人工神经网络等不同领域上的研究成果都对语音识别的发展作出了贡献。语音信号本身的特点造成了语音识别的困难，这些特点包括多变性、动态性、瞬时性和连续性等。计算机对语音识别的过程和人对语音的识别过程基本上一致。目前主流的语音识别技术是基于统计模式识别的基本理论。语音识别所遇到的难题是搜索最佳识别结果和参数训练。人工神经网络中大量神经元并行分布运算的原理、高效的学习算法以及对人的认知系统的模仿能力等都使它极适宜于解决类似于语音识别这一类课题，它既适用于底层又适用于顶层。由于神经网络反映了人脑功能的基本特征，具有自组织性、自适应性、和连续学习的能力。这种网络是可以训练的，即可以随着经验的积累而改变自身的性能。同时由于高度的并行性，它们能够进行快速判决并具有容错性，特别适合于解决像语音识别这类难以用算法来描述而又有大量样本可供学习的问题。本文研究了语音识别中孤立词语音识别的方法和特点，分别对语音信号特征参数LPCC和MFCC的提取进行了分析，通过探讨端点检测对语音识别系统的影响，并结合提高语音识别系统稳健性的方案，对传统的端点检测方法做了一定的改进，采用基于MFCC的距离测量法提高了语音识别系统端点检测方法的准确性。基于语音识别中的倒谱技术，实现了语音识别中LPC、LPCC、MFCC等几种特征参数的提取方法；分析了神经网络建模方法及其特点。同时从HMM模型三个基本问题(评估问题、解码问题、训练问题)着手详细研究了其作为当前语音识别主流模型的基本原理，并对在语音识别中的应用进行了分析。最后在此理论基础上，针对非特定人的汉语孤立词识别问题，研究构造了基于HMM和神经网络建模的语音识别算法。该算法的意义主要在于在以隐马尔可夫模型(HMM)为基本语音模型的基础上，引入BP神经网络进行二次识别，有效的利用了隐马尔可夫模型的强时序信号处理能力和BP神经网络的强模式分类和泛化性能，改善了孤立词识别系统的抗噪性能。以往的算法主要是用传统的DTW或HMM方法，该模型则将神经网络应用于该领域，将HMM模型和神经网络BP模型联合起来应用于语音识别当中，提高了小词汇量非特定人汉语语音的识别率，表明了混合网络在语音识别中的优势。

其他文献

玉米苗期内生细菌的种群初探及有益内生细菌的筛选

植物内生细菌与寄主植物在长期共同进化过程中形成密切的关系，其生存的微环境稳定。它的合理应用将减少化学药剂造成的环境污染，提高农田生态系统的生物多样性。因此如果能从农

学位

玉米内生细菌筛选

遥感图像处理算法并行化研究及实现

遥感图像并行处理是并行处理在遥感技术领域的应用，继承了图像处理算法和并行处理的一般方法，但是遥感数据获取方式和信息内容的特殊性使得遥感图像处理的方法、步骤、方案的选

学位

遥感图像并行处理K-Means算法几何校正算法

基于NGN的业务生成模式及仿真平台的研究

本文首先根据NGN体系结构以及软交换技术的相关理论知识，对NGN业务的运行环境进行建模，搭建NGN业务运行的仿真平台，在Partysip的基础上实现了具备基本功能的软交换和应用服务器，

学位

下一代网络下一代网络业务生成模式业务生成模式冲突检测算法冲突检测算法信令流程图信令流程图

小麦条锈菌细胞壁相关基因的寄主诱导转基因沉默研究

小麦条锈病是世界范围内威胁小麦生产的重要病害之一。鉴定小麦条锈菌（Puccinia striiformis f.sp.tritici）生长发育的关键基因,深入理解条锈菌与寄主的互作机理,对于开发新的

学位

小麦条锈菌寄主诱导转基因沉默几丁质脱乙酰基酶基因小麦遗传转化诱导型启动子

空间信息获取与语义搜索

本文集成了空间Web服务网络搜索算法实现空间数据源的快速定位，同时集成语义搜索技术增强了Portal广义搜索能力，实现了整合的空间信息服务模型。主要研究内容如下： [1]深

学位

空间信息获取语义搜索快速定位空间信息服务

面向NGN的嵌入式家庭网关硬件系统设计和研制

本文论述了面向NGN的嵌入式家庭网关硬件系统设计和研制，此硬件系统是具有下一代网络性质的家庭网关功能的硬件平台。通过分析比较目前各种嵌入式CPU性能，充分论证方案的可行性

学位

下一代网络下一代网络家庭网关家庭网关嵌入式系统嵌入式系统设备驱动程序设备驱动程序

基于TMS320C6713的数字音效处理模块的设计与开发实现

随着科学技术的不断发展与进步，传统的音频领域实现了从模拟到数字的转变，并和IT行业越来越紧密地联系在一起。IT领域的科技成果越来越普遍应用于音频领域(如DSP的发展)，并大大

学位

数字音频处理数字音频处理数字变调数字变调数字均衡数字均衡数字信号处理数字信号处理模块设计模块设计

基于UUV的合成孔径声纳实时处理关键技术研究

合成孔径声纳(Synthetic Aperture Sonar, SAS)是一种高分辨率成像声纳，其基本原理是利用小孔径基阵的移动来获得方位向大的合成孔径，从而得到方位向的高分辨率。无人水下航行

学位

合成孔径声纳信号处理技术无人水下航行器成像质量

合成孔径雷达实时成像算法与实现研究

合成孔径雷达是一种新的成像雷达技术，具有全天候、全天时、远距离、高分辨率成像的能力，在军事和民用方面都有重要的应用价值。本课题结合中科院电子所承担的项目对机载高分辨

学位

合成孔径雷达成像算法杂波锁定自聚焦算法距离徙动校正

宽带OFDM移动通信系统中信道估计技术研究

随着无线多媒体业务、无线网络和移动计算设备的迅猛发展,近年来能支持高速数据传输速率的宽带移动通信系统成为研究热点。正交频分复用(OrthogonalFrequency Division Multi

学位

移动通信正交频分复用信道估计卡尔曼滤波冗余线性预编码

基于HMM和ANN的汉语语音非特定人识别

与本文相关的学术论文