语音识别关键技术研究及系统实现

被引量 : 0次 | 上传用户:niehaibin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别是让机器“听懂”人类语音,并做出正确反应,其终极目标是实现人类与机器的自然交流。随着科学技术的发展,语音识别技术正逐步形成一套比较完整的理论体系,其实用产品也相继推出,但由于各个领域需求不同,往往需要进行针对性开发。语音识别技术发展的两个重要方向是基于PC机的大词汇量识别和嵌入式的语音识别,都有广阔的市场前景。为此,对语音识别关键技术进行研究,提出一种新的识别算法——遗传动态时间规划算法(GA_DTW),与传统的动态时间规整算法相比,新算法具有较优的全局搜索能力和并行计算的特点,实验结果证明了该算法的有效性,孤立词的识别率达到95.07%;根据GA_DTW算法,设计了基于嵌入式的小型语音识别系统,将新算法运用于该系统,系统测试取得了良好的结果。其主要研究工作如下:(1)分析语音识别的基础理论,包括语音的基本组成、汉语语音特性、数字模型、语音信号采样、预加重、加窗、分帧、端点检测以及特征参数提取;针对语音预处理中最重要的端点检测,提出一种改进型端点检测算法——双动态语音端点检测算法,实验表明该算法具有更好的检测性能;在分析线性预测倒谱系数(LPCC)和美尔频率倒谱系数(MFCC)的特点后,选用MFCC作为研究的特征参数,并提取了该参数。(2)研究目前三种主流的语音识别算法:动态时间规整(DTW)、隐马尔科夫模型(HMM)和人工神经网络(ANN)。分析它们的原理、特点及实现过程,对DTW的语音识别进行实验,通过对比分析三种算法的特点,结合本文研究的实际情况,选择DTW作为研究的重点,提出利用遗传算法对其进行改进。(3)在分析遗传算法的基础上,利用其优越的全局搜索能力和并行计算的特点,对传统的DTW算法进行改进,提出遗传动态时间规划的识别算法;重点研究该算法的实现机理、编码方式、适应度函数设计、种群初始化、选择机理、交叉运算、变异操作和终止策略,并进行实验验证,实验结果表明了该算法的有效性和高效性。(4)基于GA_DTW算法,设计了一个以SPCE061A单片机为核心的小型嵌入式语音识别系统,从硬件设计和软件设计两方面进行分析,用C语言实现了GA_DTW算法,进行了系统测试,测试结果良好。
其他文献
加强部门之间的协调与合作是我国政府当前阶段的发展要求,海事管理中部门之间的合作尤为重要。本文重点介绍了中国海事管理跨部门协作的现状,针对我国海事管理的现实情况,指
目的探讨不同时机进行连续性肾脏替代治疗(CRRT)对严重脓毒症患者白细胞介素-10、人白细胞DR抗原及预后的影响。方法选择2010年1月—2012年6月我院重症医学科收治的并接受连
班级凝聚力是指班级成员在班级团体中获得了心理满足后对团体产生的向往倾向或亲和力。研究大学班级的凝聚力,有利于形成优良班风、学风、校风,有利于为学校教育提供一定的理
进出口贸易量能够反映出一个地区经济发展的程度。银行结售汇量是银行外汇业务发展程度的标志,两者在理论上存在正相关关系。但历年数据表明,银行贸易结售汇顺差一直高于进出
目前3G技术在不断发展,国际和国内运营商纷纷进行3G业务的开发、实现与推广,手机视频因其内容的多样性而成为运营商青睐的重点发展业务之一。手机视频,也叫移动视频。它是指
危险品道路运输是运输市场的一个重要组成部分,随着社会的迅速发展和市场经济的不断深入,国内外对危险品的需求日益增加。为了避免发生危险品道路运输事故并在事故发生后及时
目的探讨使用固定矫治器进行口腔正畸治疗的护理方法,总结相关护理体会。方法通过对126例固定正畸治疗患者的护理配合,总结固定正畸治疗护理的工作要点。结果 126例固定正畸
本文以历史发展为线索,认为行政责任伦理内在价值向度转换的历史轨迹经历了威尔逊的"无道德行政"、马克斯.韦伯的个体先在的责任伦理、罗尔斯的社会道义的公共责任伦理、后罗
本文以政府和市场力量的大小之比为自变量,以政策工具的强制程度为因变量,提出了政策工具创新的分析框架,并以当代中国城市户口迁移制度的变迁为例,分析其政策工具从强制变为