基于VQ和DTW相结合的语音识别算法研究

被引量 : 0次 | 上传用户:liongliong547
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别研究工作起步于20世纪50年代,经过将近70年的研究工作,在关键技术方面,迄今已有很大的突破。目前高识别率的语音识别机器主要是以计算机为硬件核心,辅以软件算法实现,因此系统较为庞大,为了减小体积,降低成本,同时满足高识别率的实际应用要求,下一代的语音识别机器将以专用DSP处理器为核心集成的语音识别系统,所以研究与DSP处理相匹配的语音识别的算法是有现实意义的。本文设计和构建了基于DSP的说话人实时识别系统,在进行算法研究改进的同时,也进行了相关硬件电路的设计,用来对改进算法的验证工作,完成了说话人语音实时识别,本文所做的具体工作如下:先研究了语音识别算法的原理及通用结构,讨论了语音识别的关键技术;然后研究了基于矢量量化(VQ)和动态时间规整(DTW)的语音识别算法原理。并给出了完成语音识别所必须包含的三个阶段,即语音信号的预处理阶段、特征参数提取阶段和语音识别阶段;随后根据孤立词语音识别的特点,提出了一些新的方法和在现有基础上加以改进的算法。在说话人语音预处理方面,提出了新型自适应调节的动态窗长和新型语音端点检测方法,并将二者有机结合来进行纯洁语音段的选取,来提高语音处理速度和语音端点检测精确;在语音识别方面,提出改进后的矢量量化(VQ)和动态时间规整(DTW)等识别算法,并将二者相结合,以适于TMS320C5402 DSP语音处理芯片应用;最后论述了用于DSP处理器实现的算法原理,并给出了基于DSP处理器的算法流程;以TMS320C5402 DSP为核心器件,并扩展外围系统模块,语音信号采集电路,设计制作了语音识别实验系统,用以完成特定人小词汇量的语音识别;实验结果表明,这些改进后的算法不仅可适合DSP快速处理,而且能够保证识别率,获得较好的效果。
其他文献
众所周知,市场经济是法治经济也是信用经济。市场交易活动对信用要求非常高,在国际贸易领域尤其如此。正是由于国际贸易的特殊性,使出口商在出口收汇等方面具有比国内贸易更为巨
综观世界文坛,从事文学创作的人古往今来便不仅仅局限于文学专业的人。而从我国五四时期新文化运动伊始,鲁迅、胡适、郭沫若等人有着学习医学、农学等西方科学的背景,最终却
背景和目的广泛性全子宫切除术(RH,Radical hysterectomy)和双侧盆腔淋巴结清扫术(PL,Pelvic lymphadenectomy)是治疗Ⅰb-Ⅱa期宫颈癌的主要手术方法。而下尿道功能障碍是宫颈
21世纪的竞争是人才综合素质的竞争,传统的许多教学方式、方法已越来越不适应人才培养的需要。我国新一轮基础教育课程改革的一个重要目标就是要提高学生的学习能力,倡导学生
系统的不定期刑制度滥觞于新派(刑事人类学派与刑事社会学派)对旧派(刑事古典学派)的批判之中,是教育刑与刑罚个别化的强调,表现为裁判时不予确定具体的自由刑执行期限,而是
半夏Pinellia ternata(Thunb)Briet为天南星科多年生草本植物,以干燥块茎入药,性温、味辛、有毒,是我国传统的中药材。近些年,生态环境不断破坏,野生半夏采挖严重,半夏野生资源急剧
随着移动互联网和共享经济的快速发展,网约车的出现更加方便人们出行,弥补了城市公共交通的不足,但是其处在法律的边缘,挤压了传统出租车行业,引发很多地方传统出租车的罢工
本课题来源于贵州高强度螺栓厂生产实际,针对高强度细腰螺栓在常温条件下,螺栓细腰杆部成形工艺方法难及加工表面质量不高的情况开展课题研究。通过在贵州螺栓厂和中国航空工业
对气候变化的模拟与预测是全球的热点问题。随着气候预测理论以及计算机技术的不断发展,耦合气候模式已成为数值气候预测的主流发展方向。软件框架通过提取领域的公共特征、
自2009年新医疗改革提出开始,国家正逐步引导国内医药卫生行业构建起与社会主义市场经济体制相匹配的管理、运行机制。加强推进医院会计核算体制的变革,尤其是要把成本核算与