基于DSP平台的非特定人孤立词语音识别研究与实现

来源 :北京交通大学 | 被引量 : 1次 | 上传用户：bobby_hong

【摘要】

：

语音交互是人机交互的最重要部分,实现这一目标的最关键技术就是语音识别。然而,由于语音信号的多元性以及对人体识别语音过程模拟的复杂性,使得语音识别的研究无论理论进展

【作者】

：

董威

【机构】

：

北京交通大学

【出处】

：

北京交通大学

【发表日期】

：

2012年01期

【关键词】

：

语音识别 HMM DSP HTK

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

语音交互是人机交互的最重要部分,实现这一目标的最关键技术就是语音识别。然而,由于语音信号的多元性以及对人体识别语音过程模拟的复杂性,使得语音识别的研究无论理论进展还是产品化方面都步履维艰,至今仍有众多充满挑战的课题,而相关的语音识别产品也都难臻完美。时至今日,移动互联网的大潮已经涌来。而语音识别相关产品还大多是基于桌面PC时代。而苹果公司把握时机,刚刚推出了一款名为Siri的语音识别产品,作为其近期发布的iphone4S手机的主打功能,占得了先机。可以预见,基于移动设备平台的语音识别产品在不久的将来就会大量涌现。本课题对基于移动设备处理器的语音识别进行研究分析及优化,并实现一个小型语音识别系统。本课题采用HMM算法,该算法同时考虑声音与音源的概率对应关系及音源元素间的状态转移概率,以一个双随机过程模拟人体对声音的识别,能够实现大词汇量、非特定人、连续语音识别。该算法于上个世纪80年代提出,后由卡内基梅隆大学的李开复博士第一次实现,是语音识别历史上最重大的突破。在此之后,语音识别的算法始终未能脱离HMM框架。HTK即隐马尔可夫模型工具集(HMM Toolkit),由一组C语言形式的库模块和工具组成,用于搭建隐马尔可夫模型。HTK最初由剑桥大学工程系(CUED)研发而成,后被Entropic公司所有,1999年微软收购了Entropic公司,将HTK贡献给了开源社区。如今,微软将HTK授权返还给了剑桥大学工程系,HTK由微软和剑桥大学共同提供开发支持,每个人都可以到HTK3站点免费下载学习。语音识别算法复杂,需要大量的浮点运算,性能要求较高,普通的移动设备处理器难以胜任。而性能较高,尤其适合于浮点运算的DSP处理器正是最佳选择。本课题采用了TI公司的高性能浮点DSP处理器TMS320C6722,并配以音频芯片、扩展存储器等外部设备。实现了一个非特定人、有限词汇量的小型语音识别系统。并对识别结果进行了分析,提出了改进的方向。

其他文献

飞秒强场中四态K2分子的Autler-Townes分裂和波包运动研究

随着激光技术的迅速发展，实验上和理论上有很多关于超快强场原子或分子动力学过程的研究。本文采取飞秒强激光操控分子的Autler-Townes(AT)分裂、波包运动和态布居数。这不仅

学位

四态阶跃型K2分子飞秒激光场光电子能谱波包运动态布居数

散射测量系统设计及实验

微波遥感由于其不受环境和时间限制，具有一定的穿透性等特点，成为地球遥感、月球及深空探测的重要手段。微波遥感分为主动式和被动式，而微波散射计是一种主动式的微波遥感器。本

学位

散射计数据采集Labview散射测量

基于FPGA的巴布剂涂布质量检测系统的研究

伴随着经皮治疗系统(Transdermal Therapeutic Systerms简称TTS)医药市场的不断拓广,为了保证产品质量、提高产品生产效率,制作出一套工业化、自动化和智能化的贴剂成型设备,

学位

FPGA质量检测视频图像模糊算法Verilog HDL

浅谈小学数学课堂教学有效性提问

本文通过对荣华二采区10

期刊

低轮廓天线尺寸缩减技术研究

目前无线通信技术的发展和各种通信标准的日益兴起，无线产品的功能变得越来越复杂，一般可以支持多个频段不同通信标准。无线产品内部的电路也更加复杂，在无线终端产品设计时给天

学位

基片集成波导背腔缝隙天线小型化射频识别

探究小学数学教学工作中存在的问题

本文通过对荣华二采区10

期刊

智能视频监控系统的遗弃物检测算法研究

近年来,视频监控系统越来越多的应用于各种行业、各种场所,因此对视频监控技术的研究越来越深入。视频监控系统中的运动目标检测、运动目标跟踪和遗弃物识别技术因其广泛的应

学位

混合高斯模型阴影鬼影跟踪遗弃物检测

β1，4半乳糖基转移酶1促凋亡途径及其影响CDK11<'p58>促凋亡作用的研究

β1,4半乳糖基转移酶1(beta-1,4 galactosyltransferase,β1,4GT1)是最早被克隆的一种糖基转移酶。由于翻译起始位点的不同,表达β1,4GT1的基因编码两个相似的蛋白,短型β1,4

学位

β14半乳糖基转移酶1CDK11p58凋亡CHXEGFRPKBAktJNKsBcl-2

基于DSP平台的非特定人孤立词语音识别研究与实现

与本文相关的学术论文