基于DSP平台的非特定人孤立词语音识别研究与实现

来源 :北京交通大学 | 被引量 : 1次 | 上传用户:bobby_hong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音交互是人机交互的最重要部分,实现这一目标的最关键技术就是语音识别。然而,由于语音信号的多元性以及对人体识别语音过程模拟的复杂性,使得语音识别的研究无论理论进展还是产品化方面都步履维艰,至今仍有众多充满挑战的课题,而相关的语音识别产品也都难臻完美。时至今日,移动互联网的大潮已经涌来。而语音识别相关产品还大多是基于桌面PC时代。而苹果公司把握时机,刚刚推出了一款名为Siri的语音识别产品,作为其近期发布的iphone4S手机的主打功能,占得了先机。可以预见,基于移动设备平台的语音识别产品在不久的将来就会大量涌现。本课题对基于移动设备处理器的语音识别进行研究分析及优化,并实现一个小型语音识别系统。本课题采用HMM算法,该算法同时考虑声音与音源的概率对应关系及音源元素间的状态转移概率,以一个双随机过程模拟人体对声音的识别,能够实现大词汇量、非特定人、连续语音识别。该算法于上个世纪80年代提出,后由卡内基梅隆大学的李开复博士第一次实现,是语音识别历史上最重大的突破。在此之后,语音识别的算法始终未能脱离HMM框架。HTK即隐马尔可夫模型工具集(HMM Toolkit),由一组C语言形式的库模块和工具组成,用于搭建隐马尔可夫模型。HTK最初由剑桥大学工程系(CUED)研发而成,后被Entropic公司所有,1999年微软收购了Entropic公司,将HTK贡献给了开源社区。如今,微软将HTK授权返还给了剑桥大学工程系,HTK由微软和剑桥大学共同提供开发支持,每个人都可以到HTK3站点免费下载学习。语音识别算法复杂,需要大量的浮点运算,性能要求较高,普通的移动设备处理器难以胜任。而性能较高,尤其适合于浮点运算的DSP处理器正是最佳选择。本课题采用了TI公司的高性能浮点DSP处理器TMS320C6722,并配以音频芯片、扩展存储器等外部设备。实现了一个非特定人、有限词汇量的小型语音识别系统。并对识别结果进行了分析,提出了改进的方向。
其他文献
随着激光技术的迅速发展,实验上和理论上有很多关于超快强场原子或分子动力学过程的研究。本文采取飞秒强激光操控分子的Autler-Townes(AT)分裂、波包运动和态布居数。这不仅
微波遥感由于其不受环境和时间限制,具有一定的穿透性等特点,成为地球遥感、月球及深空探测的重要手段。微波遥感分为主动式和被动式,而微波散射计是一种主动式的微波遥感器。本
伴随着经皮治疗系统(Transdermal Therapeutic Systerms简称TTS)医药市场的不断拓广,为了保证产品质量、提高产品生产效率,制作出一套工业化、自动化和智能化的贴剂成型设备,
本文通过对荣华二采区10
期刊
目前无线通信技术的发展和各种通信标准的日益兴起,无线产品的功能变得越来越复杂,一般可以支持多个频段不同通信标准。无线产品内部的电路也更加复杂,在无线终端产品设计时给天
数控装备和数控技术是现代制造业工业化的重要基础,是一个国家制造业的高技术水平的重要标志。长期以来,国产数控机床处于高档产品需要大量进口,中层次产品发展非常缓慢,低档
本文通过对荣华二采区10
期刊
随着电源技术的不断发展,高频化和高功率密度化已成为开关电源系统的研究方向和发展趋势。变压器是开关电源的核心部件,是决定开关电源性能和稳定性的重要因素,随着工作频率
近年来,视频监控系统越来越多的应用于各种行业、各种场所,因此对视频监控技术的研究越来越深入。视频监控系统中的运动目标检测、运动目标跟踪和遗弃物识别技术因其广泛的应
β1,4半乳糖基转移酶1(beta-1,4 galactosyltransferase,β1,4GT1)是最早被克隆的一种糖基转移酶。由于翻译起始位点的不同,表达β1,4GT1的基因编码两个相似的蛋白,短型β1,4