基于动态词表的孤立词语音识别系统的DSP实现

来源 :北京邮电大学 | 被引量 : 2次 | 上传用户:yintaozhy1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别是模式识别领域的一个重要的研究课题,它的发展将会对未来的人机交互界面带来极大的影响。而在语音识别的研究中,基于动态词表的嵌入式语音识别仍然是具有挑战性的一个课题。目前虽然已有许多嵌入式语音识别系统问世,但是其性能还远远达不到大规模应用的要求,对于它的进一步研究具有重要的实际意义。本文以开发“基于动态词表的孤立词语音识别系统的DSP实现”为目标,对基于动态词表的孤立词语音识别模块进行研究和开发,使其具有训练步骤简化、增加识别内容方便,具有较高的孤立词识别率和较快的识别速度等特点,改变逐个内容训练的传统方式,使应用更方便、更人性化。首先,本文详细地介绍了语音识别的基本理论以及HMM在语音识别中的应用。其次,本文系统地介绍了基于动态词表的孤立词DSP语音识别系统的功能要求和结构设计,并概要地介绍了嵌入式DSP芯片的发展及特点。然后,本文介绍了该系统的具体实现方案,组成系统的各个模块以及系统各个模块在移植过程中的定点化和程序优化方案。训练模块,用HTK训练出基本声学单元模型,训练集是大词汇量连续语音,生成HTK标准格式的声学模型文件。在本系统中我们直接采用已经经过HTK训练的声学单元模型。参考模式库生成模块,这里包括了词典编辑、自动标注和参考模式库生成部分。参考模式库是以词典的标注文件作为索引,由基本声学单元模型的动态拼接而成的,即动态拼接生成词模型的过程。考虑到DSP内存空间有限,本文采取分割声学模型,分成两个部分,逐个载入的方式将声学模型调入DRAM中。对声学单元采用状态和模型混合的方式建立索引,由于61个模型的183个状态在总的帧数下占用空间很大,如何存储这部分数据,程序最后采用了向DSP的一个固定地址空间写入数值的办法解决了这个问题。语音信号处理和识别模块,语音信号处理包括了端点检测、特征提取等关键处理过程,识别过程是语音信号的特征向量和参考模式做相似性度量的过程。最后,本文还介绍了实现系统的过程中遇到的问题及解决方案,并对今后的工作提出了展望。
其他文献
近年来,随着世界民航业的发展,空中交通越来越繁忙,特别是在出现天气(大雾、雷雨、大风等)和意外事故时,造成机场飞机大量囤积,需要在短时间内离港,会造成机场的空中交通拥挤。
随着计算智能技术的迅速发展,计算智能技术在各种泵站的控制、优化调度中得到了广泛的应用。大型污水输送泵站在城市污水排放系统中担负着重要的任务,降低泵站的能源消耗,采用先
近年来,嵌入式Internet远程测控系统己成为计算机控制领域一个重要组成部分,并成为新兴的研究热点。通过嵌入式Internet控制系统用户只要在有网络接入的地方,就可以对与网络
如今,“造物”成为STEAM教育、创客教育的目标,那么是不是学生只要有想法就能够顺利造物成功呢?学生在造物过程中要具备哪些能力?教师及教育工作者又应该如何培养学生这方面
期刊
期刊
目的:探讨低分子肝素(LMH)抗凝治疗对慢性肺源性心脏病失代偿期(LCPCPHD)血清D-二聚体(D-D)、凝血因子Ⅷ相关抗原(ⅧR:Ag)及凝血因子Ⅷ(Ⅷ:C)的影响.方法:将70例LCPCPHD患者
近期翻阅一些调查研究报告,总感到其中存在一个比较突出的问题,那就是有效的、有意义的调查指标(或者说调查内容)不多,雷同的、无足轻重的调查指标倒是不少。
植物是地球上物种数量最多、分布最广泛的生命形式,影响着人类赖以生存的生态系统。植物也是人类生存与发展的重要的资源,是人类生产和生活必需的资源。同时,植物与农业有着密切
本论文对开关磁阻电机的一种相对精确的非线性建模方法进行了分析,指出该模型参数的一种选择方法和该模型的局限性;指出另一种含指数项的磁链建模方法的局限性。文中指出了选择开关磁阻电机拟合数学模型时需要考察的条件,为粗选适合样机的拟合模型提供了一定程度上的参考。 在开关磁阻电机先进控制策略研究的第一步——样机的非线性建模完成的基础上,对其非线性控制策略进行了探讨。将一种非线性控制策略——逆系统方法应
在实施多层建筑工程施工过程中,地基基础施工是整个建筑工程最主要的构成部分,地基基础施工质量如何除了直接影响着整个建筑工程的质量,还影响工程的投资利润和施工进度.在实