非特定人汉语数码语音识别研究及嵌入式系统实现

来源 :汕头大学 | 被引量 : 0次 | 上传用户:s04325102
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别是模式识别和人工智能的一个重要领域,是计算机科学、信号处理、生理学、心理学等多学科研究的热点问题。目前,语音识别技术方面的研究逐渐从实验室研究阶段进入实用化研究阶段。随着智能化电子产品开发的需求提高和嵌入式技术的发展,迫切需要将语音识别技术应用于基于嵌入式系统平台的智能电子产品,以提升产品的市场价值和易操作性。现有的语音识别算法计算复杂度和空间复杂度较高,而嵌入式平台的可用资源有限,需要对算法进行改进,在保证一定识别率的前提下降低算法计算复杂度,以适合嵌入式平台的应用。此外,为了增加产品的通用性,免去每次重新训练,语音识别最好可以针对非特定人并且对集外数据有效。针对上述问题,本文对非特定人汉语数码的语音识别相关算法进行研究,提出相应的改进算法,并将该算法应用于嵌入式系统,实现了一个语音拨号系统。论文的主要研究内容包括:  首先,利用隐马尔科夫工具包(HTK)搭建了一个语音识别系统,并分别针对孤立词与连续词、集内数据和集外数据等多种情况开展实验。  其次,研究了语音信号去噪、特征提取(如线性预测频率倒谱系数LPCC和Mel频率倒谱系数MFCC)、声学单元选取、参数捆绑和高斯混合元数目等对识别率的影响。  再次,对现有语音识别算法进行优化设计,提出适用于嵌入式平台的语音识别算法。在PC机上针对连续词语音识别对该算法进行仿真实验,结果表明,集内识别率达97.50%,集外识别率达96.83%,识别时间也有所减少。  最后,将所提出的语音识别算法应用于嵌入式平台(友善之臂开发板Mini6410),实现了一个嵌入式语音拨号系统。完成了Linux内核移植、Qt/Embedded移植、HTK移植、Perl移植等嵌入式开发环境的搭建和语音信号采集所涉及的音频接口和音频驱动、GPRS模块的通信控制、嵌入式拨号系统GUI的Qt实现等的开发。对所设计的语音拨号系统进行测试,结果表明对数字串的识别率高达98.3%而识别每个数字时间仅为3.15s,基本满足实际产品对识别准确率和实时性的要求。
其他文献
本文介绍了一种基于ARM的数据处理和显示系统,该系统用于列车控制系统中,将列车数据和相关信息通过人机交互界面传递给列车驾驶员。由于机车所处的环境复杂,所以对于相关设备
随着新能源技术的空前发展,风力发电技术被提到了一个全新的高度。采用铅酸蓄电池存储电能,作为风力发电机安全运行的重要保障,它位于发电机轮毂中,为发电机工作提供后备电源。本智能充电器配套风力发电机控制系统中,完成对蓄电池的全自动充电。本课题基于企业实际产品需求,研究和开发了一种专用于风力发电机轮毂中的铅酸蓄电池智能充电器,为风力发电机的控制系统进行设备配套,实际完成了系统硬件电路、控制程序、测试验证的
随着互联网络和视频技术的快速发展,出现了越来越多的移动视频设备,比如个人平板电脑、移动相机、摄像机、无线监控器和传感器等,这些设备不仅处理能力和功耗等资源十分受限,而且
随着无线通信技术的迅速发展,多种无线接入网络共存在生活中,形成了异构网络。由于异构网络的复杂性,终端需要面对不同的接入技术、多样化的业务类型和不同的用户需求,因此就需要
现如今随着无线网络技术的成熟和发展,车载自组织网络(Vehicular Ad HocNetwork, VANETs)已经成为智能交通系统领域中的研究热点。与传统的Ad Hoc网络不同,车载自组织网络具有
模型拟合是计算机视觉领域热点问题。该项技术在计算机视觉领域有着广泛的应用,如单应性变换矩阵和基础矩阵的估计、图像分割和运动估计等。近年来随着应用的需要,模型拟合技术
随着互联网规模的扩大,互联网上的应用和用户数都在飞速增长,拥塞已成为一个相当重要的问题。网络中,流量需求的资源大于网络自身容量时,会导致拥塞的发生。通过对拥塞进行管
汽车工业是我国的主导产业之一,车用燃料是石油消费的主要群体,用于汽车的石油量占到石油总消耗量的50%以上。随着石油、天然气等优质能源逐步枯竭,新能源的开发利用还没有重大
心脏是人体的重要器官,而心脏疾病一直是危害人类健康的主要疾病之一,成为关注和研究的热点。心电信号是心脏电活动的真实记录,评价心脏功能的重要依据,成为医学临床上检测和
在应对自然灾害和社会突发事件中,应急通信有着不可替代的重要作用。各种新兴无线通信技术的发展为组建应急通信系统提供了更多的选择,无线Mesh网络因其结构灵活、组网简单等特