嵌入式语音门禁系统的设计与实现

来源 :中国地质大学(武汉) | 被引量 : 0次 | 上传用户:sunyanzi168168168
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网技术和计算机技术的发展促进了世界的发展,让地球上的人们可以在很短的时间内得到比较新的信息,同时也可以得到他人私人信息资料。可以说,网络的发展给我们带来了便利,但同时也给我们带来了不安全的因素。因此,“信息安全”这个词汇也越来越受到人们的重视,关于信息安全方面的产品也越来越多。比如指纹识别技术,瞳孔检测技术、DNA鉴别技术,语音识别技术等都已经慢慢渗入我们的日常生活。其中又属语音识别技术最切合人的日常生活,因为人生活在社会这个大家庭里,时刻都需要对话和交流。   本论文主要讨论了基于嵌入式的语音识别门禁系统的设计,其功能主要是针对特定说话人进行与文本有关的语音识别,识别成功了门禁系统就会打开,否则不给予说话人开门。整个系统是在嵌入式ARM9平台上运行的。   语音识别是针对于人的声音的一种识别技术,又称为声纹识别,它属于“生物因子”的认证范畴。语音识别是指根据某些特征对说话人的声音信号进行辨别的过程。整个过程可以描述为:人们通过机器获取人的声音信号,然后根据一定的原理将该声音信号进行处理,得到声音的特征参数,然后以该特征参数为模板去辨认目标声音信号。   因为语音信号是模拟信号(时间和幅度都是连续的信号),需要对其进行模数转化,转化成计算机能处理的数字信号。转化的方法是对声音信号进行采样和量化处理,然后就得到了数字信号。得到的数字信号还不能体现语音信号的特征,需要采取进一步的处理,包括分帧、标准化、端点检测、预加重和加窗等,称为前端处理。   经过前端处理后,就得到特性比较好的信号,然后对其进行特征参数的提取。特征参数的种类有很多,常用的有线性预测编码、线性预测倒谱系数和Mel倒谱系数,其中Mel倒谱系数是基于人耳听觉系统的,比较能反映声音系统的特征。人的耳蜗可以看成是一个滤波器组,它对频率的滤波是在不同尺度上进行的,它对低频信号的敏感度比高频信号更强。根据该原则,科学家得到了一组类似于耳蜗作用的滤波器,即Mel滤波器组。让语音信号通过该滤波器,然后再对滤波器的输出值作数值处理,并进行离散余弦变换,就得到了MFCC参数。   当我们得到MFCC参数后,接下来就是进行模式匹配算法。模式匹配的方法有很多,比如矢量量化、动态时间规整和隐马尔可夫模型等。本论文重点讨论了动态时间规整算法。动态时间归整算法是一种把时间归整与间距测量计算相结合,产生的一种非线性归整技术。它基于动态规划DP思想,重点解决发音过程中语音长短不一的模板匹配的问题,是出现较早、较经典的一种语音识别算法。当词汇量较少,词条不易混淆时,DTW算法对特定人的语音识别十分有效,可以获得很好的效果,所以在特别是孤立词的语音识别中,DTW算法得到了比较广泛的应用。通过DTW算法,我们可以得到需要的语音模板,然后就可以根据模板来进行语音识别。   本论文设计的语音识别的应用平台是基于ARM9的嵌入式平台,平台的搭建包括两个部分:硬件平台的构建和软件平台的构建。本系统的硬件系统资源包括:微处理器S3C2440、FLASH ROM和SDRAM存储器、音频编码解码芯片UDA1341、触摸屏电路、通信接口(主要是串口)以及LED和按键电路等。嵌入式微处理器(EMPU)是整个电路的核心,负责整个系统的运算处理(各种算术运算和逻辑运算),其频率决定了运算速度的快慢;FLASH存储器负责存放系统启动程序、内核代码、应用程序以及大量的数据等,其大小决定了其存储能力和转换速率;音频编码解码芯片和数模转换器主要负责语音信号的采集和数模转换,是本课题的重要器件;触摸屏电路主要是为用户提供一个良好的人机接口,负责接收用户的命令,以及反馈识别结果,便于用户操作;通信接口电路主要负责PC机与开发板之间的开发调试,是不可缺少的重要部件;LED和按键电路主要是在调试时使用,用以反馈程序的状态和查错。   系统的软件平台基于嵌入式Linux系统。在开源嵌入式操作系统中,用的最为广泛的一个版本就是Linux,它是对于嵌入式系统的一个非常理想的解决方案。最终我们要把Linux移植到硬件平台上,并让语音程序在硬件平台上运行。整个嵌入式系统的安装需要解决几个方面的问题,即Bootloader的编译,Linux内核的剪裁,驱动程序的编写,以及图形界面的编程等。其中Bootloader的版本很多,本系统采用的是U-Boot;驱动程序的编写包括音频驱动程序的编写和触摸屏驱动的编写;图形界面的编程采用的是QT编程,QT提供了一整套的窗口部件,将这些部件组合起来可用于创建可视的用户界面元素,如按钮、菜单、滚动条、消息框和应用程序窗口等。   最后,平台建立好后,先将应用程序通过交叉编译生成嵌入式可执行文件,然后移植到嵌入式系统里。这些应用程序包括前面的语音识别程序和QT图形界面程序。本文对移植成功的嵌入式语音门禁系统进行了测试,并得到了比较满意的实验结果。   综上所述,本论文以面向安保产品的设计为出发点,将市面上较热门的APM-LINUX嵌入式技术与语音处理技术相结合,并通过图形用户界面编程,提出了一种门禁系统的新的应用设计。
其他文献
多播业务量疏导是光网络多播研究的一个重要方面,由于光网络中大部分业务请求的带宽需求与一个波长的带宽相比都比较小,如果为每个业务请求分配一个独立的波长信道,不可避免
轮询系统作为一类重要的控制模型在自动工业控制、计算机时分复用、通信系统协议、计算机网络协议以及军工等领域,由于其控制方式的公平性、实用性而得到了普遍的应用。但原有
高性能同轴电缆接入系统(HINOC)是利用现有广播电视传输网络,使用同轴电缆带外信道进行数据传输的下一代广播电视系统。为了提高传输效率,要求在16MHz信道带宽上达到100Mbps的
经过五十多年的发展,自动语音识别技术已从孤立词识别发展为大词汇量连续语音识别。然而,目前机器的识别性能仍然无法与人相比,其主要原因之一是人在语音识别过程中综合利用了多
学位
目前,恶性肿瘤已成为危害人类身体健康最严重的疾病之一。据有关中国人口死亡原因调查结果表明,恶性肿瘤死因位居致死原因的第一位。常见的恶性肿瘤主要有食管癌、肺癌、胃癌、
该论文主要针对OFDM系统在未来高速无线通信系统中的应用,研究其中的若干关键技术,包括:1.分集技术在OFDM系统中的应用.相比于编码、调制和均衡技术来说,分集技术是对抗衰落
随着天基综合信息网建设的提出,空天一体化正成为空天领域发展的基本趋势,如何实现空天各种飞行器之间、飞行器与地面之间的时间同步,使得各系统在统一时间下协同工作,成为空
学位
本论文基于虚拟仪器的思想,开发了一种基于USB接口的多通道数据采集,控制和处理系统。系统主要包括硬件采集平台,USB接口及其驱动程序,以及作为虚拟仪器核心的应用层软件。系统硬
宽带雷达信号具有强抗干扰性、强反隐身能力、高距离分辨力和低截获概率等一系列优点,在越来越多的雷达系统中得到运用。因此,针对宽带信号的测向技术正成为近年来电子侦察领
学位
自1959年美国英格伯格和德沃尔制造出世界上第一台工业机器人以来,机器人就走入了人们的视线,教育领域是机器人应用的一个重要方面。目前市场上存在的教育机器人普遍存在功耗大