论文部分内容阅读
互联网技术和计算机技术的发展促进了世界的发展,让地球上的人们可以在很短的时间内得到比较新的信息,同时也可以得到他人私人信息资料。可以说,网络的发展给我们带来了便利,但同时也给我们带来了不安全的因素。因此,“信息安全”这个词汇也越来越受到人们的重视,关于信息安全方面的产品也越来越多。比如指纹识别技术,瞳孔检测技术、DNA鉴别技术,语音识别技术等都已经慢慢渗入我们的日常生活。其中又属语音识别技术最切合人的日常生活,因为人生活在社会这个大家庭里,时刻都需要对话和交流。
本论文主要讨论了基于嵌入式的语音识别门禁系统的设计,其功能主要是针对特定说话人进行与文本有关的语音识别,识别成功了门禁系统就会打开,否则不给予说话人开门。整个系统是在嵌入式ARM9平台上运行的。
语音识别是针对于人的声音的一种识别技术,又称为声纹识别,它属于“生物因子”的认证范畴。语音识别是指根据某些特征对说话人的声音信号进行辨别的过程。整个过程可以描述为:人们通过机器获取人的声音信号,然后根据一定的原理将该声音信号进行处理,得到声音的特征参数,然后以该特征参数为模板去辨认目标声音信号。
因为语音信号是模拟信号(时间和幅度都是连续的信号),需要对其进行模数转化,转化成计算机能处理的数字信号。转化的方法是对声音信号进行采样和量化处理,然后就得到了数字信号。得到的数字信号还不能体现语音信号的特征,需要采取进一步的处理,包括分帧、标准化、端点检测、预加重和加窗等,称为前端处理。
经过前端处理后,就得到特性比较好的信号,然后对其进行特征参数的提取。特征参数的种类有很多,常用的有线性预测编码、线性预测倒谱系数和Mel倒谱系数,其中Mel倒谱系数是基于人耳听觉系统的,比较能反映声音系统的特征。人的耳蜗可以看成是一个滤波器组,它对频率的滤波是在不同尺度上进行的,它对低频信号的敏感度比高频信号更强。根据该原则,科学家得到了一组类似于耳蜗作用的滤波器,即Mel滤波器组。让语音信号通过该滤波器,然后再对滤波器的输出值作数值处理,并进行离散余弦变换,就得到了MFCC参数。
当我们得到MFCC参数后,接下来就是进行模式匹配算法。模式匹配的方法有很多,比如矢量量化、动态时间规整和隐马尔可夫模型等。本论文重点讨论了动态时间规整算法。动态时间归整算法是一种把时间归整与间距测量计算相结合,产生的一种非线性归整技术。它基于动态规划DP思想,重点解决发音过程中语音长短不一的模板匹配的问题,是出现较早、较经典的一种语音识别算法。当词汇量较少,词条不易混淆时,DTW算法对特定人的语音识别十分有效,可以获得很好的效果,所以在特别是孤立词的语音识别中,DTW算法得到了比较广泛的应用。通过DTW算法,我们可以得到需要的语音模板,然后就可以根据模板来进行语音识别。
本论文设计的语音识别的应用平台是基于ARM9的嵌入式平台,平台的搭建包括两个部分:硬件平台的构建和软件平台的构建。本系统的硬件系统资源包括:微处理器S3C2440、FLASH ROM和SDRAM存储器、音频编码解码芯片UDA1341、触摸屏电路、通信接口(主要是串口)以及LED和按键电路等。嵌入式微处理器(EMPU)是整个电路的核心,负责整个系统的运算处理(各种算术运算和逻辑运算),其频率决定了运算速度的快慢;FLASH存储器负责存放系统启动程序、内核代码、应用程序以及大量的数据等,其大小决定了其存储能力和转换速率;音频编码解码芯片和数模转换器主要负责语音信号的采集和数模转换,是本课题的重要器件;触摸屏电路主要是为用户提供一个良好的人机接口,负责接收用户的命令,以及反馈识别结果,便于用户操作;通信接口电路主要负责PC机与开发板之间的开发调试,是不可缺少的重要部件;LED和按键电路主要是在调试时使用,用以反馈程序的状态和查错。
系统的软件平台基于嵌入式Linux系统。在开源嵌入式操作系统中,用的最为广泛的一个版本就是Linux,它是对于嵌入式系统的一个非常理想的解决方案。最终我们要把Linux移植到硬件平台上,并让语音程序在硬件平台上运行。整个嵌入式系统的安装需要解决几个方面的问题,即Bootloader的编译,Linux内核的剪裁,驱动程序的编写,以及图形界面的编程等。其中Bootloader的版本很多,本系统采用的是U-Boot;驱动程序的编写包括音频驱动程序的编写和触摸屏驱动的编写;图形界面的编程采用的是QT编程,QT提供了一整套的窗口部件,将这些部件组合起来可用于创建可视的用户界面元素,如按钮、菜单、滚动条、消息框和应用程序窗口等。
最后,平台建立好后,先将应用程序通过交叉编译生成嵌入式可执行文件,然后移植到嵌入式系统里。这些应用程序包括前面的语音识别程序和QT图形界面程序。本文对移植成功的嵌入式语音门禁系统进行了测试,并得到了比较满意的实验结果。
综上所述,本论文以面向安保产品的设计为出发点,将市面上较热门的APM-LINUX嵌入式技术与语音处理技术相结合,并通过图形用户界面编程,提出了一种门禁系统的新的应用设计。