基于嵌入式的声纹识别系统研究与实现

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:Huigle
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
声纹同指纹、掌纹和虹膜等一样,是每个人特有的生物特征,从某种意义上说也是人体的一张“身份证”。声纹识别作为一种新的生物特征识别技术,以其独有的经济、方便等优点在司法刑侦、系统安全认证、电话银行、国防安全等领域得到了广泛地应用,特别是在语音通信中的关键说话人检索及身份验证具有独一无二的优势。一个基本的声纹识别系统包括说话人特征提取和模式匹配两大部分。特征提取是指如何快速的从大量语音信号中,提取出最能代表说话人个性的有效且稳定可靠的特征参数;模式匹配则是指在提取特征参数后,训练时采用某种方法为说话人建立相应的模型或模板,在识别时则把未知信号与已有模型进行某种相似距离判断并出结果。   本文在分析了声纹识别常用的相关原理与技术基础上,重点研究了基于Mel倒谱系数(MFCC)的特征参数提取和矢量量化(VQ)的建模方法,并针对其中的某上不足之处进行相应地改进。最后在基于ARM9和WinCE嵌入式平台上实现了一个小容量的声纹识别系统。在前人的基础上,本文的相关改进工作主要包括以下三个方面:   1.特征提取方面:对目前应用最广泛的标准MFCC存在的不足,进行相应改进,提出加权差分组合MFCC特征参数。用短时帧能量和短时加权过零率代替MFCC中有负识别作用的第1、2阶分量,并根据MFCC中各分量的不同贡献率进行加权,然后进行一阶差分,最后将其组合构成新的特征参数。   2.矢量量化方面:采用码本分裂法的LBG算法进行最佳码本设计,对计算过程中产生空胞腔的问题,使用最大胞腔分裂法进行优化处理,以提高算法效率和码本质量。此外,对正确的识别结果加入手动更新码本这一步,一方面相当于增加了训练量,另一方面在某种程度上实现了码本的自适应性。   3.嵌入式系统实现方面:针对嵌入式系统资源相对有限的条件,在实现过程中进行了一些优化处理。包括WinCE操作系统的优化定制与移植;采用短时帧能量和短时加权过零率双门限进行有效语音端点检测以减少计算量;对于需复杂运算的帧能量、距离测量及差分计算等,采用相对简单计算方法等。   最后对系统进行了相关的实验测试,实验结果表明,系统对相同文本内容的识别具有较高的识别率,对文本无关的识别率则有待提高:采用改进后的特征参数,系统的平均识别率提4%左右。
其他文献
切换系统是一类特别而又重要的混杂系统,它由一系列子系统(连续子系统或者离散子系统)和子系统之间的切换规则所组成。连续子系统、离散切换信号和时滞共存于时滞切换系统,它
具有Markov跳跃参数的混合系统模型能够很好地描述大量具有随机切换结构的实际系统,因而一直受到控制界的广泛关注。在工业生产和网络通讯等系统中,时滞与不确定性因素始终存
吊舱的工作环境异常恶劣,诸如载机姿态的变化、高频振动以及飞行中的风阻力矩等因素都会造成视轴指向的不稳定,从而对吊舱中清晰成像产生不良影响。为了克服这些影响,需要在
本文以中国某大学肠溶性胶囊专利的成果转化项目为背景,研制肠溶性胶囊壳生产线自动控制系统。在了解胶囊制造业国内外现状的基础上,通过对伺服控制系统相关知识学习,深入研究了肠溶性胶囊生产线的几个关键环节,开发了一套全新的基于PLC和触摸屏的网络化控制系统,实现了肠溶性胶囊壳全自动化生产与管理。具体研究内容如下:首先,针对肠溶性胶囊壳在生产过程中运动过程多、定位精度高、响应速度快等特点,研究了基于CAN总
联盟运输调度问题(Allied Vehicle Routing Problem,AVRP)是物流联盟架构下的运输调度的最优化,具有重要的理论意义和应用价值。   本文对基本的联盟运输调度问题进行扩展
随着信息化程度的日益提高,Internet技术已经与人们的生活息息相关。一方面网络用户的数量呈爆炸式的增长,另一方面出现了许多新业务如话音、图像等多媒体信息,并且实时多媒
伴随信息技术的发展,信息技术在企业的日常管理中地位越来越突出,应用的范围也越发的广泛。与此同时企业管理水平的发展以及管理机制的科学化,也使得信息技术在企业信息管理
作业车间调度是制造系统生产过程中的一个重要组成部分。合理的调度方法与优化技术的研究和应用对提高企业的生产效率、减少生产损耗、增强资源优化配置能力有着重要的作用。
PCI总线与PROFIBUS-DP总线技术在众多领域得到广泛应用,本文针对市面上具有PCI接口的PROFIBUS-DP产品的价格比较昂贵,以及实验室调试项目时的实际需求,设计了一款基于PCI总线
自从数字图像产生以来,人类对于客观世界的描述越来越具象化了,图像的直观性使其承载了大量的信息,据统计,人所获得的信息70%都来源于视觉,图像的可视化为人们提供了可供观察