嵌入式声纹识别系统的研究与实现

来源 :厦门大学 | 被引量 : 0次 | 上传用户:lxw19831201
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别技术是指通过对说话人的语音进行信号处理自动鉴别说话人身份的一门技术,是生物认证技术的重要手段之一。它在很多领域都有重要的应用价值。本文介绍的说话人确认系统是建立在ARM9开发板硬件基础之上,采用高斯混合全局背景模型算法实现的嵌入式系统。它主要分为三部分:特征向量美尔频率倒谱系数(MFCC)的提取、说话人确认算法实现、硬件平台及其实现。提取特征向量MFCC就是从说话人的语音信号中提取能够体现该说话人声学个特征的参数,并对提取算法以速度为优先指标进行运算优化。本文在语音信号时域处理方法研究的基础上,介绍了特征参数的提取过程及其计算优化。在说话人识别算法方面,首先介绍了说话人识别的主要模式匹配方法:隐马尔可夫模型(HMM)、高斯混合模型(GMM)、人工神经网络(ANN)等。研究表明,GMM方法具有独特的优越性在语文本无关的说话人确认系统中取得良好的识别效果。本文重点阐述高斯混合全局背景模型算法,它主要由三个模块构成:全局背景模型(UBM)的建立、目标说话人模型的建立及其自适应、说话人确认决策。在硬件平台及其实现方面,我们首先介绍嵌入式开发板的选择依据,并最终决定选择基于ARM9的H2410EB开发板。本文重点阐述了基于ARM9的说话人确认系统的设计和实现。由于嵌入式开发板处理能力和存储能力的局限性,采用浮点运算转定点运算、计算预处理、数学快速近似计算、最大值机制等降低系统的运算负荷,提高运算效率,保证嵌入式系统实时性的要求。
其他文献
在基因组序列组装算法中,一个最基本的问题就是如何合适的选择上下游的短序列用于组装成一个长序列。当单独从一个种子序列进行扩展的时候,大量的重复的区域将会导致非常多的
在开放式网络环境下,信息技术的迅速发展带来的网络安全问题日益突出,信息资源在被访问、分发传播过程中,存在诸如非法访问、越权使用等现象,妨碍信息安全传播。如何加强信息
数字证书作为一种权威性的电子文档,提供了一种在Internet上验证用户身份的方式,人们可以在互联网交往中用它来识别对方的身份。为了保证数字证书的唯一性和可靠性,通常采用
随着移动通讯和信息技术的不断发展,传统的手机已经不能满足用户更高级的需求,智能手机的出现,使得移动通讯应用出现了新的革命。目前,智能手机的销量不断上升,具有广阔的市
开放式网络环境使人们充分享受网络的便捷,与此同时,各种针对网络的攻击与破坏日益增多。作为保障网络安全的必要手段之一的入侵检测系统(IDS),正受到越来越多重视。从数据挖
现有的访问异构平台下应用程序的方法一般是通过远程桌面工具登录到远程主机执行服务器的应用程序。但是,这种方法存在很多不便,例如,用户不得不在陌生的服务器环境下进行操
纹理合成是真实感和非真实感绘制领域的研究热点之一,并在虚拟现实、计算机视觉等领域得到广泛应用。纹理能够表现出物体表面丰富的细节特性,可以描述各种各样有着重复特征的
随着大数据时代的到来,庞大的数据量给人们带来无限商机,也引起了学术界、企业界及政府机构的高度重视。但数据的复杂性和多样性也导致数据价值密度不高,冗余数据较多等问题
随着网络信息的飞速增长和搜索引擎等技术的日趋成熟,人类社会所面临的主要问题已经不再是信息匮乏,而是如何提高信息获取和信息访问的效率。文本聚类技术具有较强的灵活性和
随着网络技术和多媒体技术的飞速发展,如何保护数字产品的安全和版权的问题,已经成为世界各国极为关注的重要课题。数字水印技术就是在这个背景下应运而生的,它可以有效地弥