基于EMD的说话人识别研究

来源 :西北师范大学 | 被引量 : 0次 | 上传用户:babala_chen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在生物认证领域,说话人识别以其独特的优势——方便性、经济性、准确性,逐渐成为人们日常生活工作中至关重要的身份认证方式,并已被广泛地应用于电子商务、司法等安全领域,是当前的一个研究热点。说话人的特征参数是构建说话人识别系统的基础。当前,大多数研究中提取说话人特征参数均是应用短时分析方法(傅里叶变换法),但是说话人的语音信号是典型的非线性信号,采用线性信号分析方法势必会丢失一些重要的信息。针对此种情况,本论文展开了一系列的研究,主要工作与创新如下:第一:论文首先改进了现有的特征参数。采用感知加权技术,选择基于心理声学模型计算得到的信号掩蔽比插值作为权重函数,并将权重函数应用到mel倒谱分析中获得加权mel倒谱系数(WMCEP),实验中将WMCEP结合GMM识别模型进行说话人识别研究。第二:论文引入了非线性信号分析方法--希尔伯特黄变换(Hilbert-Huang Transform, HHT),其组成部分是经验模态分解法(Empirical Mode Decomposition, EMD)和希尔伯特谱分析(Hilbert Spectral Analysis, HSA)。应用EMD分解法并结合短时分析技术,处理语音信号,提出了三种特征提取算法。实验中选用了适用于分类问题的SVM识别模型并结合提出的特征参数应用到说话人识别中;同时为了比较分析SVM的识别性能,将GMM识别模型作为比较模型。第三:论文着重从理论分析的角度研究了基于EMD分解法提取特征参数的可行性和有效性。采用的分析方法是基于HSA谱和边界谱的EMD特征提取以及基于残差相位的EMD特征提取。EMD分解法的引入是一种新的尝试,本论文基于此提出的特征提取方法具有一定的理论依据和较好的实用效果,为今后的语音识别和说话人识别研究提供了一定的研究基础。
其他文献
时间作为物理学中七个基本物理量之一,在物理学的发展中起着至关重要的作用。特别是在粒子物理实验中,时间信息能够间接反映实验过程中粒子的动量、质量等信息,对鉴别粒子种类、
随着集成电路设计技术和半导体制造技术的日益发展,便携式电子产品得到了广泛的应用。为了满足不同应用的需要,对电子产品电源驱动芯片的设计也更富有挑战,包括:在宽的输入电压范围内提供稳定的输出电压,在轻载和重载时保持高的转换效率,以及更少的外围元器件。论文设计了一款基于BUCK-BOOST拓扑结构的电源驱动芯片。它的输入电压范围为2.4V~5.5V,输出电压正端固定为4.6V,负端电压可调,最低可达-6
学位
学位
许多信号通路被证实对干细胞的自我更新以及分化起调控作用,其中主要有Hedgehog,Notch以及Wnt信号通路等。Wnt-β-catenin信号通路已被充分证实在乳腺正常发育和癌变过程中发挥
近年来,随着无线通信技术的迅速发展,低成本、高传输速率成为目前移动通信系统(3G、4G等)和各种无线接入方式(无线局域网、全球微波互联接入、蓝牙等)的发展趋势。由射频集成电
学位
目的:本研究通过对中国美利奴羊MHC-DRB1exon2基因多态性进行研究,并构建其单倍型,探讨该基因SNPs与布鲁氏菌病易感性相关性,初步筛选与布鲁氏菌病易感性相关的单倍型。此研究的
胰岛素样生长因子(insulin-like growth factor1,IGF-1)是动物生长调控轴的重要调控因子,是生长激素(growth hormone,GH)在促进胚胎后发育和生长作用的主要中介效应分子。IGF-1在
文章对热释电传感器的历史和发展进行描述,同时对所选用的铌酸锂晶体的特点及强电场下的极化作了说明。论文描述了热释电效应的原理,最后对热释电敏感头的整个实验过程作了说