基于PCA与LDA的说话人识别研究

被引量 : 0次 | 上传用户:cc_001111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,人们的交互手段越来越多样化,对身份鉴别的要求随之越来越高。生物认证技术基于人们自身的生理和行为特征进行身份鉴别,以其独特的优势,日益显示出它的价值。说话人识别技术被认为是最自然的生物认证技术,它是一项根据语音中反映的说话人生理和行为特征的语音参数,自动识别说话人身份的技术。近年来,说话人识别技术已成为研究领域的一大热点。然而,说话人识别技术应用于实际环境,还存在着很多难点,实时性不够就是其中之一。在详细分析说话人识别的最新的研究进展和主要特点的基础上,本文试图用多元统计分析中的两种方法:主成分分析和线性判别分析解决这个问题。 本文的第一个工作是研究了主成分分析(PCA)的最优降维性质在说话人识别中的应用。在说话人识别系统中,通常训练说话人模型需要很长的时间,特别当说话人特征的维数很高时。主成分分析是一种在均方误差前提下最优的线性降维方法,通过将原始特征向量向更小的子空间上投影,主成分分析达到了降维和去冗余的目的。因此,经过降维,损失的特征信息最少,在保证识别性能的同时,后续阶段的计算开销将会大大减少。据此,本文将主成分分析方法应用到说话人识别中,并提出了两种新的基于PCA特征变换的说话人鉴别系统。实验结果显示,主成分分析在说话人特征的降维和降噪方面都取得了不错的效果。 本文的第二个工作是研究了线性判别分析(LDA)的区分性变换在说话人识别中的应用。线性判别分析在形式上同主成分分析很相似,但两者在原理上有本质的差别。主成分分析关注的是寻找能最高效表达原数据信息的方向,而线性判别分析的重心则在寻找最能区分不同类数据的方向。线性判别分析方法使得类间距离与类内距离的比值最大,所以,经过线性判别分析变换,所获得的新的数据将达到最大的区分性。本文将线性判别分析方法应用到说话人识别中,以获得更具区分性的说话人特征,并提出了一种新的基于LDA特征变换的说话人鉴别系统。该系统同样在无噪语音和有噪语音的情况下,都取得了很好的效果;在某些情况下,识别性能还优于基于PCA变换的系统。 本文的第三个工作是研究了主成分分析方法的分类性质。现有的说话人分类方法,它们或者虽然取得了较好的识别率,但计算复杂度很高;或者虽然计算速度较快,但在说话人人数增多时,识别率会急剧下降。根据主成分分析的定义,它本质上具有分类的能力。在本文中,我们研究了主成分分析方法的分类依据,并提出了一种基于主成分子空间的新的PCA分类器。我们将其同另一种PCA分类器进行决策融合,获得混合PCA分类器,以加强分类能力。我们将这三种分类器应用到说话人识别中,并取得了令人鼓舞的效果;复杂度分析验证了PCA分类器在时间复杂度和空间复杂度方面的优势。
其他文献
在今天全面知识化的社会中,人们礼赞知识就像中世纪的人们礼赞上帝,启蒙运动的人们礼赞理性一样。蓦然回首,道德教育已不可避免地陷入了“知识世界”的泥潭而与“生活世界”严重
本研究以大学生为研究对象,以体育态度量表和体育锻炼感觉量表为测量工具,通过“项目干预”和“强度干预”进行现场实验研究。运用相关理论和SPSS11.0统计软件进行了数理分析。
以中国知网中1997—2016年间1 154篇国内苏州古典园林研究文献为对象,采用文献计量法,利用Citespace软件绘制知识图谱,分析研究现状及趋势。研究发现,苏州古典园林研究基础深
为解决监测数据缺失导致的轴温监测系统误诊和漏诊率较高的问题,提出了一种基于数据特征分析的轴温监测数据软测量方法;通过轴温监测点的布局与相关性分析,确定了监测数据软
针对纯电动汽车驱动桥进行振动噪声研究。通过三维软件建立驱动桥的三维模型,对三维模型进行有限元模态分析,获取驱动桥前6阶固有模态参数。再对纯电动汽车实体驱动桥进行试
上海近代的私立教育非常发达。从19世纪中叶到中华人民共和国成立前夕,经过近百年的孕育发展,上海已经集中了全国规模最大的各类私立大、中小学群落,使上海成为当时全国教育最发
前言 一氧化碳中毒(Carbon monoxide poisoning简称CMP)是临床上常见的中毒性疾病,病死率及死亡率均很高,它严重威胁着人们的生命与健康。为了探索CMP的机理及寻求有效的治
随着信息技术和网络技术的飞速发展,当今银行业服务方式发生了极大的变化,网络银行是其主要特征之一。在国外,网络银行经过上十年的摸索与实践,逐渐形成了具有代表性的网络银行发
代际关系是伴随着人类的产生而存在的,是人类社会的一种最基本的关系,是社会结构的有机构成部分。但是,不论是从其生物学意义而言(即人类的代际延续),还是从其经济学意义而言(如