基于PCA与LDA的说话人识别研究

被引量 : 0次 | 上传用户：cc_001111

【摘要】

：

随着信息技术的发展，人们的交互手段越来越多样化，对身份鉴别的要求随之越来越高。生物认证技术基于人们自身的生理和行为特征进行身份鉴别，以其独特的优势，日益显示出它的价值。

【作者】

：

章万锋

【发表日期】

：

2004年期

【关键词】

：

说话人识别多元统计分析主成分分析线性判别分析

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着信息技术的发展，人们的交互手段越来越多样化，对身份鉴别的要求随之越来越高。生物认证技术基于人们自身的生理和行为特征进行身份鉴别，以其独特的优势，日益显示出它的价值。说话人识别技术被认为是最自然的生物认证技术，它是一项根据语音中反映的说话人生理和行为特征的语音参数，自动识别说话人身份的技术。近年来，说话人识别技术已成为研究领域的一大热点。然而，说话人识别技术应用于实际环境，还存在着很多难点，实时性不够就是其中之一。在详细分析说话人识别的最新的研究进展和主要特点的基础上，本文试图用多元统计分析中的两种方法：主成分分析和线性判别分析解决这个问题。本文的第一个工作是研究了主成分分析(PCA)的最优降维性质在说话人识别中的应用。在说话人识别系统中，通常训练说话人模型需要很长的时间，特别当说话人特征的维数很高时。主成分分析是一种在均方误差前提下最优的线性降维方法，通过将原始特征向量向更小的子空间上投影，主成分分析达到了降维和去冗余的目的。因此，经过降维，损失的特征信息最少，在保证识别性能的同时，后续阶段的计算开销将会大大减少。据此，本文将主成分分析方法应用到说话人识别中，并提出了两种新的基于PCA特征变换的说话人鉴别系统。实验结果显示，主成分分析在说话人特征的降维和降噪方面都取得了不错的效果。本文的第二个工作是研究了线性判别分析(LDA)的区分性变换在说话人识别中的应用。线性判别分析在形式上同主成分分析很相似，但两者在原理上有本质的差别。主成分分析关注的是寻找能最高效表达原数据信息的方向，而线性判别分析的重心则在寻找最能区分不同类数据的方向。线性判别分析方法使得类间距离与类内距离的比值最大，所以，经过线性判别分析变换，所获得的新的数据将达到最大的区分性。本文将线性判别分析方法应用到说话人识别中，以获得更具区分性的说话人特征，并提出了一种新的基于LDA特征变换的说话人鉴别系统。该系统同样在无噪语音和有噪语音的情况下，都取得了很好的效果；在某些情况下，识别性能还优于基于PCA变换的系统。本文的第三个工作是研究了主成分分析方法的分类性质。现有的说话人分类方法，它们或者虽然取得了较好的识别率，但计算复杂度很高；或者虽然计算速度较快，但在说话人人数增多时，识别率会急剧下降。根据主成分分析的定义，它本质上具有分类的能力。在本文中，我们研究了主成分分析方法的分类依据，并提出了一种基于主成分子空间的新的PCA分类器。我们将其同另一种PCA分类器进行决策融合，获得混合PCA分类器，以加强分类能力。我们将这三种分类器应用到说话人识别中，并取得了令人鼓舞的效果；复杂度分析验证了PCA分类器在时间复杂度和空间复杂度方面的优势。

其他文献

从“知识世界”走进“生活世界”

在今天全面知识化的社会中，人们礼赞知识就像中世纪的人们礼赞上帝，启蒙运动的人们礼赞理性一样。蓦然回首，道德教育已不可避免地陷入了“知识世界”的泥潭而与“生活世界”严重

学位

知识世界生活世界活动道德教育

不同运动项目和强度对大学生体育态度及体育锻炼感觉影响的研究

本研究以大学生为研究对象，以体育态度量表和体育锻炼感觉量表为测量工具，通过“项目干预”和“强度干预”进行现场实验研究。运用相关理论和SPSS11.0统计软件进行了数理分析。

学位

运动项目运动强度体育态度体育锻炼感觉

计算技术与计算机及网络设备专家系统、决策支持系统、人工智能、机器学习

期刊

机器学习人工智能决策支持神经网络集成概念学习

近20年国内苏州古典园林研究现状及趋势——基于CNKI的文献计量分析

以中国知网中1997—2016年间1 154篇国内苏州古典园林研究文献为对象,采用文献计量法,利用Citespace软件绘制知识图谱,分析研究现状及趋势。研究发现,苏州古典园林研究基础深

期刊

风景园林苏州古典园林知识图谱研究现状文献计量

列车轴温监测数据软测量方法

为解决监测数据缺失导致的轴温监测系统误诊和漏诊率较高的问题,提出了一种基于数据特征分析的轴温监测数据软测量方法;通过轴温监测点的布局与相关性分析,确定了监测数据软

期刊

高速列车软测量轴温监测分步式降维聚类深度学习

纯电动汽车驱动桥模态分析

针对纯电动汽车驱动桥进行振动噪声研究。通过三维软件建立驱动桥的三维模型,对三维模型进行有限元模态分析,获取驱动桥前6阶固有模态参数。再对纯电动汽车实体驱动桥进行试

期刊

振动噪声纯电动汽车驱动桥有限元模态分析试验模态分析

改革开放以来（1978—2001年）上海民办教育发展研究

上海近代的私立教育非常发达。从19世纪中叶到中华人民共和国成立前夕，经过近百年的孕育发展，上海已经集中了全国规模最大的各类私立大、中小学群落，使上海成为当时全国教育最发

学位

民办教育教育发展研究教育体制上海市区学校特色国际教育交流教育定位教育经费办学主体办学者

急性一氧化碳中毒脑内IL-1β、IL-8变化及激素干预的研究

前言一氧化碳中毒(Carbon monoxide poisoning简称CMP)是临床上常见的中毒性疾病，病死率及死亡率均很高，它严重威胁着人们的生命与健康。为了探索CMP的机理及寻求有效的治

学位

急性一氧化碳中毒白细胞介素-1β白细胞介素一8甲基强的松龙

我国网络银行发展战略研究

随着信息技术和网络技术的飞速发展，当今银行业服务方式发生了极大的变化，网络银行是其主要特征之一。在国外，网络银行经过上十年的摸索与实践，逐渐形成了具有代表性的网络银行发

学位

网络银行战略目标发展战略

伦理的代际之维

代际关系是伴随着人类的产生而存在的，是人类社会的一种最基本的关系，是社会结构的有机构成部分。但是，不论是从其生物学意义而言(即人类的代际延续)，还是从其经济学意义而言(如

学位

代代际关系代际伦理

基于PCA与LDA的说话人识别研究

与本文相关的学术论文