面向说话人识别的SVM核方法对比研究

来源 :浙江大学计算机科学与技术学院 浙江大学 | 被引量 : 0次 | 上传用户:jimmy7872
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别是根据语音波形中反映说话人生理和行为特征的语音参数,自动识别出说话人的过程,它是语音信号处理的一个重要研究方向,作为一种生物认证技术,具有广泛的应用前景。支持向量机是在统计学习理论上发展出来的一种模式识别方法,在解决有限样本、非线性及高维模式识别问题中表现出许多特有的优势。由于支持向量机具有坚实的理论基础,引起越来越多的人们关注,近年来,支持向量机在说话人识别中的应用日益广泛。支持向量机作为说话人识别模型分为基于帧的和基于语句的两种方式。基于语句的说话人支持向量机模型重点在于核函数的构造,核函数是一种语句间相似度的描述工具,在实现上它通常表现为两条语句间的距离,在形式上它是多种多样的,可以是内积形式,也可以是距离,还可以是模型得分。目前核函数的构造往往是采用试探性实验的方式进行的,缺乏对构造思想以及其合理性的详细分析,因此,对不同核函数的构造思想及过程进行分析,有助于加深对核函数意义的理解,并为构造新的核提供借鉴思路。论文首先给出了一种通用的核函数构造模式。在此基础上着重对通用线性区分核、概率距离核、超向量核、Fisher核与偏差核这几个核函数进行对比研究,分析它们的构建思想,挖掘其内在的合理性,找出它们相互间的区别与联系。具体工作包括:1.通用线性区分核函数。对序列核概念、核函数设计的思路与推导、映射方式以及训练算法等作了细致的分析,并进行实验验证;2.概率距离核和超向量核。对两种核函数的构造方法与推导、映射的涵义以及两者之间的区别与联系进行详细分析与实验研究;3.Fisher核和偏差核。对两种核函数的构造方法与推导、映射方式和两者之间的区别与联系进行详细分析与实验研究。
其他文献
决策支持系统主要由数据仓库和决策推理两个部分组成,这两部分的有机结合再加上结果展示组成了一个完整的决策过程。而OLAP(On-Line Analysis Processing)作为一个基本的归纳
三维模型的孔洞修补问题,一直是计算机图形学和可视化研究中的一个热点问题。由于颅骨模型的特殊性,现有算法并不适用于颅骨模型的修补。三维颅骨孔洞修补是一个崭新的研究课
WMN(Wireless Mesh Network,无线网状网)是一种全新的无线网络技术,其核心是让网络中每个节点都可以发送和接收信号。WMN是网状结构的多跳系统,从源节点到目的节点存在多条冗余
本文研究了现有国内外二维条码的种类、优势及相关识别技术;剖析移动端主流操作系统Symbian OS体系结构及其应用程序的开发平台;并在此基础上搭建移动端二维条码识别系统。首
AVS(Audio video coding standard)是我国数字音视频编解码技术标准工作组于2003年自主制定的具有自主知识产权的数字音视频编解码技术标准,其专利池管理策略成功地解决了我
随着人类基因组计划的开展,以及各种生物基因序列的研究,产生了越来越多的分子序列数据。对这些序列数据进行科学的分析、处理可以推动生物信息学的发展。序列分析是生物信息
长久以来,企业界一直在信息化建设和资金投入间艰难的寻找平衡点。近几年来,随着x86体系结构计算机性能的飞速提升,软件人员开始将过去应用在大中型计算机上的虚拟化技术带到x86
随着我国加入WTO以及市场经济体制的逐渐完善,高校间的竞争日益凸现。决策支持系统在高校中的应用研究将充分利用现有的高校信息资源,从更高的层面优化学校资源配置,从整体、宏
随着市场经济的深入发展,作为“第三利润源泉”的物流在我国的生产、分配、流通和消费的各个领域起着越来越重要的作用。配送是物流系统中很重要的一个环节,在物流的各项成本中
计算机技术被认为是20世纪三大科学革命之一,电子计算机为社会的发展起到了巨大的促进作用,但是量子物理学己经成功地预测出芯片微处理能力的增长不能长期地保持下去。基于这