说话人识别算法研究

被引量 : 0次 | 上传用户:xie_e
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别就是根据说话人语音信号所包含的信息来自动确定说话人身份的过程,可以应用在门禁、数据库存取、信用卡确认、银行电话交易服务等系统的使用控制中。本文主要研究基于参数模型的说话人识别方法,主要特征参数的选择、提取及识别算法。特征参数的选择就是要找出一组可代表每位说话人特性的特征参数,该参数应不易受环境干扰,具有鲁棒性,且在不同的使用者和背景噪声上都能维持一定的识别性能。本文主要对线性预测编码(LPC)、线性预测编码倒谱系数(LPCC)和梅尔倒谱系数(MFCC)三种特征参数在说话人识别上的特性进行了比较研究。说话人识别有很多种算法。本文使用k-最相邻法(k-NN)作为分类依据,对比了各种参数使用k-最相邻法时的识别效果。此外,为了提高运算速度和节省存储空间,在说话人模型训练上,采用了k-means、模糊c-means等数据缩减算法,并与未进行数据缩减时进行了对比实验,实验结果显示了这些算法的有效性。人工神经网络通过学习可以实现对输入向量的分类。根据神经网络的分类作用,本文尝试了用神经网络学习向量量化方法(LVQ)进行说话人识别,并取得了较为满意的结果。
其他文献
马铃薯是以收获块茎为产量的作物,用种量较大,但是目前我国种薯生产条件和种薯产量还不能满足这个要求。雾化栽培法生产脱毒微型薯,繁殖系数可提高10—20倍,单株结薯可达40—60粒
本文以Jef Verschueren的顺应理论为基础研究口译,阐述了顺应理论视角下口译过程的特征,提出口译作为一种特殊的交际活动,是译员不断做出选择的动态顺应过程。引言部分介绍了
学位
大型露天堆料场在工业中应用广泛,但其在风致作用下产生的扬尘是大气颗粒物的重要来源,对周边半径为几千米内的局部区域的大气环境污染最为严重,研究在此小区域内的颗粒污染
目的:观察苯酰甲硝唑根除幽门螺旋杆菌感染的临床疗效。方法:选取2013年6~12月内蒙古巴彦淖尔市医院消化内科门诊收治的1286例经13C尿素呼气试验检查确诊的幽门螺旋杆菌感染患者
为了解如何发挥大学英语教学在医学院校人文教育方面的重要作用,采用个案研究的方法,从翻转课堂的视角探讨医学院校融入医学人文的英语课堂教学案例,运用课堂观察和访谈形式
<正>全面深化改革是从"不改革开放就是死路一条"、"改革开放是新时期中国最鲜明的特征"、"改革开放是决定当代中国命运的关键抉择,是发展中国特色社会主义、实现中华民族伟大
本文叙述了国内外高纯甲醇的应用和市场态势、生产现状、高纯甲醇生产技术及高纯甲醇生产技术的新进展,并对我国甲醇产能、需求和存在的问题作了分析,最后指出了我国自主生产
当前中学语文古诗词鉴赏教学以传授鉴赏知识和应试知识为本位,以应试为目的,未遵循古诗词鉴赏学习规律和学生鉴赏能力发展规律,不重视学生语感的培养,鉴赏教学存在一系列矛盾问题
本文利用射频等离子体增强化学气相沉积制备了类金刚石(DLC)薄膜,选用CH4和H2为源气体,硅片为基底。研究了不同生长条件对所合成的DLC薄膜的微结构、表面形态以及对薄膜的力学性
区划经济和区域经济,是经济发展过程中的两种形态。随着我国社会主义市场经济体制的逐步确立与完善,经济发展的主要推动力从政府转变为市场,行政区划经济与区域经济之间的矛