基于聚类分析和神经网络集成的说话人识别方法研究

被引量 : 0次 | 上传用户:qhxfxfxf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别技术是根据语音信号特征来自动识别说话人的身份。作为一种生物认证技术,与其他技术相比它更方便、经济、安全,被广泛用于网络、国防、安全等领域中。因此,对说话人识别技术的研究具有普遍的实用价值和重要意义。在本文的开头对说话人识别进行了概述,对其基本原理和识别系统结构以及实现过程做了简单介绍。首先,分析了说话人识别系统常用的两种主流特征参数,即LPCC和MFCC。其次,对本文研究内容所要用到的理论背景知识——聚类分析和神经网络集成做了充分详细的介绍。接下来,针对传统k-means算法用于语音信号矢量聚类方面的缺陷,提出了基于方差的加权几何距离对传统k-means算法进行改进,对特征矢量的各分量按方差大小加权,加权因子是矢量方差的倒数。将改进的算法与BP_Adaboost集成模型结合后,把二者应用到说话人识别系统中。最后在Matlab软件上进行了仿真实验。首先,对语音信号进行了预处理等一系列处理。因为梅尔倒频谱系在反映人耳的听觉特性上更具优势。所以在特征参数的选择方面,我们选择了梅尔倒频谱系数作为特征参数,使其作为系统模型训练和识别的输入向量,对模型训练和学习。最后,将基于本文方法的说话人识别系统分别和基于单BP神经网络模型以及基于BP_Adaboost集成模型的说话人识别系统进行实验对比,以此来验证本文方法的有效性。
其他文献
《大陆法系》(法律出版社2004年版,顾培东、禄正平译)一书是美国著名比较法学者梅里曼教授的力作,成书于1969年。该书以一个普通法系学者的视角,以最富可读性和最简练的语言展示
报纸
宗法文化在安多藏区亦有全面表现,涉及政权、教权、血缘传递、婚姻缔结、生养死葬等诸多方面。教权强化了政权和族权,政权保障了教权和族权,族权则延续了教权和政权。安多藏
<正> 这个人是一种带青的液汁,稀薄而尖利,如同月光与刀刃。有一次我在桌上看见她的牙齿从墙与墙接合的地方伸出来,我伸出我的手指触摸它,一种被冰灼痛的感觉立即传导到我体
期刊
曹丕《典论·论文》是我国文学理论和批评史上第一本系统性专著,在《典论·论文》中,曹丕提出了关于文学的批评论、价值论、文气说等观点,并第一次把文学作为一个独立的对象
目的:探讨腹腔镜下保留脾脏胰体尾切除的术后护理经验。方法:从术前护理、术后常规护理、术后并发症以及出院指导等方面分析了45例腹腔镜下保留脾脏胰体尾切除术后的护理特点。
自2014年下半年开始,国际原油价格由100多美元/桶,目前在40美元/桶左右低位波动,多数油企生产经营受到较大冲击,效益大幅度锐减,一些油企不得不采取压减原油产量、减少产能投
我国志愿服务虽然起步较晚,但是随着我国经济的腾飞,志愿服务也得到了迅猛发展。如今,我国志愿者人数和服务时长都达到了一个新高度,但是志愿服务制度化建设仍未完善,如有关
就小学语文写作而言,最好的提高学生写作能力就是让学生养成写日记的习惯。写日记对于学生成长来讲具有很大的促进作用,学生养成每天写日记的习惯,不仅能够提高学生的文笔,同
综述了硅烷材料对混凝土材料表面憎水处理的基本原理,硅烷浸渍对混凝土材料吸水性等物理性质的影响,硅烷浸渍材料的长期老化机理、老化实验室表征,实际工程对硅烷浸渍憎水性的长
随着科技创新战略的实施,科技部门在经济社会发展中的作用越来越重要。秦淮区科技局不仅在科技创新方面发挥了积极的作用,而且还以创业中心为依托,直接参与到招商引资、护税