说话人识别系统及其受鼻塞音影响的研究

来源 :西安科技大学 | 被引量 : 0次 | 上传用户:kevisno1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音是人的固有特征,获取设备成本较低,不受位置限制,因此用语音来鉴别说话人身份的说话人识别技术有着许多特有的优点,在很多场景中甚至是不可替代的。但说话人识别技术发展至今,仍然面临很多的困难和挑战。受发声器官的影响,鼻腔堵塞时会发出声纹畸变的鼻塞音,对说话人识别系统的识别率产生影响。因此文章将研究鼻塞音与正常音的差别,分析几种说话人识别系统的性能及其受鼻塞音影响的程度,对在实际应用中选择说话人识别系统提供指导。本文首先分析了语音信号特征,按语音特征提取系统流程,介绍了语音的数字化方法;通过实验分析了预加重、分帧加窗、谱熵法端点检测这一语音预处理过程的必要性;介绍了梅尔倒谱系数提取声纹特征的原理。通过上述操作将原始语音转化为可输入系统的数字信号。接着研究了正常音和鼻塞音的发声机理,并通过语谱图技术对鼻塞语音进行分析,找出鼻塞语音与正常语音的具体差别。然后研究传统说话人识别系统中矢量量化法和高斯混合模型法的原理及性能,通过实验找到最佳系统参数,对比最佳系统的识别率受鼻塞音的影响并分析实验数据。最后研究神经网络说话人识别系统中基于集成学习思想优化的BP神经网络法和循环神经网络算法的原理及性能,通过实验找到最佳系统参数,对比最佳系统受鼻塞音影响并分析实验数据。通过实验实现了两类四种算法,测试了单鼻塞音和双鼻塞音在4个、8个、16个和24个识别人数的准确率。整体上,传统算法中矢量量化法比高斯混合模型算法的鼻塞音识别率高,高斯混合模型训练时间短,矢量量化法识别时间短。神经网络算法比传统算法受鼻塞音影响小,受影响程度也不随人数增加而改变,优化后训练时间和识别时间都较短,但基于系统特性在增加识别人数时神经网络要重新训练所有样本,传统算法只需训练增加的样本。在实际应用中选择识别方法时可综合考虑。
其他文献
目前,银行之间的竞争日益激烈,为了满足各种各样消费者的需求,银行在新的业务开发方面都花了不少功夫,从储蓄业务到信用卡业务,从电子银行到理财计划……无一不体现银行的业务发展
表面看来,瑞典商业银行(Svenska Handeksbanken)的全球CEO古朗然与其他银行家并无二致:身材瘦高、衣着整洁、表情严肃。但这并不妨碍他掌管着全球金融业中最“独特”的一家银行。
更新一种认识——对市场的认识 近年来,我国经济持续健康快速发展,社会各界的金融业务需求也随之增长,给金融业的快速发展带来了前所未有机遇。以存款业务为例,在短短的四年内,我
刚刚结束的党的十六届五中全会,通过了《中共中央关于制定国民经济和社会发展第十一个五年规划的建议》(以下简称建议)。建议指出,要根据不同区域的环境承载力和发展潜力,按照优化
课堂提问是沟通师生情感的纽带,是检查教学信息反馈的桥梁,是激发学生学习兴趣、启迪学生思维、活跃课堂气氛、巩固教学效果的重要方式。文章从实际出发,对课堂设问的形式与
逆水行舟,我叫李向党,现为建行新疆区分行营业部的一名普通员工。我曾是1986年高考的一名落榜者。
浦发银行负责个人理财业务的是一批经过严格培训的客户经理。他们接受培训的内容主要是针对银行自己特色的理财服务,从银行目前可向客户推荐使用的理财产品,到如何清楚明白地向
甘肃自古人杰地灵,历史文化景观如颗颗明珠洒落在千里陇原。保护和利用它们为甘肃社会的全面发展服务,要坚持“保护为主,抢救第一”的方针和“有效保护,合理利用,加强管理”的原则
每位学生都有无穷无尽的潜能,他们才是班级管理的真正主人。如何创设适合学生的管理制度,是每个班主任应当审慎思考的课题。笔者认为,可以从班级决策制度、活动制度、合作制