基于深度信念网络的说话者识别研究与实现

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:shibaotuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体信息技术的快速发展,网络语音资源呈现出了爆炸式地增长,因此如何利用语音进行分类和识别具有重要的意义。说话人识别技术可以利用少量声音数据区分说话人,从而实现身份认证的功能,它是语音信号处理中的关键技术。但是传统的说话人识别系统往往还存在学习不充分、网络模型深度不够以及语料数据不充分的情况下识别系统的真实模型往往复杂度不够等情况。本文在分析说话人识别方法优缺点基础上使用深度学习技术设计实现一个说话人识别的系统。本文的主要工作如下:(1)归纳了说话人识别方法和特征提取方式的特点和困难点,对比分析目前常用的各种说话人识别技术策略、模型和算法之间的优缺点。(2)研究了基于深度学习的说话人识别框架。将深度学习理论应用到传统的说话人识别系统,使用受限的玻尔兹曼机和后向传播算法训练深度信念网络,从而克服了直接对多层网络模型进行训练的效率问题。(3)引入信道环境下i-vector分析方法的说话人识别,并在i-vector方法基础上,对传统高斯混合型说话人识别进行改善,提出一种使用无压缩i-vector形式和深度学习相结合的方法。在使用无压缩i-vector形式的深度学习说话人识别方法上测试和传统方法比对识别率的影响;不同性别对识别率的影响。(4)根据说话人识别的处理流程,进而给出基于深度学习说话人识别的系统结构,对其中的核心模块进行了具体设计并予以仿真实现,最后对各类说话人识别系统的性能展开测试并对测试效果分析。
其他文献
苜蓿青贮不仅能解决我国苜蓿干草加工及雨淋造成的损失,而且能增加苜蓿草产品的多样性,在我国未来畜牧业发展中将具有巨大的发展潜力。通过对实际调研数据资料进行分析,明确
自改革开放以来,我国的基础设施建设工作从未停歇,土木工程的建设为我国经济水平的提升奠定了坚实的基础,施工组织设计方案保证了土建工程施工的顺利进行。本文对土建施工管
为贵州野生樱桃的资源保护及选育利用提供依据。以采自贵州毕节的野生樱桃为试材,采用Bradford法测定樱桃果肉的可溶性蛋白,采用WinSEEDLE种子和针叶图像分析系统测定樱桃种
在壳聚糖的生产过程中 ,将稀碱脱蛋白阶段反应后的稀碱 ,添加 8%— 1 0 %的稀碱后可重复使用 ,如此反复回用 3次 ;而浓碱脱乙酰基阶段反应后的浓碱 ,添加 5 %左右的浓碱后可
介绍了近年来聚酰亚胺的发展现状、性能及在各个领域的应用,论述了聚酰亚胺的最新研究成果,指出了其今后发展方向。
在科学与技术飞速发展的今天,人们的生活水平在不断提高,但各种"富贵病"也随之而来。尤其是越来越多的年轻群体中出现了新陈代谢功能与心理状况低下的症状,陷入了亚健康的状
通过对《杨振宁演讲集》的研读,笔者认为,杨振宁教育思想主要表现为:培养与笼络并重的人才思想,反对读死书、随时向新的方向发展的基本思路。其科研思想主要表现为:抓要害、注重实
高吸水性树脂(简称SAR)是一种典型的功能高分子材料。它能够吸收自身重量几百倍至千倍的水分,无毒、无害、无污染;吸水能力特强,保水能力特高,通过丙烯酸聚合得到的高分子量聚合物
本文从Fluent软件在动量传递,Exchanger Design and Rating软件在热量传递和Aspen Plus软件在质量传递3个方面介绍了通用化工软件在《化工传递过程原理》教学中的应用,形象地
蔬菜的生产流通关系着人们的切身利益,蔬菜营销渠道正成为学者们研究的重。目前我国蔬菜营销渠道存在营销主体分散、竞争力弱,营销渠道保鲜技术、基础设施和组织建设落后的问