深度学习与超向量在说话人识别中的应用

来源 :江西师范大学 | 被引量 : 0次 | 上传用户:tianyawoaiai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别技术(又称为声纹识别技术),与指纹识别、人脸识别等一样,都是生物识别技术的一个分支。与其他几个生物识别技术相比,说话人识别技术具有独特的优势,也有着它的劣势。为了提高说话人识别的准确率,引入高斯超向量,高斯超向量虽然几乎包含了说话人的全部特征,但也包含了许多没有价值的信息,如何对高斯超向量进行降维,是本文研究的重点。传统的线性降维算法如PCA、FA等,是十分常见的降维算法,因为这些降维算法简单、高效,因此使用广泛。然而这些线性降维算法对超向量进行降维的时候有一个问题,那就是这些线性降维算法会去除非线性特征,只保留线性特征。深度学习算法处理数据的时候可以保留数据中的非线性特征,因此可以将其运用到说话人降维中去。本文主要的工作和创新点如下:(1)本文对传统的线性降维算法进行研究,使用传统的线性降维算法对高斯超向量进行降维,并运用与完整的说话人识别系统中去。说话人识别系统进行说话人识别一般是利用语音样本之间的距离来判断其相似度,语音样本之间的距离越小说明样本的相似度越高,样本越相似。不同的距离相似度度量结果有一定的不同,本文使用的是PLDA对样本相似度进行打分。(2)将深度学习技术中的受限玻尔兹曼机引入到说话人识别中去,利用深度学习具有较强的深层次信息提取能力以及非线性建模的能力,提取出效果更好的i-vector,并运用到说话人识别系统中去。
其他文献
茶文化在我国有着长远的历史,花茶作为茶文化的重要内容在茶文化中有着重要的地位。在社会经济的发展过程中,花茶包装以及技术的应用受到各个企业的重视,花茶包装可以保障花
内部控制管理是一个企业提高效率、加强管理,达到最终的管理控制目标的一项高效的方法,当然对于房产管理处亦如此。本文是根据笔者常年累月的工作经验,学习了大量内部管理控
房车是一个未来经济增长的三极之一,而空调作为与之配套的必不可少的设备,也开始受到关注。本文简明扼要介绍了房车空调的关键技术信息。
对于餐厅空间的规划,如何合理设置每个功能区域?本文概括了常见的餐厅空间规划原则,以及空间布置的一些要点,从顾客的行为心理出发,分析了座位区域应该避免的一些问题。对于
随着移动支付、人工智能、物联网等先进技术的广泛应用,零售企业认识到顾客体验的提升是企业持续发展的核心,但是影响零售企业顾客体验的因素很多,不同因素的影响程度也不同,
由于时代进步和社会的迅速发展,客户更加注重对产品多样化、个性化的需求。大规模定制生产方式的出现,为客户定制化产品快速生产提供了机会,是满足客户需要需求、提高企业竞
北京大学中文系教授、北大书法艺术研究所所长王岳川先生曾在赴美进行"中国文化和艺术精神"学术巡回讲演期间,访问了客居美国的著名学者李泽厚先生,并进行了深入的对话。两位学
本文指出了关于灵活就业群体社会保障研究的必要性,在此基础上分析了广州灵活就业以及灵活就业群体的社会保障现状,并结合国内外灵活就业社会保障发展的经验和教训,对完善广
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊