基于深度学习的声纹识别算法研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:zhangxizi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着各种智能终端设备的应用与普及,生物特征识别技术以其便捷性逐渐在各类身份验证场景下扮演越来越重要的角色。声纹识别属于生物特征识别的一种,基于人的语音信号进行身份识别,被广泛应用于刑侦、金融风控、语音终端的人机交互等各类场景。根据应用场景不同,可以分为说话人确认和说话人辨认两个任务。根据是否对语音的文本内容进行限定,声纹识别又分为文本相关型和文本无关型两个类别。本文主要针对难度较大的文本无关型声纹识别,并对说话人确认任务和说话人辨认任务分别进行了相关测试。本文提出了一种端到端的声纹识别算法,包括基于注意力机制的神经网络模型和基于度量学习的模型训练方式。本文所提出的网络模型结合了残差卷积神经网络和注意力机制,不仅将注意力机制应用到了高层特征提取,同时提出了一种基于注意力机制的时域池化方法,以学习对于不同语音片段的特征进行自适应的权重分配。基于三元损失函数,本文提出了一种新颖的在线难样本挖掘方式以统一同类样本对的约束条件,并在此基础上针对三元损失难以训练的问题提出了一种稳定训练的方案。基于Voxceleb1数据集进行模型训练,该方案在说话人确认任务上达到了5.3%的等错误率,优于目前最流行的i-vector模型和x-vector模型。此外,本方案是一种端到端的实现,不需要多余的后端作为打分模型,而i-vector模型和x-vector模型都依赖于单独训练的PLDA模型进行打分。在基于Voxceleb2数据集进行训练的情况下,该方案进一步将Voxceleb1验证集上的等错误率降低到了4.05%,优于原文中采用对比损失训练的Res Net-34模型以及Res Net-50模型,且本文提出的网络模型的复杂度远低于Res Net-34。针对一般的多分类任务,本文提出了一种度量学习损失函数与softmax交叉熵联合训练的模型训练方法,即先采用本文阐明的CRL损失函数训练网络的瓶颈特征,然后通过softmax交叉熵训练最终的全连接分类层。通过采用切断瓶颈特征与分类层之间的梯度传播的方式可以将这两个步骤同时进行,在Voxceleb1数据集上,该方法将Top-1准确率进一步提升了3.6%。
其他文献
从海灰翅夜蛾核型多角体病毒(SpliNPV)中新发现的p49基因可抑制病毒感染引起的草地贪夜蛾细胞Sf9的凋亡,用杆状病毒表达系统Bac to Bac克隆表达并收获P49蛋白,发现所测定的表达
目的:评价头孢唑林与左氧氟沙星对产妇产褥期感染的临床疗效与安全性。方法:选取2015年1月—2016年12月期间收治的产褥期感染产妇100例资料,将其随机分为对照组和观察组,每组
基于乡村旅游产业和城镇化发展背景,以湖南隆回县花瑶民宿建筑砖楼为例,探讨花瑶民宿发展特点和砖楼改造式民宿建筑特征.并结合白水洞村"米兰居"砖楼民宿改造实例,从功能布局
目的检验乐观主义-悲观主义量表(OPS)在老年人中应用的信、效度。方法采用OPS、老年抑郁量表、纽芬兰纪念大学幸福度量表和自尊量表对664名老年人施测。结果 OPS及其分量表的
建立了顶空气相色谱法测定γ辐照三烷基氧膦中微量轻质烃的方法.研究了色谱条件及顶空加热条件.方法的回收率为90%-109%,对正戊烷、正己烷、正辛烷的检出限分别为8.7×10
通过碳酸钠高温熔样,热水浸取过滤除去SO2-4和Na+,酸化溶解沉淀的方法处理样品,采用ICP-AES法测定重晶石中的杂质元素钙、锶、铁,方法的检出限为3.9-8.4ng/mL,回收率为99.4%-
对流动注射-等离子体原子发射光谱(FI-ICP-AES)中的标准加入法进行了研究,并应用于生物试样中多种微量元素的同时测定,对流动注射的工作条件(如载液流速、传输管长度),进样体积,曝光时间等)进行了
随着当代移动通信技术的快速发展,人们对无线便携式移动设备的需求越来越大。终端天线作为无线通信中的关键器件,它的小型化、宽带化和多天线化成为现在研究的热点。超宽带技术UWB(Ultra Wideband)由于其具有低功耗、高带宽、高传输速率、低复杂性、发射信号功率谱密度低、安全性高等优点能够有效的应用于短距离的端对端无线通信。另外,多输入多输出技术(MIMO)在终端天线中放置多个天线,能够获得更高的
创业板设立的目的是服务于初创期的高科技企业,它在定位与发展战略等方面都与主板、中小板存在差异。由于创业板的高风险、高成长性,投资于创业板上市公司的风险更高。所以在面对创业板限售股解禁这一问题上,投资者所面临的风险更高,且创业板成立时间不久,政府监管部门对于这一问题监管制度不完善,难度更大。本文分析了创业板市场限售股解禁的市场反应,得出结论并提出建议。具体研究方法是通过理论及现状分析提出研究假设,然
贫困是世界性的难题之一,而全面消除贫困,实现共同富裕,是社会主义的本质要求,也是中国共产党的使命。自改革开放以来,中国人民累计减贫7亿多人,取得举世瞩目的减贫成就,但精