基于时域信号的端到端的说话人识别算法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户：lee419444083

【摘要】

：

随着科学技术的高速发展,网络信息化时代下社会对信息安全的需求日益增长。如何准确识别某个人的身份,更好地保护个人的信息安全是智能化时代亟待解决的关键问题。生物特征识

【作者】

：

梁宁欣

【出处】

：

华南理工大学

【发表日期】

：

2004年期

【关键词】

：

说话人识别语音特征深度神经网络时域卷积

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着科学技术的高速发展,网络信息化时代下社会对信息安全的需求日益增长。如何准确识别某个人的身份,更好地保护个人的信息安全是智能化时代亟待解决的关键问题。生物特征识别作为一种利用人的生理和行为特征来进行个人身份认证的技术,因其兼具生物特征方便、安全和高效的特点逐渐获得越来越多的关注。其中,说话人识别技术,又称声纹识别技术是生物特征识别领域的热门研究方向之一,具备声纹语音特征稳定、唯一、便于采集等优点,被广泛应用于人机交互、身份识别等现实场合中。深度学习的引入进一步促进了说话人识别技术的发展,基于神经网络的端到端的说话人识别技术吸引了众多科研工作者,然而,目前端到端的说话人识别系统普遍采用“分而治之”的流程:即先从原始语音信号中提取出传统的语音特征,如梅尔频率倒谱系数,再基于传统的语音特征进行说话人分类器网络的训练。这种方法通常依赖于人工设计固定的、复杂的传统语音声学特征,并且传统语音特征的提取和说话人识别模型的训练往往是单独进行的,并未从整体的角度出发,难以实现语音特征提取及说话人识别分类的共同优化。因此如何有机地结合说话人语音特征的提取器和说话人识别的分类器,实现端到端的说话人识别算法是有必要的同时又是极富挑战性的课题。针对上述问题,本文提出了一个新的端到端的说话人识别框架:基于时域卷积直接从原始时域信号提取语音特征,并搭建基于深度神经网络的说话人分类器模型,从而实现说话人的身份识别。本文的主要工作有:第一,提出了一个新的基于时域信号的端到端的说话人识别框架,即联合语音特征提取器、基于深度神经网络(Deep Neural Networks,DNN)的分类器、AM-Softmax和Triplet损失函数的说话人识别框架。该识别框架能够实现共同优化语音特征的提取和说话人的识别分类,并达到稳定、准确的说话人识别目的。第二,提出了一种新的基于时域卷积的语音特征提取方法,该方法能够从原始的时域信号中学习提取出一种有效的时间域语音特征表达(Raw-Front Feature),并且可以替代传统的固定语音特征嵌入到说话人识别系统中,提高了直接从时域信号中提取语音特征的准确性和鲁棒性。第三,为验证本文提出的新的语音特征提取方法的可行性,以及该方法在端到端说话人识别框架中的可移植性,本文搭建了多个将时间域语音特征(Raw-Front Feature)作为输入和不同深度神经网络作为分类模型的文本无关说话人识别系统,探讨了基于时域卷积的语音特征提取方法在端到端的说话人识别技术上的应用。在开源数据集CSTR VCTK Corpus和TIMIT上的大量实验结果对比和分析表明,本文提出的新的基于时域信号的端到端的说话人识别框架能够分别取得1.93%和9.61%的等错误率(Equal Error Rate,EER),实现了良好的说话人识别准确率性能。并且相比于传统的语音特征方法,本文提出的时间域语音特征表达在固定分类器模型实验配置下,能够获得更低的EER值。

其他文献

工程给排水管道施工质量控制

给排水施工作为建筑工程施工的主要项目之一,其施工质量直接决定了建筑工程的成败.所以,在建筑工程施工过程中,必须格外重视给排水管道施工质量,才能确保给排水管道投入使用

期刊

建筑工程管道施工存在问题控制措施

64例视网膜静脉阻塞的治疗体会

目的进一步探讨视网膜静脉阻塞的治疗方法。方法对近2年在我院就诊的64例ROV患者的治疗方法进行回顾性分析。结果治疗3个月后复查,64例患者中39例视力提高,19例视力不变,4例

期刊

视网膜静脉阻塞治疗

消炎痛和安络血联合云南白药治疗放环后宫内出血的疗效对比研究

目的研究消炎痛和安络血联合云南白药治疗放环后宫内出血的疗效比较。方法对近几年来分别使用消炎痛和安络血联合云南白药治疗放环后宫内出血的临床资料进行分析和讨论。结果

期刊

消炎痛安络血放环后宫内出血疗效

256排CT低剂量胸痛三联扫描对自由心率患者的可行性研究

目的探讨256排CT在低剂量下对自由心率(Heart rate,HR)患者行胸痛三联扫描的图像质量。方法收集我院155名胸痛患者,随机分为研究组和对照组,研究组85人,在100kV下行胸痛三联(Triple rule-out,TRO)CT血管造影(Computed tomography angiography,CTA)检查,对照组70人,在120kV下行胸痛三联检查。分别记录两组患者的性别、年龄、

学位

胸痛急性冠脉综合征主动脉夹层肺动脉栓塞计算机体层摄影

课程标准与评价一致性评估新方法——一致性通用评估工具介评

课程标准与评价一致性研究是课程评价领域的重要话题。当前最具代表性的三大一致性测评模型--韦伯分析模式、成功分析模式、课程实施调查模式,各有特点又存在不同程度的局限

期刊

一致性通用评估工具课程标准与评价一致性一致性

复杂场景下的红外弱小目标检测

红外弱小目标检测是当代及未来先进武器系统的核心技术之一,在工业、交通、安保、医疗、天文等民用领域也有着广泛应用需求,已成为计算机视觉领域的一个热门研究课题。红外弱

学位

红外小目标检测尺度自适应管道滤波光流法Adaboost

某些子群正规或唯一的有限p群

有限p群是有限群最基本和最重要的分支之一.近年来,随着有限单群分类的最终完成,有限p群的研究才变得越来越活跃.群论研究的许多领头科学家,如G. Glauberman, Z. Janko, A. M

学位

有限p群J群C(p~w)群AI_i群

闽东室内蜚蠊种群分布调查

闽东室内蜚蠊种群分布调查福建省宁德地区卫生防疫站（宁德，３５２１００）袁高林，陈文锦为了解闽东地区蜚蠊种群及分布情况，我们在各县、市城关及沿海集镇选择卫生状况、建筑结构具有代表性生境

期刊

蜚蠊目蟑螂种群分布调查

切削镍基高温合金GH4169的刀具磨损机理研究

切削镍基高温合金GH1469时,因其特殊的机械和物理性能,切削力大,切削温度高,切削变形复杂,刀具磨损严重。为解决切削GH4169时刀具磨损非常严重的问题,通过进行切削实验对刀具

期刊

GH4169刀具磨损最佳切削温度GH4169tool wearoptimal cutting temperature

穿透增强型光热-化疗抗肿瘤纳米药物的制备和研究

目前,恶性肿瘤已成为导致人类非正常死亡的最主要的疾病之一,针对肿瘤治疗的研究已成为生物医学领域最主要的研究方向。在肿瘤组织中,有一部分特殊的肿瘤干细胞样细胞群体,此类细胞不仅具备较高的耐药性且多数特异性过表达CD44蛋白,在特定刺激下还可以分化产生重新维持肿瘤增长与转移的肿瘤细胞。在肿瘤的治疗过程中,如果药物不能有效清除肿瘤干细胞,肿瘤也有较大可能会复发与转移。因此肿瘤治疗的关键在于减小肿瘤体积的

学位

肿瘤干细胞壳聚糖光热化疗协同作用

基于时域信号的端到端的说话人识别算法研究

与本文相关的学术论文