基于深度学习的多人混合语音声纹识别研究

来源 :长春理工大学 | 被引量 : 0次 | 上传用户:willian_tang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,日新月异的深度学习研究有力推动了人工智能技术的突破和发展,也对众多社会行业产生了深远影响.在声纹识别领域,基于深度学习的智能算法不断实现性能新突破,使其逐渐从实验室研究走向金融、国防、政府等不同领域和部门的实际场景应用.目前而言,对于多个人同时说话的混合语音场景,声纹识别的效果还有待进一步提高.“多人混合语音”是现实情形中的普遍场景,由于这类混合语音中含有其他说话人的语音信号,使得目标说话人的声纹特征难以有效提取,从而导致现有模型在面对多说话人的混合语音时较难做出正确判别.针对该问题,本文基于孪生残差网络等深度学习方法对混合语音声纹识别算法开展研究,提出了一种新的用于声纹识别的混合语音处理方法,即通过残差网络分离混合语音的“纯净”声纹嵌入,再将提取到的声纹特征用于说话人识别的算法框架.具体而言,先基于深度学习方法提取纯净语音的深度声纹特征,将该特征作为混合语音分离声纹特征残差网络的学习标签,从混合语音中分离出与其组成语音深度声纹特征相似的表示,则该特征可作为表征混合语音说话人身份信息的特征,最后用分离混合语音特征的方法进行多说话人验证实验,EER降到了9.44%的,相比于直接提取混合语音特征的方法降低了52.8%.为了进一步提高混合语音多说话人验证算法准确性,针对混合语音特征分离网络的标签判别性不够明显等问题,本文通过集成A-Softmax损失函数和对比损失函数,构造了余弦对比角聚合损失.该损失函数可以学习类内更加紧凑、类间更加分离的声纹特征标签.基于改进深度声纹特征标签的验证实验结果表明,余弦对比角聚合损失构造的算法新框架,等错误率为9.04%,在原来基础上进一步下降了4.2%.
其他文献
含抗生素类废水处理难度大,高级氧化技术是清除水中抗生素类污染物的重要技术,单一的高级氧化技术净水能力有限。如光催化剂存在光生电荷和空穴容易复合、光响应范围较窄等问题;过硫酸盐氧化技术处理废水效率较高,但是催化剂的重复使用性通常较差。把光催化技术和过硫酸盐氧化技术相结合,有望极大的提高废水处理效率和催化剂的重复使用性。本论文分别探究了BiVO4纳米纤维的光催化降解性能和CoFe2O4纳米纤维活化过一
学位
稀土离子掺杂的上转换发光材料在固态激光器、深海探测及医学等领域有广泛的应用价值。含Na Bi(Mo O4)2晶相的透明玻璃陶瓷在高温情况下性质稳定,被认为是良好的发光基质材料。本文通过熔融法结合热处理制度制备了不同Si O2含量的透明玻璃陶瓷,通过差示扫描量热法(DSC)、X射线衍射(XRD)、扫描电子显微镜(SEM)、密度、显微硬度等分析,研究了原料组成对Na Bi(Mo O4)2微晶结构及性能
学位
目前我国土木工程建设体量和混凝土用量均位居世界首位。天然砂石作为混凝土的重要组成部分,面临资源日益枯竭的危机。机制砂石已经广泛应用于混凝土中,但开采天然石材将不可避免的破坏生态,且带来噪音、灰尘等环境污染。将尾矿作为骨料应用于混凝土中,作为天然砂石的替代品,可实现变废为宝,大幅度的降低生产成本。本文结合湖南省锡矿山锑尾矿排放量和堆积量过大的现状,首次提出将锑尾矿废石用于混凝土的粗骨料。通过对锑尾矿
学位
燃料电池凭借着其节能、高效、污染小、轻便易携带等优点,成为现在社会的关注点。钯基纳米材料可以用作电极材料,但是在实际应用中钯易受到反应中间体一氧化碳的影响,容易中毒失去催化活性。为了克服一氧化碳毒化的影响,提高钯基材料的工作寿命,可以对材料表面结构调控,获得更大的比表面积,从而有效提高钯基纳米材料的电催化活性和抗毒化性能。本论文通过制备钯基合金纳米结构,对材料的表面结构进行调控,以提高钯基纳米材料
学位
光催化技术因其高效率、可再生的特点已广泛应用于废水处理。然而,光催化产物中会含有部分难降解的中间体影响净水效果。微生物降解通过对高性能微生物的驯化,能够有效的将光催化产生的有毒中间体进一步降解、矿化。为实现废水中污染物的完全降解,光催化氧化-微生物降解耦合体系应运而生。本文通过设计、制备高性能光催化材料并结合微生物培养、驯化,构建光合细菌/金属/g-C3N4多级孔泡沫耦合体系(ICPB),以氟喹诺
学位
智能交通卡数据(Smart Card Data,SCD)样本量大、持续采集、时空信息丰富,记录了大量乘客的出行信息,从出行信息中可以挖掘乘客出行规律,利用出行信息对乘客进行分类,有助于展开对特定人群的调查研究、优化城市交通系统以及构建人群社会网络.城市轨道交通带来诸多便利的同时,也给公共卫生事件应急管理带来了挑战,公共出行对疾病传播有着至关重要的影响,根据乘客出行规律,建立乘客出行仿真模型,研究传
学位
水是人类生存和社会发展必不可少的物质要素之一。水资源问题对人类的生存构成了严重威胁,同时印染废水的排放,又加剧了淡水资源短缺。近年来,过硫酸盐高级氧化法已被用于降解废水中的有机污染物,钙钛矿由于具有成本较低、制备简便且稳定性好等一系列优点,已被广泛应用于过硫酸盐的催化活化。在本论文中,我们通过静电纺丝技术制备催化剂前驱体,经高温退火合成了具有氧空位的钙钛矿型催化剂,并探究了制备的催化剂活化单过硫酸
学位
氟喹诺酮(FQs)类抗生素广泛用于人类、兽类疾病、畜牧业、水产养殖等行业,对于社会的健康发展起着重要作用,由于FQs的大量使用,FQs残留开始威胁水生环境以及人类安全。荧光印迹法兼具特异选择性和荧光检测的优点,可以用于诺氟沙星(NOR)的高效便捷、高灵敏可视化检测。相比于其他需要昂贵仪器和复杂样品前处理过程的检测方法,这类传感器制备简单、稳定性好、性价比高,成为医学、环保等领域的研究热点。本论文结
学位
期刊
高压直流电绝缘材料在远距离和大容量电力传输时,由于损耗小而展现出明显优势,但在高压直流电场下空间电荷积累易引起击穿,从而降低绝缘材料的可靠性和使用寿命,因此,研究高压直流电绝缘材料具有重大理论意义和实际应用价值。本文以线性低密度聚乙烯(LLDPE)、聚苯乙烯(PS)、聚乙烯接枝聚苯乙烯产物(PES)和乙烯-丙烯酸共聚物(EAA)为主要基材,分别以石墨烯(GR)和六方氮化硼(h-BN)为纳米填料,制
学位