基于潜在信息学习的说话人确认方法研究

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:ppp9904140
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人确认是一项根据说话人的声音特性进行身份验证的生物识别技术。随着科技的发展,说话人确认领域的研究已经取得了巨大的进展,并在实际应用中逐渐发展壮大。如何从大量语音数据中凝练出准确的说话人身份信息,成为说话人确认任务中最值得关注的问题。为此,需要深入研究能够代表说话人身份特性的特征表示。然而,目前方法未能充分利用说话人特征空间、说话人特征表示中隐藏的潜在信息。针对这一问题,本文将围绕如何充分利用说话人特征空间的先验信息、降低说话人特征空间受类别失衡的影响、挖掘说话人特征表示之间的相关性信息来进行研究,以此提升说话人确认系统的准确性。具体研究内容如下:(1)在充分利用说话人特征空间先验信息方面,提出基于贝叶斯主成分分析的说话人确认方法。此方法将贝叶斯主成分分析引入到总变化空间的学习过程中,利用先验分布来补充开发集数据中欠缺的信息。在先验信息的约束下能够凸显总变化空间中有效维度的作用,削弱无效维度的影响。进而增加总变化空间中包含的有效信息,最终提升其对说话人信息的表示能力。实验结果表明,在开发集数据量匮乏的情况下,相比于传统的总变化空间学习方法,所提出方法能够有效补充说话人信息,提升系统性能。(2)在降低说话人特征空间受类别失衡的影响方面,提出基于类别贡献平衡的说话人确认方法。此方法将平衡不同类别数据对特征空间的贡献作为优化目标,其在多分类交叉熵损失的基础上通过引入类别平衡因子,来均衡控制各类说话人特征对网络模型训练的影响,从而在提升模型对小规模样本类别数据的关注度的同时,保证大规模样本的关注度,以便从数据中更公平地挖掘出潜在的说话人信息。实验结果表明,与典型的多分类损失函数相比,所提出方法能够有效缓解类别失衡的影响,从而提升系统的性能。(3)在挖掘说话人特征表示之间的相关性信息方面,提出基于深层信息散度最大化的说话人确认方法。此方法将能够计算分布间相似度的信息散度引入到目标函数的表示过程中,以最大化说话人特征之间的统计相关性作为神经网络的优化目标,来挖掘同类特征之间必然存在的潜在相容性信息,并提升异类特征在特征空间的差异性。从而更加准确地刻画深层特征空间的抽象关系,最终有效提升说话人特征表示的区分性。实验结果表明,相对于其他深度学习方法,所提方法显著提升了说话人确认系统的性能。
其他文献
电源变换技术的飞速发展,带动了电力电子设备的大量应用,一方面使电能的转化和应用变得方便,另一方面使电网的电能质量严重降低。有源电力滤波器(APF)可以全面解决电能质量问题,具有体积小以及动态性能良好等优点。传统两电平拓扑结构的有源电力滤波装置对于中高压场合并不适用,在向多电平拓展时,由于使用过多的功率器件和储能元件,使得装置体积变大,成本提高,因此在中高压场合多电平有源电力滤波装置的拓扑结构逐渐成
学位
随着单件复杂产品需求的不断扩大,以缩短加工用时为主要课题的研究取得了相当可观的进展,特别是综合调度的提出给行业制造带来了新思维。虽然综合调度领域已经取得了许多成果,但这些算法没有从子树等级方面解决加工效率的问题,以及利用子树等级解决中间费用的问题。针对紧前工序加工完毕后产生的中间产品若不立刻进入装配,其存储费用会随等待时间增长的问题,首次提出考虑中间费用的子树等级综合调度算法。该算法采用子树等级调
学位
随着科技的飞速发展,可穿戴智能设备如今变得无处不在,移动群智感知基于这些智能设备为智慧城市的发展提供了新的可能。如今,智能设备内置了各种价钱低廉但功能强大的传感器,如陀螺仪传感器、GPS、加速度传感器、相机和麦克风等。移动群智感知充分发挥这些智能设备的作用,合理利用这些内置传感器,把参与式感知扩展到了一个新的高度,一方面参与感知的用户收集数据,另一方面获得感知用户贡献的数据。任务分配是移动群智感知
学位
随着人们日常生活与社交媒体的关系越来越紧密,微博作为当前最为重要的社交、信息来源平台,其中夹杂的谣言信息左右着网民的对事件的认识、动摇着社会和谐稳定。针对当前社交平台存在谣言但平台甄别慢、响应不及时的问题。基于深度学习的谣言检测方法以其高效、准确的特点越来越受到关注。经分析,在谣言检测时融合评论情感特征与正文文本特征对提升谣言检测的表现有积极意义,因此,本文针对微博谣言提出一种融合情感特征和文本特
学位
随着高光谱遥感数据的广泛应用,高光谱遥感图像分类任务在遥感研究领域得到了快速发展。但在实际分类任务中,遥感图像中不同地物的分布情况复杂,需要专家花费大量的人力物力对无标签样本进行标记,从遥感图像中获取大量的标记样本变得十分困难,导致被标注的已知地物类型非常稀缺。因此,在小样本情况下提升高光谱图像的分类性能,不仅需要考虑利用少量标签样本和大量无标签样本,同时还要考虑解决无标签样本人工标记代价高的问题
学位
近几年,国家在对各省市制定公路基础设施建设方案以及确定相关投资规模大小时需要充分考虑公路建设所带来的效益,公路建设的效益来自于公路运输,公路运输的发展取决于公路货物运输量,因此本文的研究目标就是围绕用少量的模型实现31个省份公路货物运输量增长趋势的预测,通过采用先聚类后预测的方式减少预测模型和模型参数的数量,简化预测工作。具体工作内容如下:根据公路货物运输量时间序列数据的实际情况,提出一种时间序列
学位
随着空间数据库以及GPS系统的不断发展,用户的海量轨迹存储逐渐变为现实,针对轨迹数据的查询技术也成为众多学者的研究热点。但是同时由于轨迹数据中蕴含着大量的用户个人信息,一旦被泄露则会对用户的个人隐私造成严重后果,因此对于轨迹数据的隐私保护问题也成为时下急需解决的问题。由于GPS系统精度问题以及传送延迟等因素的存在,造成了轨迹数据的不确定问题的产生。基于以上原因,本文解决了不确定轨迹的隐私保护问题。
学位
乳腺癌被认为是全球最常见的癌症,也是导致癌症死亡的主要原因。目前临床尚无系统性的乳腺癌早期无创鉴别诊断方法,本文将为临床早期甄别乳腺癌,实现乳腺癌精准治疗提供全新的诊断方法与治疗策略。通过机器学习、系统动力学等计算建模方法,找到各数据信息间与乳腺癌诊断、治疗的关联,来判断乳腺癌的发生和发展,并应用到乳腺癌的早筛、早诊、性质判断、手术决策、预后评估等临床诊疗任务中去。本文首先对超声检测数据与病理预后
学位
语义社交网络中的社区发现是在线社交网络分析中的重点及难点问题,近年来得到了各个领域研究者的广泛关注。现有方法大多以用户对话题的倾向性为基准生成社区,忽略了话题影响力本身以及话题传播在社区发现中的影响和作用,生成的语义社区一般拓扑结构较为分散,可解释性较差。为了解决这一问题,我们开展了基于话题影响力渗流的语义重叠社区发现方法的研究。归纳而言,本文主要完成的工作包括:1.节点坐标在话题传播空间的表示。
学位
纯电动汽车具有两大核心技术问题,即电机及其控制器技术和电池及其充电技术,它们对电动汽车的性能和续航里程具有深层影响。本文基于传统电动汽车电机控制器拓扑结构,采取分时复用IGBT功率模块的形式,扩展电机控制器的自身功能,使控制器同时实现电机驱动和车载动力电池充电两大模块的功能。提出驱动-充电一体化控制器结构并阐述其工作原理。在拓扑层面进行解耦分析,分别建立集成拓扑中两种双向变换器的数学模型,为控制策
学位