【摘 要】
:
说话人识别,作为生物特征识别的重要组成部分,广泛应用于军队安全系统、公安司法、生物医学工程等领域。目前,在安静的实验室环境下以及语音数据充足的条件下,说话人识别技术已经达到令人满意的效果。然而,实际应用环境无法预测,导致说话人识别系统鲁棒性差。因此,本文以提升说话人识别方法在噪声情况下的鲁棒性为出发点,针对说话人识别中特征表达能力不足、模型区分性不够、传统方法中各个模块相互独立训练的问题,提出以下
论文部分内容阅读
说话人识别,作为生物特征识别的重要组成部分,广泛应用于军队安全系统、公安司法、生物医学工程等领域。目前,在安静的实验室环境下以及语音数据充足的条件下,说话人识别技术已经达到令人满意的效果。然而,实际应用环境无法预测,导致说话人识别系统鲁棒性差。因此,本文以提升说话人识别方法在噪声情况下的鲁棒性为出发点,针对说话人识别中特征表达能力不足、模型区分性不够、传统方法中各个模块相互独立训练的问题,提出以下解决方案:1)基于深浅层特征融合的鲁棒性说话人识别方法;2)基于深度模型的鲁棒性说话人识别后端分类决策方法;3)基于端到端联合优化及决策的鲁棒性说话人识别方法。1)针对说话人识别中特征表达能力不足这一问题,本文提出基于深浅层特征融合的鲁棒性说话人识别方法。该方法将经深度神经网络处理过的分块MFCC特征作为深层特征,将高斯均值超矢量作为浅层特征,随即融合两种特征向量,得到包含更多信息、更具鲁棒性的融合特征。鉴于深、浅层特征从不同层面反映说话人信息,通过实现深、浅层特征之间互补的有效融合,从而可以更加全面地表征说话人。此外,为了更好利用特征块之间的关联性,在决策过程引入“投票法”决策机制,进一步提升系统的鲁棒性。2)针对说话人识别中模型区分性不够这一问题,本文提出基于深度模型的鲁棒性说话人识别后端分类决策方法。在高斯均值超矢量特征的基础上,将不同的深度模型作为说话人识别的后端,探究其对传统说话人特征的分类决策能力,确定最佳的分类模型。利用其优秀的分类能力,有效提炼出语音片段里所蕴含的更深层次、更有价值的信息,从而得到鲁棒性更高的说话人识别系统。3)针对传统方法中各个模块相互独立训练这一问题,本文提出基于端到端联合优化及决策的鲁棒性说话人识别方法。首先,采用自定义的滤波器替代卷积网络中的卷积核。其次,构建基于自注意力机制的深度残差网络。最后,通过将传统说话人识别中的特征提取和模型匹配统一到深度模型结构中,以此实现参数的联合优化,同时提升噪声环境下的系统性能。
其他文献
比特币具有匿名交易、手续费低廉、跨国转账便捷等诸多优点,逐渐在全球范围内广泛流行,并在投资管理方面取得了巨大的发展空间。然而,黑客攻击,系统故障或人为过失等问题所导致的比特币丢失,也给个人或企业造成了严重的经济损失。比特币的安全性问题已然成为比特币用户关注的重点。传统对比特币密钥进行单一位置存储的方法,容易使黑客匿名、不可逆转地盗空用户的所有资金。对比特币进行联合控制可有效解决这一问题,攻击者若想
近年来,职业倦怠作为职业领域越来越凸显的职业病,受到了广泛重视。福利院保育员担当照顾儿童、保障儿童顺利成长、健康生活的重要角色。工作任务量大、要求高、弹性时间少、
析氧反应(Oxygen evolution reaction,OER)涉及到许多重要的能源转化系统,例如:可充电金属空气电池,电催化二氧化碳还原,电催化氮气固定以及水分解。由于析氧反应涉及到多质子耦合电子的转移导致其缓慢的动力学过程,因而需要高效的催化剂降低反应势能,提高催化效率。然而铱、钌等具有催化高活性的贵金属催化剂由于其昂贵的成本极大限制了它们的使用。因此开发廉价高效的析氧反应催化剂是降低可
随着无线通信技术的快速发展,用户需求的不断提高,通信系统各项指标的要求越来越高。天线具有收发信号的功能,可实现信号在电信号和电磁波信号之间的转换,是通信系统极其重要的组成部分。现代通信系统要求天线具有小型化、强抗干扰能力、低功耗等特点。为满足现代通信系统的需求,基于MEMS技术的方向图可重构天线阵列成为研究的热点。基于MEMS技术的方向图可重构天线阵列可实现辐射波束的重构,从而可以用一副天线代替多
当前,我国食品加工业的快速发展带来数量众多的食品生产企业,但同时为分布于各地乡镇农村的生产条件较差的食品小作坊带来了发展机遇。发展过程中,政府监管部门在加大对食品小作坊监管力度上做出了应尽的努力,然而处于现阶段“小、散、低”食品小作坊为主的格局还没有根本改观,食品“从农田到餐桌”链条长、体量大、风险触点多。与此同时,面对监管对象数量多、监管面广、中心监管任务重、监管人员少等问题导致监管人员的时间、
本论文研究的C公司是一家致力于手机等移动信息终端产品的研发、设计、制造、销售和服务的现代化高科技企业,在过去的三年里,C公司整合了旗下数十家子公司的系统,由原来的多套不同的ERP系统整合成一套集中的SAP系统,由集团信息科技部统一管理。由于系统的集中管理,IT人员每天疲于处理来自IT用户的散状问题,但仍受到业务部门的各种抱怨和压力,IT管理层充分意识到存在的IT服务管理问题已经制约了IT的继续转型
随着信息技术和移动设备的发展,特别是4G的普及以及5G的商用,视频等网络资源呈现爆发式增长。大规模的网络流量存在于网络中尤其在高峰期会造成网络回程拥挤,使得用户的请求延迟增大,降低量用户的上网体验。如何解决网络拥挤的问题是当下网络结构优化的重点。为了缓解网络拥塞和降低请求延迟,D2D缓存技术成为了一个现代通信网络重要的组成部分。人们总是在网上浏览他们感兴趣的内容。D2D缓存技术可以缓存人们比较感兴
我国的机械行业飞速发展使得XZS研究院公司不得不采取预算控制措施来达到“减支增效”的目的,以维护自己的经济利润。对成本进行有效控制可以提高重型机械制造企业与整个社会的利益,而预算控制作为一项提高利润的有效措施,更是被广泛的运用在研究院所中,财务人员可以通过成本预测、成本核算等成本管理环节对企业的预算进行控制,不仅降低了企业经营成本,还提高了工程施工企业的财务管理能力。XZS研究院是一个主要从事重型
近年来,多智能体系统(MASs)的协同控制理论研究在国内外取得了显著的成果,其成果广泛的应用于实际工程领域中,例如无人机编队飞行、军事防空部署、航天器姿态控制等领域。一致性、编队与包围控制是MASs协同控制中重要的研究方向。相比于一阶系统来讲,二阶系统更具有实际的研究意义,更进一步考虑了速度。引入事件触发机制,可以大幅度的减少控制器的更新频率。在此基础上,进一步考虑通信带宽的有限性,智能体之间通讯
人口老龄化给全球带来劳动力短缺以及政府财政负担加重等现实问题,为了应对和解决这种问题,世界各国的政策制定者试图通过对养老金制度进行改革,来确保个人工作寿命的扩大,以此来开发老年人力资源。我国政府也越来越热衷于提高中老年人的劳动参与率,政策关注点在于对退休年龄进行延迟,考虑如何促进中老年这一群体的就业。当今社会,年轻女性劳动参与率不断提高,这就使得由她们照料孩子的责任转移到了孩子的(外)祖父母一代,