具有噪声自学习与适应能力的鲁棒说话人识别

来源 :苏州大学 | 被引量 : 0次 | 上传用户:dingbinqi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别是一种以人的语音信息来鉴别说话人身份的生物识别技术,目前一些比较成熟的生物识别技术如指纹识别和人脸识别技术已经在商业应用上取得了很大的成功,与此相比说话人识别技术凭借易获取、经济性以及非接触性等独有的优势,在金融服务、国家安防、司法公安和医疗教育等领域都有着广阔的应用前景,存在着巨人的潜在商业应用价值。
  经过半个多世纪的发展,说话人识别技术在实验室环境下已经取得了很大的成功,其识别率呵以达到95%以上。但由于说话人识别技术自身存在的对环境噪声敏感,易被模仿攻击等特性,同前距离大规模商用还有一段路要走。当说话人识别系统面临实际应用时,一旦应用环境和训练环境不一致,其性能会急剧下降。并且,由于环境噪声的多变性,系统训练时无法预测实际应用中的环境噪声,这样的话一些针对特定噪声的处理方案可能会达不到预期的效果。本文分别在经典的GMM-UBM框架和近几年流行的i-vector框架下对噪声鲁棒的说话人识别技术进行了探究,主要研究内容如下:
  1)在GMM-UBM框架引入环境自学习和自适应思想,通过改进的矢量泰勒级数(VTS)刻画环境噪声模型和说话人语音模型之间的统计关系,提出一种具有环境自学习能力的鲁棒说话人识别算法。系统应用中每当环境变化时利用语音输入前采集到的环境噪声信号来迭代更新环境噪声模型参数,进一步基于VTS确立的统计关系将说话人语音模型自适应到实际应用环境来补偿环境失配的影响。说活人辨认实验结果表明,提出的方法在低信噪比条件下对于不同种类的噪声都能显著地提升系统的识别性能。
  2)在i-vector框架下进一步探究了矢量泰勒级数噪声补偿方案,结合i-vector矢量的统计特性,从特征域出发,利用矢量泰勒级数方法得到的含噪与纯净特征间的关系,在i-vector空间推导出含噪i-vector矢量和对应的纯净i-vector矢量之间的统计关系,最终可以实现在i-vector空间直接对含噪i-vector矢量进行去噪。实验结果表明这种i-vector空间的直接去噪方案要比在特征域用矢量泰勒级数进行特征补偿效果好。
其他文献
个人所得税是我国税收收入的主要税种,有着筹集财政收入、调配居民收入的主要职能作用,是国家进行宏观调控的调节工具。自1980年,我国征收个人所得税以来,为适应我国社会经济环境以及居民个人收入的变化,个人所得税政策不断变迁,先后经历了六次修订,个人所得税制度逐步得到完善。作为税务研究领域的一个主要部分,对个人所得税的政策体制进行科学的研究探讨是进行税务研究的关键基础。通过对个人所得税制度变迁的政策分析
处于国家治理体系末端的基层政府,其工作目标是多重的而非单一的,这种多重目标可分为来自上级和自身的两个方面。而对于基层政府而言,上级政府分为中央、省、市、县几个层级,这些层级的工作目标的设立对基层政府既构成考核压力也构成多重目标的激励。其中,中央层面通过制定各项工作相关条例,省、市、县级的通过制定相关工作具体考核激励机制,基层政府领导干部、基层政府负责具体工作相关部门对基层政府的工作存在“多重目标”
学位
乡镇公务员是将党和政府与基层人民群众紧密联系在一起的特殊群体,其服务意识和办事效果决定了党政机关等公共部门行政服务效能的提升以及群众的幸福感、获得感和满意度,也直接决定了社会的综合治理水平和发展进步。党的十九大以来提出了乡村振兴战略,基层三农问题成为重中之重,因此建设一支整体素质优化、干事创业能力强的乡镇工作队伍十分迫切。长期以来,由于基层工作的复杂性、艰苦性以及晋升空间狭小、薪酬待遇偏低等因素,
“一次办好”即“一次办结、群众满意”,主要是为人民群众和企业纳税人办好一件事为出发点,进一步转变政府职能、提升服务质效,是从服务对象的角度对政务服务提出更高的要求和标准,也是对“放管服”改革和“最多跑一次”等改革理念的深化拓展。按照深化推进“放管服”改革部署和省委省政府“一次办好”改革要求,税务部门精细、到位落实办税事项“一次办好”,是回应纳税人期盼、提升纳税服务满意度进而提升税法遵从度的重要措施
学位
实现乡村振兴,环境治理必须放在关键位置,为积极响应“绿水青山就是金山银山”的发展理念,地方各级人民政府纷纷加大环境治理力度,积极开展保护环境、改善生态的措施,为建设美丽家园投入更多资金,在全国范围内取得了显著效果。然而,在最基层的农村,一些固有的问题依旧存在,相关环境问题十分棘手,生态日益恶化,水污染、大气污染、土壤资源污染的问题持续加重。近些年来,W镇在生态环境治理方面开展工作,取得一定成效,也
学位
灾害救护、战场救治、疫情防护以及中小型医疗门诊检测等应用条件下,伤员/病人生化指标的检测有着至关重要的作用。常见的生化检测仪体积庞大、环境条件要求高,不适用于灾害、野外环境;全自动化生化检测仪大多操作复杂、造价昂贵,难以普及到基层医疗机构。因此,研制出体积小、多参数、精度高、易操作、价格低、适用广的微小型急诊生化检测仪,能有效提高我国医疗检测水平,具有重大的社会价值。  针对灾害救护、战场救治、疫
自石墨烯发现以来,二维纳米材料由于其优异的机械、光学、电学等性质受到了各个领域研究者们的广泛关注。二维二硫化钼(MoS2)作为一种经典过渡金属硫化物(TMDs)材料,已经在催化、传感、光电检测等领域展现出了巨大的应用潜力。不断成熟的应用领域推动了MoS2材料的制备研究,但二维MoS2的制备技术和形貌调控手段仍然存在着许多问题与挑战。本文针对MoS2在生长基底上普遍存在的分布均匀性问题进行研究,并对
学位
氮化铝钪(ScAlN)压电薄膜材料具有声速高,热稳定性好、带隙宽、尤其是与CMOS工艺兼容等显著优点,同时可以克服氮化铝(AlN)压电薄膜存在的压电系数小、机电耦合系数低等不足,在体声波、声表面波、能量收集、超声探测以及场效应晶体管中具有重要应用,是近年来各国争相研究的热点之一。论文针对高端MEMS/NEMS压电器件中氮化铝钪功能薄膜的制备及性能表征等关键科学技术问题开展研究,具有重要的需求背景。
学位
大脑是人体非常重要的器官,脑科学的研究越来越受到中国及世界各国科学家的关注。研究环境因素对脑电信号的影响,结合各种脑电信号所代表的生理心理意义,可以通过控制环境的布置来有效提高工作效率与生活质量。本文旨在利用脑电波信号检测技术和嵌入式技术,对各种不同视听环境下的脑电信号进行检测,以研究各种视听环境对脑电信号的影响机制。最后利用视听环境对脑电信号的影响机制设计一套自适应的睡眠辅助系统。  论文首先对
煤粉锅炉是我国近几十年来电厂锅炉的主要形式。目前煤粉锅炉面临的最主要问题是启动时点火时间长、耗用点火油量大及低负荷时燃烧时不稳定等。由于在我国能源结构中,煤炭的资源丰对较丰富,而石油短缺。所以通过探讨在电厂煤粉锅炉采用无油点火燃烧器替代普遍的油枪点火方式,可以为国家和社会节省大量燃油。另外,《火电厂大气污染物排放标准》(GB13223-2003)对火电厂氮氧化物的排放浓度也做出了明确的要求,火电厂