基于GMM-UBM的快速说话人识别方法

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:zxhdbd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本无关的说话人识别,由于其实际应用下的灵活性,而成为语音识别领域的研究重点。自从1999年美国国家标准技术研究所(National Institute of Standards and Technology,NIST)举办的评测中,高斯混合模型——通用背景模型(Gaussian Mixture Model - Universal Background Model,GMM-UBM)作为基准系统获得优异识别率后,该方向的研究都以其为基准模型,并对其进行改进。尽管说话人识别系统已经取得了比较令人满意的效果,但进行匹配前需大量的似然分计算,由于该因素的影响使得系统识别速度明显下降,因此实用性不佳。本文的主要目的是在尽量不降低识别率的前提下,减少计算量以实现快速说话人识别。针对说话人识别中计算量大、运行速度慢的情况,本文在基于树形结构的核心挑选算法基础上进行改进,自顶向下搜索UBM中输出测试语音特征矢量似然分最高的分布,此后与目标说话人模型匹配时,只需计算核心分布的似然分进行识别。改进算法应用到基准系统后,核心挑选速度提高了14.7倍。鉴于特征序列对最终的识别结果无影响,因此系统结合矢量序列重排的剪枝算法后,整个系统速度提高到21.7倍,识别率略有降低。为了提高识别率,论文中将支持向量机(Support Vector Machine,SVM)中径向基核函数引入到说话人识别中,识别率提高到与基准系统一致。本文针对女性声音在开集识别时识别率下降明显的情况提出了概率阈值的思想,应用于基准系统后速度有所下降,识别率提高了0.7%。同时对分段置信分改进来解决部分匹配情况对最终识别结果的影响,本文中采用不同的参数来进行实验比较,最终选择每一小段的平均值作为该段的置信分,然后通过三层前馈网络形成最后的置信分,实验证明与使用似然比的基准系统比较,集内正确率提高了2.6%,集外错误率下降了2%。
其他文献
<正>解决"四风"问题在行政系统及机关中的突出表现就是"庸、懒、散"现象,虽经治理,仍难解决。福建省统计局积极转变机关管理思路,探索出一种全新的、透明式的机关日常管理模
根据《中华人民共和国审计法》的规定,审计署2013年对中国兵器装备集团公司(以下简称兵装集团)2012年度财务收支进行了审计,重点审计了兵装集团总部及所属保定天威集团有限公司
报纸
随着云计算、大数据技术的快速发展和应用,高等院校网络运行积累了海量的数据资源,网络安全防御凸显的更加重要。网络安全态势评估可以采用先进的支持向量机技术评估高校信息
综述早老素突变在阿尔茨海默病发病机制中的作用,涉及β淀粉样肽的生成、自噬过程、钙稳态、细胞凋亡、Notch信号通路及Wnt信号通路等。
“审察病机,无失气宜”。早在《黄帝内经》时期,先贤就告诫后世在诊疗中审察病机的重要性。唐代王冰对病机一词的解释是“病机,病之机要也。得其机要,则动小而功大,用浅而功
查阅CNKI数据库,就近10年关于相关经穴与非经非穴、非相关经穴的比较研究中发现,相关经穴与非经非穴、非相关经穴在机体处于生理状态、病理状态、针刺干预态时反映有差异;针
<正>春晓春眠不觉晓,处处闻啼鸟。夜来风雨声,花落知多少。孟浩然本为唐代山水田园诗派的代表诗人,然而却以一首小巧玲珑的《春晓》诗饮誉诗坛。此诗为当前凡中国学童皆能吟
本论文研究了农药西维因在土壤和炭质吸附剂中的吸附/解吸行为及CaCl2浓度对吸附/解吸作用的影响,同时研究了人工加入活性炭和木炭的土壤对西维因的吸附/解吸行为及CaCl2对吸
为了解决三维地震勘探技术在巨厚黄土塬和千米深层煤炭勘察中的应用难题,宁中煤田针对陇东黄土高原等特殊的地质条件开展了多项实验,最终确定了三维地震技术在该地区野外施工