基于排序GMM的说话人确认的研究

被引量 : 0次 | 上传用户:mwchy362
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会的不断进步和文明的不断发展,要求对特定说话人的身份进行鉴定的要求也越来越高。在所有的认证技术中,生物特征认证技术因其基于人类自身的生理和行为等特性的独特优势而得到广泛的应用,显示出生物特征认证技术在实际应用中的广阔前景。在已有的生物特征认证技术中,与文本无关的说话人确认被认为是最自然的生物特征认证技术之一,它是通过特定说话人的语音进行说话人身份认证的,也是语音识别研究中非常重要的一个研究方向。绝大多数的与文本无关的说话人确认系统都是基于短时倒谱参数和GMM-UBM-MAP模型结构的,采用这种结构的与文本无关的说话人确认系统已经达到了很高的识别率。系统的识别性能和运算量是选择说话人确认系统的两个最重要的标准。在传统的训练UBM过程中,对于每一个输入特征矢量,需要计算UBM中所有高斯分量的似然分,由于UBM采用高阶的高斯混合模型,并且是由大量的不同冒认者语音训练得到,所以训练UBM的运算量相当大,这在一定程度上限制了基于GMM-UBM-MAP结构的说话人确认系统的应用。针对与文本无关的说话人确认问题,本文深入研究了减少训练UBM的运算量,提高训练UBM的速度的方法。主要研究内容如下:1.详细介绍了基于GMM-UBM-MAP结构的与文本无关的说话人确认系统,讨论了GMM的训练算法和MAP算法。2.介绍了具有良好区分性的SVM模型,深入讨论了SVM应用于说话人确认系统中面临的问题,并比较了GMM-UBM-MAP结构和GMM-Sup-SVM结构的与文本无关的说话人确认系统的性能。3.介绍了两种基于短时分析的声道倒谱参数MFCC、LPCC的提取方法,并且讨论了它们在说话人确认中的有效性和鲁棒性。4.深入分析了训练UBM模型过程中运算量大的问题,介绍一种基于排序高斯混合模型的训练UBM的方法,该方法可以降低训练UBM的运算量,提高训练UBM的速度,它将UBM中各个混合度按照预定的准则进行顺序排列,输入的训练语音帧只需要参与到所有混合度中的部分高斯分量的训练中,从而降低训练UBM的运算量。采用排序高斯混合模型方法训练UBM后,不仅降低训练UBM的运算量,而且几乎不影响系统的识别性能。
其他文献
目的探讨人性化护理对玻璃体切割术(Vitrectomy,VIT)后患者眼部视力变化的影响。方法选择接受VIT手术的110例患者作为研究对象。以简单数字法随机分成观察组55例和对照组55例
<正>2012年3月19日,奥巴马政府宣布美国投资2亿美元启动"大数据研究与开发计划,以帮助解决国家在科学与工程、国家安全、社会治理中最紧迫的诸多挑战问题"。从此,大数据被认
聚偏二氟乙烯(Polyvinylidene Fluoride,简称PVDF)压电薄膜是一种高分子薄膜,因其具有体积小、质量轻、耐化学腐蚀、柔性和加工性能好、声阻抗低、频响宽、介电强度高、稳定
随着人们数字消费水平的需求不断提高,对高清晰电视(HDTV)等数字视频的高性能的需求也与日俱增。数字演播室作为制作电视信号的工厂,在提高高清晰电视性能方面起到源头的作用
由于液体静压主轴具有较高的刚度和承载能力,所以广泛应用于超精密加工机床中。在液体静压主轴工作的过程中,温升和油腔压力会导致结构件变形,从而影响静压主轴的工作性能。
“口述历史”是传播领域里重要的传播现象,它是指通过影像和声音结合的形式,记录、传播当事人的口述或表演。2005年凤凰卫视《口述历史》栏目开播,“口述历史”在中国传播界
稀土六硼化物是一种在现代高科技中被广泛应用的优秀热电子发射阴极材料。然而,目前对稀土六硼化物的研究还主要集中在二元硼化物LaB6的制备、结构与应用上,对其他二元、多元
我国公民的诉讼意识在社会高速发展的大环境下呈积极之势,在庆幸公民选择法律武器保护自己合法权益、运用诉讼之手段寻求正义公平之时,却有一些不和谐的现象在悄然蔓延,且态
<正>1792年的圣诞节,26岁的英国学者约翰·道尔顿特意买了一双适合老年人穿的棕灰色袜子,送给妈妈作为圣诞礼物。谁知母亲接过袜子,打开包装一看,竟然笑着说:"我这么大年纪啦
随着城市发展和环境治理力度加强,混凝土可用原材料自然资源日益短缺。同时由于近些年来在结构设计中不断提高混凝土强度设计等级和配筋率,使得混凝土在配制时不得不尽量加大