基于区分性说话人模型的与文本无关说话人确认研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:javajava2010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人确认凭借简便的设备与非接触式交互成为目前广泛应用的生物信息认证技术之一,也是语音识别领域的一个非常重要的研究方向,所以,它的研究不仅具有重大的理论意义而且还有非常强的应用价值。   概率统计模型是说话人确认的主流建模技术,基于该模型的说话人确认系统取得了不错的性能,然而,这种模型并不能精确地描述说话人确认这类二元分类问题的边界。近年来,支持向量机以其强大的区分性描述能力,使得它比概率统计模型更好地解决了这类二元分类问题,因而被大量应用到说话人确认上。本文以支持向量机结合其他说话人确认技术作为主要研究内容,并将其用于与文本无关的说话人确认。利用因子分析和Ivector构建了联合说话人确认系统,对联合系统的区分性说话人模型的训练矢量及测试矢量的选取、信道失配补偿策略以及参数的选择等关键问题作了详细的研究,并对它们的性能进行了比较。   首先,针对GMM-UBM-SVM系统在复杂语音环境下不能对语音进行失配信道补偿的问题,我们运用因子分析技术对语音特征进行连续失配信道补偿,使其更凸显说话人信息,并将其与SVM相结合,构建了FA-SVM说话人确认系统,并研究了失配信息子空间的大小对系统性能的影响,最后通过实验验证了经过失配信道补偿后的区分性说话人确认系统性能确实有了提高。   接着,针对FA-SVM系统存在的说话人信息损失的问题,本文研究了Ivector特征矢量,并将Ivector特征矢量与SVM相结合,构建了Ivector-SVM说话人确认系统,详细讨论了系统核函数的选取、系统失配信道补偿方法以及全变量信息子空间大小对系统性能的影响,并通过实验证明Ivector-SVM区分性说话人确认系统性能比FA-SVM系统又有了提高。   最后,针对Ivector-SVM说话人确认系统计算复杂度过高的问题,本文提出了一种基于选择通用背景模型的快速Ivector-SVM说话人确认系统,利用TopN选择策略,在基本保持确认性能的基础上有效地减少了计算复杂度,提高了系统的实用性。
其他文献
本文通过对荣华二采区10
期刊
目的:经皮腔内冠状动脉成形术(percutaneous transluminal coronary angioplasty,PTCA)是目前治疗冠状动脉粥样硬化性心脏病等心血管疾病的一种有效方法,但其远期效果受到再狭窄
太阳能电池能够将太阳能转化为电能,从而备受人们的关注。其中,有机太阳能电池的效率主要是由电子给体和受体材料组成的光活性层决定的。而具有较好的电子亲和性与电子传输能力的富勒烯及其衍生物依然是最常见的电子受体材料。染料敏化剂的性质直接关系到染料敏化太阳能电池(DSSCs)的能量转换效率(PCE)。虽然基于钌(Ru)和卟啉类染料敏化剂具有较高的能量转换效率,但钌资源有限且不易于制备以及卟啉类染料提纯困难
枯落物层和土壤层作为森林生态系统的重要层次,具有调节径流、保持水土、涵养水源等重要的生态功能。九龙山森林作为我国典型的暖温带森林生态系统之一,因属石质山地,土层较薄,其
本文根据曲面的总曲率和平均曲率推导出双三次Bézier曲面片拼接的C2连续条件.
三维姿态是描述空间目标的重要外部参数,在空间目标识别、视觉导航、航天器交会对接等领域都有广泛应用。光学测量是非接触的全场测量,具有抗干扰性强,设备简单,稳定可靠的优点,被
本文研究了基于压缩感知的遥感图像融合方法,以及纹理特征辅助光谱特征进行遥感图像分类的方法。本文提出了一种基于压缩感知的遥感图像融合方法,该方法首先将多光谱遥感图像进
电磁超介质作为一类新型的人工电磁材料,由于其奇异的电磁特性,在电磁学及相关领域掀起了一股新的研究热潮。电磁超介质的理论研究已取得很大的进展,其在卫星通信、雷达、微
盐分胁迫主要包括渗透胁迫及离子胁迫。渗透胁迫、离子胁迫及其造成的一系列次级胁迫如氧化胁迫等,严重干扰植物体内业已存在的细胞及整株水平上的水分及离子稳态,造成植物细胞
二进制偏移载波(Binary Offset Carrier,BOC)调制有码跟踪精度高、抗干扰和抗多径能力强等优势,是一种适应新型卫星导航系统的调制形式。但由于卫星导航系统使用的伪码周期较长,使