声纹识别中的时变鲁棒性问题研究

来源 :贵州大学 | 被引量 : 1次 | 上传用户:zhghliu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
声纹识别又称说话人识别,是生物特征识别的一种,自从声纹识别被提出以来,就有研究学者提出声纹识别的识别率是否会随着时间的变化而发生变化,经过多年的研究表声纹识别的识别率会随着时间的变化而发生变化。因此本文对声纹识别中的时变问题进行研究,主要工作包括:1.建立适合声纹识别时变特性的数据库。根据现有时变数据库可知时间越长识别率越差,但是较短的时间间隔同样也会对识别率产生影响。因此,结合实际应用,提出该数据库的设计原则:以一周为间隔,且等时间间隔,文本无关建立数据库。2.对说话人特征的时变特性进行分析。为了了解说话人特征的时变特性,需要减少其他因素的影响,因此我们选择同一个人在不同时间的相同文本进行分析,通过动态时间规整(DTW)发现时变特征的线性变化规律。根据线性变化的规律,采用不同的方法解决声纹识别中的时变鲁棒性问题。3.提出通过更新模型来提高时变鲁棒性的方法。以时间轴为位移方向,不断地更新训练模型的数据,同时去除相应时间较远的数据,从而做到不断更新训练模型,采用更新模型的方法提高鲁棒性是最直接并且最有效的办法,这样的方法可以保持与时俱进,有着良好的效果,但是同时也会大量的数据存储问题。4.声纹识别中的时变问题,在某种程度上可以看作是信道的变化,根据人的发生原理,人发声的变化主要是由于声道发生了变化,而声道的变化可以认为是信道的变化,在解决信道变化的问题上,在语音识别上就已经有人使用联合因子分析(Joint Factor Analysis,JFA),以及更进一步的发展的i-vector技术。因此本文利用i-vector技术利用解决说话人识别中时变问题。5.在使用i-vector的模型下,根据特征的时变特性,提出基于概率线性判别分析(Probabilistic Linear Discriminant Analysis,PLDA)的解决方法。由于特征随着时间的变化呈线性变化,我们认为可以通过PLDA学习出时变特征的线性变化,从而解决时变鲁棒性问题。
其他文献
在步入21世纪以来,网络技术飞速发展,对人们的日常生活有了深远的影响。尤其是处于科学研究前沿的高校之内,过去的高校规模较小,人员与数据资源较少,仅仅通过人工可以解决很
为实现高速无线数据传输,MIMO技术作为一种有效的手段得到了广泛的研究,并被新一代无线通信系统所采用。基于时分双工(TDD)技术的MIMO系统可以利用上下行信道的互易性,使得基
声扩散体在厅堂音质控制中有着重要的作用:能够有效的提高声场均匀度;还可以提高声场接收点的声压级;此外,还能适当的控制混响时间。因此,在现代多功能厅音质控制中有着广泛
多色组合软脉冲具有能同时激发多个感兴趣频点的优点,它不仅可以实现选择激发,也可以实现激发相位的调制。多色组合脉冲与Hadamard编解码技术相结合,可以应用在COSY、TOCSY和
低密度奇偶校验(low-density parity-check code,LDPC)码具有逼近Shannon限的性能、较低的误码平台(error floor)和线性的译码复杂度,在现代信道纠错编码领域中备受关注。随
无线Mesh网络是一种新型的多跳无线网络,它组网灵活,部署便捷,网络容量大,健壮性好,极大地满足了当今人们的应用需求。但是这种网络中信息传输具有开放性,在应用中数据被窃听
普通光源在水中照明时,由于水介质和水中微粒的吸收和散射,光能量损耗很多,而且产生严重的散射光,降低了成像质量。针对以上问题,我们提出一种新的水下目标图像探测方法——
直接序列扩频码分多址(DS-CDMA)信号在军事和民用通信中有着广泛的应用,研究DS-CDMA信号的非合作接收有重要意义。本文以非合作通信为应用背景,对DS-CDMA信号的盲解扩的关键
送走硕果累累的2010年,迎来充满希望的2011年.新的一年是“十二五”起rn步之年,也是中国铸造产业做强做大、产业升级的重要一年.rn“十一五”是我国经济社会发展极不平凡的五
全色图像与多光谱图像是关于同一目标的不同图像,对于获取地球表面土地资源与环境等方面的信息起着非常重要的作用。全色图像通常具有比多光谱图像更丰富的空间细节信息,而多光