基于PLDA模型的说话人识别方法研究

来源 :厦门大学 厦门大学 | 被引量 : 0次 | 上传用户:ewenxj860411
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别技术,作为现代重要的生物信息识别技术之一,通过对说话人语音样本提取的特征参数进行建模分类,从而分辨说话人身份。目前,NIST(NationalInstitute of Standards and Technology)国际评测结果显示,基于PLDA(ProbabilisticLinear Discriminant Analysis)模型的说话人识别系统可获得突出的识别效果。然而,现实生活中,语音样本很容易受到环境噪声的干扰,有时候注册语音和待测语音的样本时长是不一致的,甚至,在某些信道较难采集到丰富的语音样本数据以供PLDA模型训练,上述这些复杂问题,在一定程度上制约了基于PLDA说话人识别系统的实际应用。因此,对基于PLDA模型的说话人识别技术进行研究是非常有意义的。  本文主要针对说话人识别系统中语音增强、时长不匹配和训练样本有限这三个问题,分别提出了有效的解决方案。本文的主要工作及创新点如下:  1、基于稀疏表示原理,提出了自适应更新字典的双稀疏语音增强方法,并且,使用与待处理带噪语音无关的干净语音经K-SVD(K-Singular ValueDecomposition)训练统一字典原子,在确保语音增强效果的前提下提高了计算效率;  2、引入语音时长调整PLDA模型分布的协方差参数,提出了基于时长约束的概率修正PLDA的说话人识别方法,提高了说话人识别系统在时长不匹配时的识别效果;  3、利用大样本信道训练得到的PLDA参数为先验值,提出PLDA参数更新的跨域迁移策略,以解决小样本信道PLDA建模的困难,并在语音样本有限的前提下提高了识别性能。  本论文的研究工作还包括一个跨信道说话人识别语音库的建设。该语音库采集了100个说话人语音样本,含有丰富的信道信息(耳麦、会议麦、录音笔、固话信道、两路移动电话信道、网络语音信道等),即,对每个说话人同步在八个信道录制相同文本内容。这个数据库的建立对进一步研究跨信道说话人识别及文本相关说话人识别系统都具有重要意义。
其他文献
家是人们生活的港湾,无论身在何处,每个人都保持着对家的挂念。拥有一个舒适的家庭环境也是每个人生活中时刻关注的话题,在这个科技迅速发展的时代,智能家居的概念从被提出就
交流压缩机广泛应用于许多家电产品中,尤其是制冷类家电如冰箱、空调等。交流变频调速在节能,降噪方面有着重要的现实意义。本文所研究并设计的交流电动机变频调速控制系统以
近年来,DSP芯片以其具有的功能强、处理速度高、性能价格比好、速度功耗比高、具有数字器件特有的稳定性、可重复性、可大规模集成、特别是可编程性和易于实现自适应处理等特
本文阐述了利用旋转载体自旋作为驱动的硅微机械陀螺。该陀螺通过载体旋转产生的哥氏力来驱动与电极板形成两对差动电容器的硅摆,由检测硅摆振幅引起差动电容的变化来检测载体
本文开展了∑-△A/D转换器的高层次行为描述的研究,探讨了一种利用硬件描述语言Verilog.AMS进行行为级建模与仿真的方法。论文首先分析了Verilog-AMS的特点,建立了∑-△A/D转换
核磁共振谱学是人类在分子水平研究物质结构的重要方式。在传统的核磁共振试验中,一次只测定一种物质的核磁共振谱,而且随着谱的维度的增加,所需时间呈倍数增长,所以如何快速测定
再引入(reintroduction)是目前濒危野生动物保护中的常用手段,也是多数物种保护项目的最终目标。2010年4月~2011年11月,在湖南桃源洞国家级自然保护区进行黄腹角雉(Tragopan C
波达方向估计(DOA)是智能天线关键技术,它直接关系到系统定位的准确性和接收信号的强弱,广泛应用在通信、雷达、声纳、生物医学等领域。  本文围绕DOA估计算法性能方面进行
神经系统的起源与演化一直是人们所关注的热点问题之一。腔肠动物是最早出现神经系统的生物,为网状神经系统,同时存在最原始的突触结构,而最早出现原始中枢神经系统的是扁形
细绿萍(Azolla filiculoides Lamk)是繁殖速度快、光合固氮能力强的水生蕨类植物,广泛地用于饲(肥)料及污水净化.该文对其生长规律、净化铅的特点以及光照条件对累绿萍除铅的