说话人识别中的信道补偿

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:ijlusr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动说话人识别属于多维模式识别和智能计算机接口的范畴,其研究的根本目的是使机器能够自动辨认出说话人。当前在实验室环境下说话人识别系统取得了长足的进步,有着很好的性能。但是在实际环境中,由于存在复杂多变的噪声和信道干扰,系统性能急剧下降。因此如何有效地抑制或消除信道干扰,提升说话人识别系统的鲁棒性成为一个重要课题。信道鲁棒性问题的根源可以归结为说话人识别训练环境和测试环境之间的不匹配。一般来说,信道补偿算法可以粗略归为三方面:特征域,模型域和得分域。特征域方法主要着眼于对特征参数本身的处理和特征参数提取过程中方法的改进,使得随着环境变化特征参数变化尽可能小。模型域方法则根据信道问题来相应地调整模型,使得模型和实际环境相匹配。得分域方法主要通过各类得分规整算法来消除因信道所带来的得分差异。本文前两章首先介绍说话人识别任务,特别是文本无关的说话人确认,然后详细讨论了高斯混合–通用背景模型的基线系统。本文第三章简化了联合因子分析模型,提出了一种可同时用于特征域和模型域的信道补偿算法–本征信道,它简化了联合因子分析模型,大大降低了复杂度和运算量,使实时应用成为可能。特征域算法映射得到的特征可用于所有其他说话人系统,大大增强了算法的通用性和推广性。在NIST2006说话人评测的核心测试集上,模型域系统的等错误率相对于基线系统下降了48.4%,在某些场合可取得和联合因子分析系统相近的性能。针对NIST 2008说话人评测核心测试集需要,本文第四章实现了联合因子分析模型,并针对其对说话人空间和信道空间建模的不足,提出了一种串行估计说话人空间模型参数,并行估计信道空间模型参数的训练方法,此方法在降低原有模型训练运算量和复杂度的同时,还可以取得更优的性能。该系统的等错误率相对于基线系统下降了69.5%,在NIST 2008说话人评测中,改进的联合因子分析系统为最好的单系统。
其他文献
我国的高中思想政治课作为学生树立科学的世界观、人生观、价值观的主渠道,在培养有理想、有道德、有文化、有纪律的社会主义新型接班人方面有着不可替代的作用。但是,由于在
体育是人类社会文化生活的重要组成部分。随着经济的发展以及国际交流的日益增强,体育愈来愈引起社会的广泛关注。但是,从篇章语言学角度围绕报纸体育新闻进行全面论述的著作
<正> 黄精味甘性平,有补牌润肺生津之功。医家多作为滋养强壮药运用,常以之治疗病后请虚,或久病虚羸之候,却罕作外用治疗癣症。据现代药理实验,黄精对抗酸杆菌及致病性皮肤真
万能型钢轧机不同于板带轧机和普通的型钢轧机,结构比较复杂,它除了承受沿铅垂方向的水平辊轧制力外,还承受沿水平方向的立辊轧制力,所以轧机机座的弹性变形受两个方向因素的
RBI(Risk-based Inspection)风险检测技术是通过对设备或部件存在的潜在风险进行分析,以确定关键设备和部件的破坏机理、检查计划的一套系统方法。它可以延长设备运转的周期
文学在转型时代面临着一种新的文化语境,多元并存、众声喧哗的文学格局形成。大体说来,支撑上世纪九十年代文学写作的作家主要有两类:一是已进入中老年的"五七族"和"前知青族
导言主要介绍本文为何选择公司治理结构问题进行讨论研究,以及为何限定有限责任公司为本文的研究对象。第一章概述本章介绍了公司治理结构的概念,股东会、董事会、监事会等公
钱穆是20世纪中国最有影响的国学大师之一,是中国传统文化最坚定的拥护者和颂扬者。他注重用历史考察和哲学思维相结合的方法来研究文化,建构了自己独特的文化哲学体系。钱穆
学习型组织理论自20世纪90年代初提出以来,已被国内外数以千计的企业和非赢利性组织采用,效果显著。近年来,创建学习型组织的活动日益向政府部门延伸。本文在论述税务系统创