采用帧概率变换的与文本无关说话人识别系统的实现

来源 :电声技术 | 被引量 : 0次 | 上传用户:dracula1103
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从基于GMM的与文本无关说话人识别系统的帧似然概率的统计特性出发,提出了一种对目标和非目标模型帧似然概率进行补偿变换的方法.理论推导和实验结果表明,与GMM常用的最大似然(ML)变换相比,该变换能使系统降低误识率达8.6%,因此,证明了该变换能够改善基于CMM的与文本无关说话人识别系统的识别率.
其他文献
脂联素是脂肪组织特异性分泌的一种激素蛋白,众多研究表明其具有抗动脉粥样硬化、抗炎、改善胰岛素抵抗等作用。在冠心病、胰岛素抵抗、高脂血症、2型糖尿病和肥胖等疾病及存
着重介绍胆固醇结晶栓塞症的认识过程、病因、病理、发病机制、临床表现、治疗以及预后。以对胆固醇结晶栓塞症作出一个简单的总结,加深大家对胆固醇结晶栓塞症的认识。
就基于数据库技术的留声邮件系统的设计和实现进行了探讨,并较详实地给出了Windows下基于Microsoft SQL Server的留声邮件系统设计和实现的技术要点.留声邮件系统可进行有声
替米沙坦是一种新近的、长效血管紧张素Ⅱ受体阻断剂,它选择性抑制血管紧张素Ⅱ的Ⅰ型受体有激活过氧化物酶体增殖物激活受体γ(PPARγ)的作用,从而改善胰岛素抵抗及代谢综合征中
研究了空间时频分布在宽带阵列处理中的应用.在信号时频特征可分的情况,提出一种新的时频域宽带DoA估计算法,充分利用信号不同的时频特征,结合宽带聚集思想对每个源单独处理
当前中国广播影视发展面临难得的历史机遇和严峻的挑战,数字化、网络化、产业化是当前和近一个时期广播影视发展的重中之重.2003年是中国"广播发展年",广播影视数字化将在未
针对极低速率语音通信的要求,提出了一种基于MELP(Mixed-Excitation Linear Prediction)的0.6Kb/s语音编码算法.把MELP算法中3个连续语音帧组成一个超级帧,充分利用参数的帧
乐滩水电站厂房档水坝、船闸等均为大体积混凝土结构,混凝土总量136余万立方米,要求全年快速施工,为防止有害裂缝发生,设计参照国内、区内已建工程经验,选择各主体建筑的典型剖面,
脑钠肽又称B型利钠肽,在心血管疾病的诊断、治疗及预后判断等方面具有重要价值,是临床上与心血管疾病密切相关的一项生化指标。现就脑钠肽的一些生理特性及其在心血管疾病中