采用非参数方法建模的短时话者识别

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:kokwok
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在与文本无关的声纹识别研究中,目前性能较好而且较成熟的系统均是基于训练并在测试数据时长较长的情况下获得的,如NIST评测中的核心测试环境下训练和测试语音时长约5分钟.而在实际应用中,由于声纹识别的特殊性,用户一般都不太配合,通常很难获得足够多的训练语音数据,从而限制了经典的话者识别系统,大大降低了其性能.本文针对与实际应用直接相关的短时话者识别,提出了一种采用Parzen Window的非参数估计方法,对目标话者的短时数据进行建模,从而达到提高话者模型推广能力的目标.该方法在NIST SRE2006的短时任务10s训练,测试的实验结果与传统的GMM-UBM得分融合后,在等错误率EER下比基线系统相对降低了10.76%. In text-independent research of voiceprint recognition, currently well performing and more mature systems are based on training and are obtained with longer test data, such as training and testing of voice in the core test environment of the NIST evaluation The duration of about 5 minutes.In practical applications, because of the particularity of voiceprint recognition, users generally do not cooperate, it is usually difficult to obtain enough training voice data, thus limiting the classic speaker recognition system, greatly reducing its Performance.This paper proposes a Parzen Window-based nonparametric estimation method for short-term speaker recognition, which is directly related to the practical application, to model the short-term data of the target speaker so as to improve the promotion ability of the speaker model This method was trained on the short-term mission of NIST SRE2006 for 10 seconds, and after the experimental results were merged with the traditional GMM-UBM scores, the relative error rate EER was reduced by 10.76% compared with the baseline system.
其他文献
公司法给予隐名股东显名之诉来保护自己的权利,但在隐名出资人瑕疵出资的情况下,相关主体背负着风险。其承担责任之后,在现行法律制度下得不到完整的救济。文章意在为相关主
本试验对平湖糟蛋的理化特性及其微生物安全性进行了初步研究。结果表明平湖糟蛋中蛋白与蛋黄的水分含量分别为69.7%、29.9%;盐分分别是5.00%、3.29%。平湖糟蛋蛋白和蛋黄中
在实际工作中,政府性投资项目的实施存在先建后招的不规范情况,严重影响了项目的规范有序实施。笔者结合工作实际,分析先建后招存在的种种风险,思考怎样杜绝先建后招的情况,
在钢铁企业物流管理中应当重点做好各项工作,保障工作的顺利开展.钢铁企业中的物流管理是ERP的一个重要内容,本文将钢铁企业的物流管理作为研究的重点,详细探讨了如何建立一
流动人口是常住地与户口所在地相分离的人口,主要指到城市务工经商的农村剩余劳动力。我国流动人口的规模随着工业化和城镇化的进程逐年扩大,家庭化现象也日益明显,流动人口
耐克公司创建于1972年.起初它只是一个体育用品领域的无名小辈,但它却能后来居上,超过了曾雄踞市场的领导品牌阿迪达斯、彪马、锐步,被誉为是"近20年世界新创建的最成功的消
设计了一套脉搏血氧测量系统,采用了单色性较好的半导体激光器光源和多频率分辨技术,对测量信号进行了调制和解调,降低了外界干扰,获取了脉搏信号。针对脉搏信号,采用小波变
利用虚拟热源法研究坝基裂隙岩体中存在的集中渗漏通道。水库底部通常为低温水,而基岩温度随着深度的增加而升高,坝后温度异常区域可能存在库水渗漏。渗漏水与周围地层将进行
本文首先分析了光纤布拉格光栅传感的基本原理和布拉格光栅波长变化与环境温度和应变的相关方程,然后基于等强度悬臂梁设计了一个简单有效的消除温度影响的应变测量方法。最后
YOLO系列算法的简化版本YOLOv3-Tiny具有较为简单的网络框架,对GPU显存要求较低,该算法虽然实时性较高,却存在精度较低的问题,在识别行车目标方面不能得到精确的结果。对此,