面向电话语音的实用说话人识别技术研究

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:jiangnannan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
化为矩阵运算、并基于线性代数的优化库、提出了一种快速计算得分的方法,在目前的测试情形下,可以大大降低矩阵运算的次数,提高了得分计算的效率。实验结果证明该建模方法不仅快速,还可以使说话人识别系统达到与PLDA建模方法相当的性能。   3.研究并实现了利用因子分析的方法进行分段聚类的系统。在真实的应用场景中,语音的情况通常会比较复杂,例如多人一起讨论。在进行说话人识别之前,需要对不同说话人的语音进行分段聚类。针对实际录制语音的情况,成功的把因子分析的方法用到说话人分段聚类中,基于此使后端说话人识别模块的性能与理想分段情况下说话人识别的性能相当。
其他文献
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
网络通信技术的飞速发展,使得以IP网络为传输媒介的实时音视频传输应用日益广泛。在专业实时音频传输方面,普遍设备成本太高,且存在仅支持单一网络通信方式、对传输地点依赖
为了保证炼油与化工MES(Manufacture Execution System)系统长期、安全、稳定运行以及系统的深入应用,本文对该系统的运行状况进行了详尽分析,阐述了集实时数据监控、Oracle
本文研究了唐鱼的若干生物学特性,结果表明:唐鱼眼大,无侧线;体型小,适应室内条件饲养;性成熟时间短,具有连续产卵特性,人工调节下可实现周年繁殖;大量繁殖中易于出现畸形.唐
遥感卫星图像在国计民生中发挥着越来越重要的作用。无论我们基于什么目的使用图像数据,首先要做的便是从卫星影像中获取有效的地物信息。但是,云层的存在给利用遥感手段获取地
声掩蔽技术是降低目标语音可懂度和保护语音私密性的必要措施之一。噪声信号在降低言语可懂度方面的效率不高,过高的噪声能量会导致烦恼度的提高。因此,针对目标语音进行干扰
人工神经网络(Artificial Neural Network, ANN)是近年来信息科学领域里的一个热门学科,它是由大量信息处理单元互联而成的一个自适应、非线性的信息处理系统。目前,人工神经
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
一、枣树的基肥施用量根据枣树树体大小、有机肥料的种类等因素来确定。一般生长结果期树每株施有机肥30~80千克;盛果期树每株施有机肥100~250千克。对于纯枣园,每667平方米
作为一种新型的传感器,矢量水听器能够同时测量声场中的声压与振速。由于能够提供更多的声场信息,矢量水听器和矢量水听器阵列的应用越来越广泛。由于矢量阵拥有更多的信息量