多声源环境下的鲁棒说话人识别

来源 :计算机系统应用 | 被引量 : 0次 | 上传用户:kfk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对多声源干扰环境下说话人识别系统性能急剧下降的问题,提出一种提取目标语音的前端处理方法,该方法依据独立语音时频域的近似稀疏性,基于目标语音方位信息采用非线性时频掩蔽方法提取目标语音.建立了基于梅尔倒谱系数(MFCC)的高斯混合模型(GMM)说话人识别系统.仿真实验证明,该方法能有效提取目标语音,提高说话人识别系统的鲁棒性.该文多声源干扰仿真实验条件下,说话人识别系统的识别率平均提高了25%左右.
其他文献
在线考试相比传统考试方式有着很多的优点,例如在线考试的成本更低,在线考试试题的即时更新性,在线考试可以更快给出应试人员的答题情况的统计分析,还可以给不同的应试人员随
针对网络控制系统中存在于传感器.控制器.执行器间的双时延问题,提出了一种基于Markov模型的状态反馈控制策略.与传统应用Markov随机过程的方式相比,该策略采用两个Markov链描述每
中文自动分词是web文本挖掘以及其它中文信息处理应用领域的基础.蓬勃发展的中文信息处理应用对分词技术提出了更高的要求.提出了一种新的分词算法FPLS,该算法用拼音首字母作
对废弃话单进行有效管理,是保障通信系统计费可靠性的重要内容之一,然而对于废弃话单数据所呈现出的实时性、突发性等特征,现有的大数据处理模式并不能很好地应对.本文采用动
基于Web日志挖掘的个性化推荐技术已在电子商务网站中广泛应用,针对现有推荐系统的准确性不高等问题,提出一种基于Web日志挖掘和相关性度量的个性化推荐系统.首先,提取用户的
基于中国科学院资源规划(Academia Resource Planning,简称ARP)项目建设,阐述针对科学院院所两级管理情况下,将服务、科研、管理信息化,集成人、财、物、项目以及多种资源共享
随着实时系统在时间关键和安全关键的行业的广泛应用,程序的时间属性受到越来越广泛的关注.Henzinger提出了LET(Logical Execution Time)编程模型,提供了明确描述时间属性的机
为了缓解高校实验教学中实验设备资源不足与社会需求大之间的矛盾,解决实验设备远程管理中存在的问题,本文在总结早期远程实验室设计方案的基础上,讨论了组态软件控制技术课
互联网用户的快速增长使得流媒体访问需求不断增加,庞大的流媒体访问需求和有限的服务器分发能力,造成了系统响应慢、用户体验下降等问题.针对以上问题,结合新媒体广播项目中