基于FGMM的说话人识别算法的研究

来源 :中山大学 | 被引量 : 0次 | 上传用户:samfl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文在作者开发的一个说话人识别系统的基础上,详细介绍了说话人识别理论,包括说话人识别系统的结构,说话人识别的原理,说话人识别的方法等等.该文着重于介绍这两种混合模型,并对模糊高斯混合模型进行了深入的研究和讨论,提出了一些改进和建议.主要包括以下四个方面:①高斯混合模型和模糊高斯混合模型形式上的统一的讨论;②距离修正的改进;③模糊度参数取值的建议;④对野值样本处理的改进.并用实验检验了这些改进和建议,取得了较好的结果.该文的组织结构基本上是基于说话人识别的过程,重点介绍说话人识别系统中最重要的两个部分:特征提取部分和说话人模型部分.之后,对实际开发的说话人识别系统的设计和实现进行了粗略的介绍.最后部分是实验结果和讨论.
其他文献
JPEG2000是ISO于2000年底制定的新一代静态图像压缩编码标准,准备用于取代目前广泛使用的JPEG标准.JPEG2000与传统JPEG最大的不同,在于它放弃了JPEG所采用的以离散馀弦转换(DC
学位
该文讨论了VPN技术及应用.首先介绍了 VPN的基本概念和应用前景,VPN 的分类和框架体系.阐述了VPN的两种基本类型:VPRNN和VPLS.分析了VPRM的两种实现机制,BGP/MPLS和VR,分析了
IP地址盗用是一个普遍存在的问题,长期以来一直困扰着广大的网络管理人员。尤其是在大型企业网环境下,IP地址盗用更加频繁,同时,解决的难度也较大。IP地址盗用给网络的正常运行带
随着Internet的爆炸性发展以及计算机广泛进入家庭,新的安全问题不断出现.首先,连接到Internet上的家用计算机正快速增长.这些计算机几乎没有任何的安全保护措施,完全暴露在I
该文通过研究数据挖掘以及Web挖掘技术的思想,并结合智能Agent的知识发现模型,提出了基于Agent的分布式Web多媒体内容挖掘体系结构.研究了文档信息表示理论、中文信息处理的
该论文共分五章来进行论述.第一章对电子商务的有关方面作了简单介绍.首先介绍了什么是电子商务.接着,该章介绍了电子商务的产生和发展,着重论述了基于现代概念的电子商务的
一个好的产品的开发过程必定有合适的软件开发方法做指导,而CMM是目前最受重视的一个软件过程指导和评估方法.作为一种安全产品的研制开发,在软件开发领域还处于比较陌生的阶
该文选择追踪定位技术作为研究方向,研究了入侵源追踪定位的方法和技术,并设计了追踪定位系统DT-ITIS原型.在深入研究分析追踪定位技术的基础上,论文将现有追踪定位方式分为
离散余弦变换和小波变换的混合变换方案是该文构造的视频编码的核心.针对时域变换之后的系数分布特性作者在直流分量帧中采用了小波变换之后的SPIHT算法,不仅能够获得较高的