基于改进的高斯混合模型的说话人识别的研究

来源 :长沙理工大学 | 被引量 : 0次 | 上传用户:phoebus
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该论文详细研究了基于高斯混合模型(GMM)及其改进模型的无文本说话人识别系统.该论文完成的工作有:(1).建立了一个包括30个说话人的语音库.(2).完成了语音特征MFCC的提取,讨论了提取过程中的一些问题.(3).介绍了正交高斯混合模型及其在说话人识别中的具体应用.传统的高斯混合模型(GMM)常常假定协方差矩阵为对角线矩阵,但需大量的混合成员来表征分布情况,这将会导致训练量的增加.正交高斯混合模型的主要思想是在传统的GMM之前先将特征矢量变换到由协方差矩阵的本征向量决定的空间中去,这样得到的对角线协方差矩阵可以更准确地反映分布的情况.基于正交高斯混合模型的说话人识别实验表明该算法在说话人识别方面比传统的GMM算法有更好的效果并具有良好的应用前景.(4).把进化算法应用到GMM和正交GMM的参数训练中.传统的EM算法作为一种梯度算法,获得的只是一个局部最优解,而进化计算有很强的全局搜索能力.该文引入以进化策略为主的进化方法来改进EM算法.然后用这种进化算法分别训练GMM和正交GMM.实验得出:基于进化混合算法的正交GMM说话人识别系统与基于EM算法的GMM和正交GMM说话人识别系统相比,识别率有所提高.
其他文献
对需要经常在广域网和Internet上进行大量保密数据通信的用户而言,期待着有一种低成本且性能较高的加解密解决方案.本文阐述的基于TI公司高性能DSP的加密卡正是适应这种要求
无线通信网络的发展正处于2G向3G演进的阶段,基于电路交换的无线通信系统将最终演变成以IP有线网为核心,无线网作为接入方式的全IP网络。UMTS是3G的主要标准,随着无线接入技术的
近年来我国民用航空运输业高速发展,仅仅依靠进口国外昂贵的民航空中交通管制系统已经不能满足我国民用航空发展的多方面需要;另一方面,出于安全性考虑,在应对突发事件而需要
该文主要对现有NAT穿越解决方案进行了研究和改进,并在此基础上实现了一个NAT穿越中间件系统.该文首先讨论了不同NAT穿越解决方案的差别,接着选择了其中的STUN方案进行进一步
网络技术的飞速发展,决定了流媒体市场的广阔前景。围绕流媒体技术开发与应用的问题,国内外众多技术厂商推出了许多方案。这些方案大体可分为两种,一种是低码流适合在因特网上传
随着多媒体技术和web技术的发展,包括图像、视频、音频等的多媒体信息大量涌现,对这些海量而且包含大量非结构化信息的数据如何组织、表达、管理、查询和检索就成为目前需要迫
随着集成电路设计和制造技术的不断进步,芯片的集成度和复杂度也以惊人的速度发展。芯片测试遇到了前所未有的挑战,测试费用越来越高,出现了设计、生产费用与测试费用倒挂的局面
本文所阐述的内容是在二维有障空间水下机器人动态编队的方法,分别就以下几方面的问题进行了研究和探讨: 首先是关于多机器人进行协作的体系结构的研究。论文中指出了单机器
随着信息时代的飞速发展,微博作为一种新型媒体介质出现,吸引了大量真实的优质用户。微博是一种基于用户关系的信息分享、传播以及获取的平台,具有信息发布快及传播迅速的优
流媒体是一个全新的概念,它是一个开放的还没有标准化的框架.在这个框架中,它包含用于传输数据的实时传输协议(如RTP)和用户建立会话的信令协议(如RTST/SDP协议),另外再加上