【摘 要】
:
该文是作者于攻读硕士学位期间在说话人识别方面所做研究工作的总结.为了有效地抽取表征说话人身份的语音特征,该文根据MFCC和基音频率各自从不同的侧面反映了说话人身份的特
论文部分内容阅读
该文是作者于攻读硕士学位期间在说话人识别方面所做研究工作的总结.为了有效地抽取表征说话人身份的语音特征,该文根据MFCC和基音频率各自从不同的侧面反映了说话人身份的特点,提出一种基于基音频率的动态MFCC特征提取方法.该文还讨论了基于高斯混合模型(GMM,Gaussian mixture model)的分类器设计问题.高斯混合模型是说话人识别系统中常用的一种分类模型.一般情况下,用GMM进行统计建模的优劣不仅取决于其参数值,还与模型结构密切相关.特别地,当训练的数据较少时,GMM模型结构的选择变得非常关键.而在实际系统中,可获得的语音数据是有限的,使用预先确定的统一结构会使部分GMM缺乏合适的结构及相应的参数,导致系统的辨识性能下降.针对上述问题,该文提出在作期望最大化估计前,通过对不同说话人的训练用特征矢量进行聚类分析,以解决有限训练数据情况下说话人GMM模型混合度选择、估计参数初始值选定等问题,获得有效的GMM模型.实验结果表明,论文中所提出的方法在实际中能够获得很好的识别性能.和基于传统的固定MFCC特征设计的说话人识别系统相比,基于说话人动态MFCC特征设计的说话人识别系统的性能有较大提高,尤其是它对噪音的鲁棒性有明显的改进.此外,相关实验也验证了该文所提出的运用聚类分析确定GMM-分类器最佳混合度方法的有效性.
其他文献
图像处理在现代社会发展中有着广泛而重要的应用,目前的图像处理系统多以图像卡的形式出现,借助微机系统高处理速度和大存储容量来完成对图像的相关处理工作。但是同时带来了体
倒立摆系统的控制研究长期以来被认为是控制理论及其应用领域里引起人们极大兴趣的问题.它是检验各种新的控制理论和方法的有效实验装置,作为一个高阶、非线性、不稳定系统,
湿地是人类最重要的环境资源之一,在提供水资源、均化洪水、调节气候、保护生物多样性等方面起着极为重要的作用,然而当前对湿地的保护工作还缺乏有效的手段和科学的方法,开展关
本文将分别对传统高斯过程回归中存在的计算量大的问题给出两种基于数据子集的近似方法;对于传统辨识过程中存在的基于模型辨识的问题给出一种基于改进高斯过程回归的无模型智
随着信息化过程的迅猛推进,企业信息化管理已经得到越来越多的关注,面对日益复杂多变的社会经济环境,企业风险管理难度也逐渐增大。如何建立高效的风险管理机制对企业风险预
21世纪的市场环境日益表现出持续多变和不可预测的特点.在这样的市场环境中,企业必须依照"双赢"的策略与伙伴企业结成各种形式的联盟才可能不断的谋求发展.制造联盟就是这样
电镀电源实际上是一种变流设备,它把电网的交流电压变成低压直流或脉冲电压,供电镀使用。电源的变换技术和控制技术对电镀电源的发展、性能以及效率的提高有着重要的作用。电镀电源经历了四代发展,包括:直流发电机组、不可控硅整流器、可控硅整流器和高频软开关逆变电源。 软开关技术巧妙利用高频变压器漏感和功率管输出结电容作为谐振元件来完成谐振过程,实现零电压或零电流,错开功率器件大电流与高电压同时出现的硬开
控制网络技术不仅将工业生产过程推向了更高的自动化水平,实现了协调控制和优化控制,而且还为与信息网络的集成,构建统一的企业管控一体化系统提供了强大的技术支撑。本文就如何
基于数字仿真的虚拟制造环境下,拟实生产过程的产品样机称虚拟样机(Virtual Prototype, VP)。虚拟样机概念设计对应于现实世界产品设计过程中的概念设计阶段。本文按照概念