说话人识别方法及其系统的应用开发研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:khsim
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文对说话人识别方法应用作了较深入系统的研究。采用的方法分别是矢量量化(VQ)识别方法、隐马尔可夫模型(HMM)识别方法、高斯混合模型(GMM)识别方法。基于独立文本和闭集条件,在实验室环境下,对26位说话人进行语音采集和识别,识别率均为100%。在特征提取方面,分别以16阶LPC倒谱系数、12阶MEL频率倒谱系数和12阶LPC倒谱系数、基音周期与短时归一化帧能量形成的混合参数进行实验,均得到了较好的实验结果。对VQ识别中的LBG聚类算法分别以两种不同码字选择方法实现,实验结果证实它们均优于随机码字选择方法;同时改进了空包腔处理方法。对HMM,系统采用5状态、32混合数各态历经的连续模型实现,状态分割是基于归一化帧能量实现。对GMM,系统采用32混合数连续正交高斯密度函数实现,参数初始化采用LBG聚类方法实现。为提高系统的响应速度、改善系统性能,实验还对短时帧长进行比较,发现不同帧长对系统性能的影响较大。由于通常情况下短时语音处理技术认为语音帧长在10~30ms左右,文中在采样频率为11.025KHz条件下,既考虑到短时限制,又考虑到系统响应速度,取帧长为512点(约46ms)得到了较好的实验效果。该说话人系统在VC++6.0环境下用音频底层处理函数实现音频操作,能设置不同语音采样频率,对语音进行实时播放、动态波形显示和有用信号剪辑等同步处理功能。系统还支持数据库语音查询功能。虽然该系统是在闭集条件下进行独立文本的说话人识别,但是系统具有较好可扩充性,只要进行相关的实验和程序改进,即可实现开集条件下的说话人确认与辨认。
其他文献
PC注塑制品已广泛应用于各行各业。注塑制品普遍存在残余应力,注塑过程也会引起分子链取向的变化,残余应力会影响PC注塑制品的力学、光学特性。PC制品具有良好的光敏性,应力与取
随着我国综合经济实力的增长以及海洋蓝色产业的飞速发展,人们对出海的理解已经不单单停留在运输这一传统概念上。人们开始越来越多的关注大型船舶的平稳性、低噪性、以及舒
本文对智能控制光伏并网发电系统进行了研究。文章阐述了目前国内外关于太阳能发电系统中最大功率点跟踪(MPP7f)充电控制器主电路的应用现状,选择了Cuk型变换器作为MPPT充电控
随着我国的经济迅速发展和城镇化进行的不断深入,我国电梯行业取得了长足的发展,尤其在国内电梯的产量和一,二线城市的电梯保有量不断上升,随之而来的问题是越来越多的运行多
  本文主要研究了碰撞振动系统的对称型周期n-2运动及其Poincaré映射的对称性。对于单自由度双面碰撞振子,通过分析Poincaré映射的对称性,证明了不动点不存在-1的特征根。
我国由于大量燃烧高硫燃煤且缺乏烟气净化措施,导致环境污染变得越来越严重,二氧化硫和氮氧化物是大气污染的主要根源,因此急需要开发出一套适合我国国情的脱硫脱硝装置。烟气放
超精密切削是一种先进的加工技术,所涉及的力学过程处于原子尺度,离散性是其主要特征。基于连续介质力学构建的现象学模型不适合这一加工过程的描述。分子动力学是用于求解这
纤维铺层的复合材料因其优异的力学性能,被广泛应用于航天航空、深海等军工领域和民用领域,研究其可设计性可以更好的发挥结构的高强度、轻量化特性。传统直线纤维铺层的复合材
伴随人类社会的发展,传统能源的连续开采,环境污染成为一个日益严峻的问题,近年来国家加大整治环境污染的力度,人们将目光聚焦到新型、绿色、环保的可再生能源方向上。新疆作
本文从结构的动态设计要求出发,对结构动力学边界条件进行了识别,并利用结构动力学优化的理论及有关技术,通过边界条件优化来控制结构的动力学特性。 论文首先引入求解非